摘要:近日,在国家图书馆举办“相信阅读的力量——第二十届文津图书发布暨国家图书馆4.23世界读书日特别活动”上,我社出版的《计算机教授白话人工智能》(钱振兴 著)荣获第二十届“文津图书奖”提名奖。
近日,在国家图书馆举办“相信阅读的力量——第二十届文津图书发布暨国家图书馆4.23世界读书日特别活动”上,我社出版的《计算机教授白话人工智能》(钱振兴 著)荣获第二十届“文津图书奖”提名奖。
AI是如何"思考"的?
未来它将如何重塑世界?
复旦大学计算机学院钱振兴教授继《计算机教授给孩子讲历史》后,再次用生动有趣的语言,为大众打造的这本零门槛的AI科普读物——《计算机教授白话人工智能》。
比科幻更有趣的AI科普!这本获奖书把把机器学习翻译成"人话",文科生也不怕!
想要跟上AI时代的步伐?就从这本书开始吧!
01 什么是人工智能?
最近几年,人工智能(Artificial Intelligence,简称AI)火遍全世界。那么,什么是人工智能?这个问题我们需要探讨一下。
“人工”,顾名思义,是人创造出来的。那“智能”又是什么?从字面上看,“智能”应该包含了“智力”和“能力”两重含义,智力是认识世界的本领,能力则是开展各种活动的本领。因此我们可以简单地说,“人工智能”是人类创造的智能体(机器或程序),用于模拟人类的智能。
现在,几乎大家能想到的各种应用场景,都已发展出了相应的人工智能技术。比如知识问答、写文章、绘画、拍电影、创作音乐、翻译、编程、自动驾驶、医疗辅助、安防监控、智慧农业等。这样的人造智能体很多,人工智能的概念远比大家想象的宽泛。
名震天下的大语言模型ChatGPT(Chat Generative Pre-trained Transformer)是人工智能吗?是的。你可以和ChatGPT对话,让它写出一段条理清晰的文字,或者一首隽永的诗歌,甚至可以让它作出一篇高考满分作文。
智能手表是人工智能吗?是的,它可以监测用户的心率、血氧、运动轨迹、睡眠质量等数据,自动分析人体的健康状况,随时为人们提供服务,部分具备了医生的能力。甚至一个简单的智能红外线报警器,也可以算是一种人工智能,它可以精准地感应到人的存在。
世界上还有很多并非人类制造的智能体。比如,蜜蜂能够采集花粉和酿造蜂蜜,植物能够根据阳光调整叶子的方向,蚂蚁能够有组织地进行食物采集,猎犬可以帮助猎人追踪、搜寻猎物,等等。这些“智能”不是靠“人工”实现的,是通过神经系统和生物结构来实现的,因而被称为“生物智能”。
人工智能和生物智能有显著的区别。生物智能是基于自身的神经系统实现的智能,根据周围的环境变化进行认知和动作,需要大量的生物能量。人工智能则是使用计算机系统实现的智能,依赖硬件和软件,从数据学习中找出解决问题的方法,这个过程需要电力提供能量。由于生物智能依赖于碳水化合物,因而它又被称为“碳基”智能;而人工智能依赖于计算机芯片(主要成分是硅),因而它又被称为“硅基”智能。
目前,人工智能已经对我们人类社会的多种活动产生了重要影响。人工智能可以自动完成许多烦琐的任务,解放了人的脑力和体力。比如,智能机器人、智能家居等应用,可以提高人们的生活质量;智能交通、智能城市等应用,可以让城市管理变得更加高效,可以更有效地改善城市环境;人工智能强大的计算能力和数据处理能力,在医疗诊断、金融风险评估等领域也发挥着重要作用。在图像内容识别、自然语言处理等领域中,很多人工智能已经展示出超越人类的能力。
然而,现有的人工智能技术还不具备通用性,无法在所有领域都实现人的智能。在逻辑推理、数学计算等方面,人工智能容易受到各方面的干扰,无法完美地处理异常或错误。
人工智能的发展还带来了一系列挑战和问题。例如,人工智能系统在学习过程中需要使用大量数据,这可能侵犯用户隐私或用户权益;人工智能技术也有可能被用于网络攻击、黑客行为等非法活动;人工智能算法的决策过程,可能还存在严重的错误或偏见。如何避免人工智能带来的负面影响,是全世界重点关注的问题。
总的看来,人工智能的意义在于,它可以解放人类的脑力和体力,推动社会的进步。当然,我们也要关注并解决它在发展过程中出现的问题,让它更好地为人类服务。
02 机器是怎么学习的?
机器学习是人工智能的分支,也是当前人工智能的主流。它让计算机从数据中学习规律或方法,从而具备预测或判决的能力。
比如,我们想预测明天的天气情况,可以搜集以往的天气状况,让机器分析一下天气变化的趋势,得出明天最有可能出现的天气。
再比如,我们希望机器能够自动识别猫和狗,可以预先准备很多猫和狗的图片,分别给它们贴上猫或狗的标签,让机器去学习两种动物的差别,当完成学习后,机器就可以形成自动识别猫和狗的本领,以后再给它猫和狗的新图片,它就能正确区分猫和狗。想一想,人类似乎就是这样学习本领的!
在机器学习中,最常见的方法可以分为三个阶段。人们先给机器很多例子(学习资料),让机器逐步调整自己的参数,提高识别的准确性至最优。然后,拿一些新例子去测试(考试),看看机器学得怎么样。只有通过测试的模型,才会被拿出来给人使用。
机器学习的方法分很多种,最常见的是下面三种:监督学习(Supervised Learning)、无监督学习(Unsupervised Learning)、强化学习(Reinforcement Learning)。
监督学习,指在机器学习的过程中,不仅提供问题,还提供标准答案,机器通过参考答案来理解问题。当机器完成学习之后,用考题来检查它学习得怎么样。常见的监督学习算法有回归、分类等。
无监督学习,就没有那么好的条件了,在机器学习的过程中,只提供问题,不提供答案,机器需要自己去找答案,尝试找出数据中的一些规律或者把相似的东西归类,常见的无监督学习算法有聚类等。
强化学习,就是让机器通过各种尝试来寻找答案,每次尝试后都会得到反馈分数,机器根据得分来调整下一步的行为,这种方法在智能下棋的游戏中很常见。
大家可能会有一个疑问,如何评价一个机器学习出来的模型好不好呢?判断的方法多种多样,这里介绍三种。
首先,一般我们要在应用中观察机器学习模型输出结果的“准确性”(Accuracy),可以直接将模型输出的结果与真实结果作比较,也可以将模型输出的结果与人类给出的结果作比较,计算模型输出的准确率。
其次,我们要考察模型的“泛化性”(Generalization),观察模型在不同的数据集上输出的准确性。举个例子,机器如果用上海的中学教材来学习,用上海的中学试卷考试可以得高分,那么用江苏的中学试卷来考试能不能考好呢?这考验的就是模型的泛化性,也就是应用的普适性。
再次,对于使用人工智能生成内容的大模型来说,我们还期望模型能够产生“涌现能力”(Emergence),这既可以认为是机器学习能够实现“量变引起质变”,也可以认为是合成意想不到的内容,如同人类大脑的灵感迸发。
03 它如何理解人类语言?
语言是人类最重要的交流工具,我们可以用语言进行各种沟通和交流,表达自己的想法、需求和情感,分享各种知识和经验,等等。自然而然,人们会问一个问题:机器能否理解人类的语言?
在机器学习中,自然语言处理(Natural Language Processing,简称NLP)试图解决的就是这个问题,这个研究方向探讨和人类语言相关的各种机器学习手段。
让我们回忆一下,咱们小时候是如何学习语言文字的呢?是从学习拼音开始的,再由汉字到词语,然后是语句和文章。也就是说,在能够看懂文章或写出文章之前,我们必须要有足够的词语储备,要理解它们的含义和用法。
对计算机来说,学习语言的过程也是如此。在机器学习中,大家把句子中的基本单元称为词元(token),中文的词元是汉字,英文的词元是单词。计算机首先需要构建包括大量词元的词汇表,然后才能学习语句。由于计算机只能理解数据,因而词汇表中的每个词元实际上是用一串数字来表示的,这串数字被称为“词向量”。
一个好的词向量应该有这样的规律:含义相近的单词对应的词向量是相似的。例如,如果我们把单词在平面上用点标出来,你会发现“跑”和“跳”挨得很近,它们都表示动作;“狗”“猫”和“兔子”挨得很近,它们都是动物;“树”“草”和“花”挨得很近,它们都是植物。经过很多年的研究,词向量的生成已经有了不少专门的算法。
构建完词汇表后,就可以开始训练计算机理解自然语言了。和人类理解自然语言的顺序相同,计算机通常也会按照文本的顺序进行理解。循环神经网络是一种具有代表性的自然语言处理方法,它通过深度学习网络逐一理解词汇的意思。它是一种特殊的神经网络,具备一定的记忆能力,可以记住前面处理过的信息,并在需要时加以利用。
循环神经网络也是通过梯度下降算法来进行参数学习的,随时间反向传播误差,按照时间的逆序将误差一步步地往前传递。循环神经网络在处理长序列时存在不足,无法有效地传递长序列中信息前后的关联。后来,研究人员又提出了长短时记忆网络(Long Short—Term Memory,简称LSTM)、转换器等多种神经网络模型,这些模型可以有选择地记住或忘记信息,能够保持长序列中的重要信息,因而可以获得更好的理解能力。
作者简介
钱振兴,复旦大学计算机科学技术学院教授、博士生导师。担任复旦大学文化与旅游部重点实验室副主任,以及多个国际著名学术期刊编委。获得上海市自然科学奖一等奖、上海市科技进步奖二等奖等奖项,中国图象图形学学会“科普先进工作者”称号。编著《计算机教授给孩子讲历史》《多媒体与人工智能安全极简综述》等图书。
来源:复旦大学出版社一点号