posts / 科学

人工智能历史全解析:从图灵到深度学习

phoue

2 min read --

这篇文章带我们回顾了人工智能波澜壮阔的历史。我们将一起了解人工智能的诞生背景、理论基础,两次“人工智能寒冬”的起因及克服过程,以及深度学习革命如何改变了我们的生活和产业。

“机器能思考吗?"——人工智能历史的开端

人工智能的历史,始于1950年,英国天才数学家艾伦·图灵提出的一个深刻问题:“机器能思考吗?”(Can machines think?)。这个问题不仅引发了对技术可能性的探讨,更激发了对**“智能本质”的哲学思考**。它如同灯塔,指引了人工智能研究未来几十年的方向。图灵并没有纠结于“思考”这个模糊的概念,而是提出了一种实用的测试方法——“图灵测试”(Turing Test),用来判断机器是否能表现出与人类相似的智能行为。

艾伦·图灵与图灵测试的概念图
艾伦·图灵与图灵测试的概念图

图灵测试的核心在于功能主义的视角,即关注智能的“功能”。它的意思是,如果一个机器在文本交流中,无法被人类审问者区分出来,那么就可以认为它拥有智能。这种视角上的转变,将智能从大脑硬件中解放出来,重新定义为信息处理的软件问题。这为计算机科学家们攻克智能实现的目标,奠定了理论基础。

本文将从图灵的提问开始,追溯到1956年达特茅斯会议的热烈讨论,历经两次严酷的“人工智能寒冬”,再到深度学习革命如何渗透到我们日常生活中,直至大语言模型(LLM)时代来临之前的人工智能历史。


第一章:人工智能历史的开端:诞生与黎明期(1940-1950年代)

1.1. 理论基础:控制论与早期神经网络

在“人工智能”这个词出现之前,人们发现大脑是由称为**“神经元”(neuron)**的神经细胞构成的庞大电信号网络。这启发了“能否用机器模仿大脑?”的想法。

这个想法与诺伯特·维纳的“控制论”以及克劳德·香农的信息论相结合,逐渐变得具体。

人工神经元的基本模型
人工神经元的基本模型

1943年,沃伦·麦卡洛克和沃尔特·皮茨发表了首个**“人工神经元”概念,用数学模型描述了大脑神经元。这个模型结构简单,能接收多个输入,当输入总和超过某个阈值时就会输出信号。它证明了可以实现简单的逻辑运算(AND、OR、NOT)。这是后来人工智能神经网络技术的理论基石**。

1951年,马文·明斯基制造了首个神经网络机器**“SNARC”**,这一理论在实践中得到了初步验证。

1.2. 1956年达特茅斯会议:“人工智能”的正式诞生

1956年夏天,在美国达特茅斯学院举办的一次历史性研讨会,将当时分散的“思考机器”研究整合为一个独立的学术领域。

年轻的数学家约翰·麦卡锡提出了**“人工智能”(Artificial Intelligence)**这一新术语。他基于“任何学习或智能的特征都可以被机器模拟”这一大胆假设,确立了该领域的研究方向和身份。

参会的艾伦·纽厄尔和赫伯特·西蒙等人,对AI的未来充满乐观,认为十年内计算机就能战胜国际象棋冠军。虽然他们的预测过于乐观,但达特茅斯会议的激情,成功推动了人工智能作为一个独立学科的诞生。

1.3. 初期成功与两种方法

早期的人工智能研究者在规则明确的“封闭世界”中取得了成功,例如游戏和逻辑推理。亚瑟·塞缪尔的跳棋程序通过自我学习提升棋力,展现了**“机器学习”**的早期概念。

1956年,艾伦·纽厄尔和赫伯特·西蒙发布的**“逻辑理论家”(Logic Theorist)**程序,是最具影响力的早期成果之一。该程序证明了52条数学定理中的38条,其中一些证明方法比人类的还要优雅。

这些成功展示了AI的两种主要研究方向:

  1. 模仿大脑结构的**“联结主义(Connectionism)”**(自下而上)
  2. 将人类逻辑建模为符号和规则的**“符号主义(Symbolism)”**(自上而下)

当时,由于“逻辑理论家”的突出成就,人工智能研究的重心明显倾向于符号主义。


第二章:符号主义的兴起与第一次AI寒冬(1960-1980年代初)

2.1. 符号主义AI的时代(GOFAI)

1960年代到1970年代,“良好老式人工智能(Good Old-Fashioned AI, GOFAI)”,也就是符号主义AI,是主流。这种方法是“自上而下”的:将人类专家的知识,用计算机能理解的符号和规则明确地编程进去。

这种方法最大的优点是,可以清晰地追踪推理过程,即**“可解释性”**。我将符号主义AI比作“课本天才”,它在既定公式和规则内能做到完美,但在面对现实世界模糊、不可预测的问题时,就容易束手无策。

2.2. 专家系统:知识的商业化

符号主义AI在特定领域的知识实现上获得了商业成功,这便是**“专家系统(Expert System)”**。例如,在医疗诊断和矿产勘探等领域。

专家系统的基本结构
专家系统的基本结构

专家系统由“知识库”和“推理引擎”组成,使用“如果-那么(IF-THEN)”形式的规则来解决问题。这表明AI技术能够创造实际的经济价值,并吸引了大量投资。

2.3. 局限性与第一次“AI寒冬”

然而,到了1970年代中期,美好的前景遭遇了冰冷的现实,“第一次AI寒冬(AI Winter)”(约1974-1980年)降临。

  • 组合爆炸: 现实世界的问题变量太多,当时的计算机计算能力难以应对。
  • 知识获取瓶颈: 将专家的知识和海量的“常识”逐一转化为代码,几乎是不可能的任务,而且对突发情况非常脆弱。
  • 对联结主义的批评: 1969年,马文·明斯基的著作《感知器》证明了简单的神经网络无法解决XOR等基础逻辑问题,导致神经网络研究资金枯竭。

由于这些局限性,AI研究的资金大幅削减,人工智能领域进入了漫长的低谷期。


对比:符号主义 vs 联结主义 AI

理解这两种方法的区别,是把握人工智能历史的关键。

特性 符号主义AI (Symbolic AI) 联结主义AI (Connectionist AI)
核心理念 智能源于符号和规则的操作。 智能涌现于简单的处理单元相互连接的网络。
方法 自上而下:显式编程人类知识。 自下而上:从数据中学习模式,自行构建知识。
知识表示 以显式规则、事实和逻辑关系表示(如知识库)。 以网络中神经元连接的强度(权重)隐式表示。
学习方式 主要依赖逻辑推理和搜索算法,学习能力有限。 关键在于通过大量数据进行统计学习(训练)(如反向传播)。
主要技术 专家系统、逻辑编程、搜索算法 人工神经网络(ANN)、感知器、深度学习
优点 - 结果易于解释(Explainable)。
- 擅长规则明确的问题。
- 能从数据中自主学习。
- 对有噪声或不完整的数据鲁棒性强(Robust)。
缺点 - 易受现实世界模糊性和不确定性影响(Brittle)。
- 存在知识获取瓶颈。
- 对新情况的灵活性不足。
- 难以理解其工作原理(Black Box)。
- 需要大量训练数据。
- 训练过程计算量大。
历史案例 逻辑理论家(Logic Theorist)、专家系统(MYCIN等)、深蓝(Deep Blue) 感知器(Perceptron)、SNARC、AlphaGo(阿尔法狗)

第三章:联结主义的复兴与第二次AI寒冬(1980-2000年代初)

3.1. 反向传播算法与多层神经网络

在第一次AI寒冬中,少数研究者依然坚守着联结主义的火种。到了1980年代中期,神经网络复兴的关键突破——**“误差反向传播(Backpropagation)算法”**开始流行。

反向传播算法通过将神经网络预测值与正确值之间的误差反向传播,来微调连接的权重。这项算法使得训练包含多个“隐藏层(hidden layer)”的多层神经网络成为可能,联结主义也因此重新成为AI研究的焦点。

1989年,扬·勒昆开发的这套手写邮政编码识别系统,证明了基于反向传播的深度神经网络在实际工业应用中的价值,这是一个里程碑式的成就。

3.2. 深蓝大战卡斯帕罗夫:机器智能的里程碑

1997年,符号主义AI再次引起了公众的广泛关注。IBM的国际象棋超级计算机**“深蓝(Deep Blue)”**战胜了世界冠军加里·卡斯帕罗夫。

国际象棋冠军加里·卡斯帕罗夫与深蓝的对决
国际象棋冠军加里·卡斯帕罗夫与深蓝的对决

深蓝的胜利,源于其超强的**“计算能力”,每秒能够计算2亿个棋步,通过暴力搜索穷尽所有可能的局面。这与其说是“智能”的胜利,不如说是“计算能力”的胜利**。但它再次向公众展示了AI的潜力。

3.3. 再度来临的第二次“AI寒冬”

尽管看到了复苏的希望,但在1980年代末至2000年代初,AI领域却再次陷入了**“第二次AI寒冬”**。

  • 商业化失败: 备受期待的专家系统在解决现实问题时显得力不从心,相关市场崩溃。
  • 技术瓶颈: 当时的计算能力不足以利用反向传播算法有效训练更深的神经网络。并且,网络层数越深,就越容易出现“梯度消失问题(Vanishing Gradient Problem)”,这是一个严重的难题。

这些限制导致研究资金再次枯竭,AI领域陷入了“引擎(算法)强大,但燃料(数据)和车身(计算力)不足”的漫长低谷。


第四章:深度学习革命:AI成为主流(2000年代中期至今)

4.1. 深度学习革命的三大催化剂

经历了两次寒冬后,到了2000年代中期,三个关键因素汇聚,点燃了AI的春天。

深度学习革命的三大要素:算法、数据、计算力
深度学习革命的三大要素:算法、数据、计算力

  1. 大数据(Big Data): 互联网普及带来了前所未有的海量数据。特别是包含1400万张以上图片的“ImageNet”数据集,起到了决定性作用。
  2. GPU(图形处理器)计算: 为游戏图形而开发的GPU的并行处理能力,被发现对神经网络训练极为高效。这使得用较低成本训练深度神经网络成为可能。
  3. 算法的进步: 2006年,杰弗里·辛顿等人提出了缓解神经网络“梯度消失问题”的方法。这使得训练几十层深的神经网络成为现实,**“深度学习(Deep Learning)”**时代由此正式开启。

4.2. 关键时刻:ImageNet 竞赛与语音识别

深度学习的潜力在 2012 年的“ImageNet 大规模视觉识别挑战赛 (ILSVRC)”上得到了证明。杰弗里·辛顿教授团队开发的 “AlexNet” 以压倒性的性能获胜,标志着深度学习时代的到来。2015 年,深度学习模型在图像识别上的错误率终于超过了人类水平(约 5%)。

与此同时,在语音识别领域,深度学习技术也大幅降低了错误率,使智能手机语音助手和自动翻译服务的性能飞跃式提升。

4.3. AlphaGo 冲击:新维度的智能

深度学习革命的高潮出现在 2016 年 3 月,谷歌 DeepMind 的 “AlphaGo” 以 4 胜 1 负的成绩击败了世界顶尖围棋棋手李世石九段。

历史性的对局,李世石九段与 AlphaGo
历史性的对局,李世石九段与 AlphaGo

如果说“深蓝”的胜利展示了“计算的力量”,那么 AlphaGo 的胜利则带来了更大的冲击。在对弈的可能局面比宇宙中的原子还多($10^{360}$)而无法进行穷举搜索的围棋领域,AlphaGo 通过深度学习和强化学习,实现了类似人类“直觉”的领域。

AlphaGo 下出了人类棋谱中没有的创意招数,表明它不仅能模仿人类,还能“创造”新的知识。AlphaGo 冲击是一个标志性事件,它证明了深度学习在复杂的战略思维和创造性问题解决方面也同样强大。

***

第五章:渗透我们生活的 AI:日常与产业的变化

深度学习革命后,AI 走出了实验室,开始从根本上改变我们日常生活和产业的面貌。

5.1. 日常中的 AI:看不见的智能

在我们每天体验到的便利背后,都有深度学习算法的身影。

内容推荐、语音助手等日常 AI 服务
内容推荐、语音助手等日常 AI 服务

  • 内容推荐系统: YouTube、Netflix 利用 AI 分析用户偏好,并个性化推荐他们可能喜欢的内容。
  • 个人助手与智能家居: 苹果 Siri、谷歌助手等 AI 语音助手通过自然语言处理技术理解我们的指令,并执行各种任务。
  • 图像识别与处理: 智能手机摄像头能自动识别场景并优化设置,相机应用能识别人脸并应用有趣的 AR 滤镜。

5.2. 产业现场的 AI:效率新高度

  • 制造业: 在“智能工厂”中,AI 能够提前预测设备故障,并通过视觉系统自动检测微小缺陷。
  • 金融业: AI 聊天机器人提供 24 小时客户咨询,**“机器人顾问”**管理资产,并预防金融欺诈。
  • 医疗保健: 深度学习模型能在医学影像中找到微小的癌细胞,帮助医生进行早期诊断。

5.3. 自动驾驶技术:改变出行方式

自动驾驶汽车是 AI 技术的结晶。它融合了车辆各种传感器的数据,以 3D 形式识别周围环境,并利用基于深度学习的计算机视觉技术识别其他车辆、行人、交通信号灯,并预测其移动。

自动驾驶汽车的环境感知系统
自动驾驶汽车的环境感知系统

基于这些识别到的信息,AI 会规划和控制行驶路径,做出安全的驾驶决策。虽然完全自动驾驶仍有距离,但 AI 已经以车道保持辅助等高级驾驶辅助系统(ADAS)的形式来到我们身边。

这些面向消费者的 AI 服务既是 AI 技术的“成果”,又是训练下一代 AI 的海量数据来源,形成了巨大的**“数据引擎”**和良性循环。

***

结论:过去向未来提出的问题

人工智能的历史始于图灵的提问,经历了两次艰难的“AI 寒冬”,并在大数据和 GPU 的基础上,通过深度学习革命成为了我们生活的一部分。

回顾在 LLM 时代到来之前,AI 走过的道路,我们可以发现几个关键点。

  1. AI 的发展是循环的。 在符号主义和连接主义的张力关系中,AI 在过度期望(繁荣)和深刻失望(寒冬)之间反复交替,并不断发展。
  2. 创新是融合的结果。 深度学习革命不仅仅是某一个算法的功劳,而是大数据、计算能力和算法改进三者完美结合的产物。
  3. 过去的问题依然存在。 数据偏见、隐私、**“黑箱”**问题、就业替代等过去提出的伦理和社会挑战,在今天变得更加重要。

回顾人工智能的过去,是理解当前 LLM 革命并明智应对未来变化的必经之路。“如何将机器智能与人类的价值观和目标对齐(align)”这个几十年前的问题,至今仍然是我们时代最重要的课题。

基于这些过去的经验教训,我们如何才能将 LLM 这一强大工具用于造福人类呢?欢迎在评论区分享你的想法。

参考资料
  • 简要回顾人工智能历史 Brunch
  • 第 17 集 人工智能技术,通过达特茅斯会议崭露头角 Brunch
  • 人工智能 维基百科
  • Dartmouth Workshop(O), Conference(X) (1) - 偶然的人工智能 Tistory
  • [全载南的 AI Story] 达特茅斯学术会议 岭南日报
  • 人工智能的历史 Tistory
  • 符号主义 AI 나무위키
  • AI 寒冬:过度期望和失望造就的创新周期 Contents Tailor
  • [AI 历史] 人工智能的第二次寒冬与兴盛期 第 5 章 Eunkwangº
  • AI 寒冬 维基百科
  • 思考的机器 AI…“人工智能”一词诞生于美国达特茅斯会议 AI Life
  • 人工智能的重要事件,深蓝的国际象棋胜利 Neo Platform
  • 一览人工智能(AI)技术史 工程师爸爸
  • 人工智能的伦理问题与社会责任 Codeit
#人工智能历史#ai历史#深度学习#图灵测试#AlphaGo#符号主义#连接主义

Recommended for You

谷歌“倒闭”新闻是假象:AI大战的三件秘密武器

谷歌“倒闭”新闻是假象:AI大战的三件秘密武器

1 min read
在AI耗尽地球电力之前,我们为何必须走向太空

在AI耗尽地球电力之前,我们为何必须走向太空

4 min read
混沌理论:蝴蝶效应改变你人生的真正原因

混沌理论:蝴蝶效应改变你人生的真正原因

2 min read

Advertisement

评论