文章

AI 发展史大事件 07:2016 AlphaGo 时刻,AI 进入大众视野

AI 发展史大事件 07:2016 AlphaGo 时刻,AI 进入大众视野

欢迎来到第七展厅。这里播放着那场全球直播:2016 年 AlphaGo 对战李世石。

这场比赛的意义,远超“围棋胜负”。

一、为什么围棋比国际象棋更难?

在当时的主流认知中,围棋的搜索空间远高于国际象棋,传统穷举搜索难以直接奏效。

所以在很多人看来,围棋是“人类直觉”的最后堡垒之一。

二、AlphaGo 的方法组合

AlphaGo 的核心并非单一算法,而是系统组合:

  • 深度神经网络(策略网络 + 价值网络)
  • 蒙特卡洛树搜索(MCTS)
  • 监督学习 + 强化学习

它让“学习到的策略”与“搜索推演能力”深度耦合,形成了可扩展的决策体系。

三、为什么这是社会级事件?

AlphaGo 的影响有三个层面:

  1. 公众层:AI 从“抽象概念”变成可见事实。
  2. 产业层:企业对 AI 投入进入新阶段。
  3. 学术层:强化学习与深度学习融合路线被全面验证。

它不只是赢了一盘棋,而是重构了社会对“机器能力上限”的认知。

四、AlphaGo 留下的长期方法论

从技术史看,AlphaGo 给后来系统(包括大模型与智能体)留下了重要启示:

  • 复杂任务常常需要“学习 + 搜索 + 规划”组合。
  • 数据驱动和规则推演不是对立关系,可以协同。
  • 高质量反馈机制(胜负结果、奖励信号)决定系统进化速度。

五、讲解员总结

第七展厅的关键词是“破圈”。

AlphaGo 让 AI 第一次成为全球范围的公共事件,它对后续人才、资本、政策和产业链的推动非常直接。

下一站,我们进入第八展厅:2017 年 Transformer。这里将出现决定大模型时代的核心架构。

参考资料

  1. Silver et al. Mastering the game of Go with deep neural networks and tree search (Nature, 2016)
  2. Silver et al. Mastering the game of Go without human knowledge (Nature, 2017)
  3. Sutton, Barto. Reinforcement Learning: An Introduction
本文由作者按照 CC BY 4.0 进行授权