AI 发展史大事件 07:2016 AlphaGo 时刻,AI 进入大众视野
AI 发展史大事件 07:2016 AlphaGo 时刻,AI 进入大众视野
欢迎来到第七展厅。这里播放着那场全球直播:2016 年 AlphaGo 对战李世石。
这场比赛的意义,远超“围棋胜负”。
一、为什么围棋比国际象棋更难?
在当时的主流认知中,围棋的搜索空间远高于国际象棋,传统穷举搜索难以直接奏效。
所以在很多人看来,围棋是“人类直觉”的最后堡垒之一。
二、AlphaGo 的方法组合
AlphaGo 的核心并非单一算法,而是系统组合:
- 深度神经网络(策略网络 + 价值网络)
- 蒙特卡洛树搜索(MCTS)
- 监督学习 + 强化学习
它让“学习到的策略”与“搜索推演能力”深度耦合,形成了可扩展的决策体系。
三、为什么这是社会级事件?
AlphaGo 的影响有三个层面:
- 公众层:AI 从“抽象概念”变成可见事实。
- 产业层:企业对 AI 投入进入新阶段。
- 学术层:强化学习与深度学习融合路线被全面验证。
它不只是赢了一盘棋,而是重构了社会对“机器能力上限”的认知。
四、AlphaGo 留下的长期方法论
从技术史看,AlphaGo 给后来系统(包括大模型与智能体)留下了重要启示:
- 复杂任务常常需要“学习 + 搜索 + 规划”组合。
- 数据驱动和规则推演不是对立关系,可以协同。
- 高质量反馈机制(胜负结果、奖励信号)决定系统进化速度。
五、讲解员总结
第七展厅的关键词是“破圈”。
AlphaGo 让 AI 第一次成为全球范围的公共事件,它对后续人才、资本、政策和产业链的推动非常直接。
下一站,我们进入第八展厅:2017 年 Transformer。这里将出现决定大模型时代的核心架构。
参考资料
- Silver et al. Mastering the game of Go with deep neural networks and tree search (Nature, 2016)
- Silver et al. Mastering the game of Go without human knowledge (Nature, 2017)
- Sutton, Barto. Reinforcement Learning: An Introduction
本文由作者按照 CC BY 4.0 进行授权