DeathWhispers

多模态大模型如何实现:从原理到架构的深度拆解

“多模态大模型”看起来很神奇:一边看图,一边理解问题,还能输出长文本推理。 但它的工程本质并不玄学,可以归结成一句话: 把不同模态(图像、视频、音频等)变成 LLM 能理解的 token/向量,再通过统一的解码器进行条件生成。 本文会从实现机制出发,深入拆解多模态模型的核心原理、主流架构范式和训练策略,并给出原理图和模型架构图。 1. 统一视角:多模态模型到底在做什么? 先看总流程...

AI 发展史系列导览:跟着讲解员穿越七十年智能革命

各位读者,欢迎来到“AI 发展史展馆”。 今天这篇不是某个单点技术教程,而是整个系列的“总导览”。你可以把它理解为展馆门口的大地图:先看全貌,再按兴趣进入具体展厅。 在这条时间轴里,我们会看到 AI 发展并不是线性上升,而是多次经历了: 理想高涨 工程受挫 方法突变 产业爆发 而每一轮“突变”,几乎都对应一次范式变化。 一、先看全景时间线 flowchart ...

AI 发展史大事件 01:1950 图灵测试,机器智能的起点问题

各位观众,欢迎来到 AI 历史展馆的第一展厅。 墙上写着一个看似简单的问题:机器会思考吗? 1950 年,艾伦·图灵没有直接给出哲学定义,而是换了一个更“工程化”的提问方式,这就是后来著名的图灵测试。 一、历史背景:为什么这个问题在 1950 年出现? 二战后的计算机刚刚展现出强大算力,很多人开始相信机器不仅能算数,也可能参与推理和语言处理。 但“思考”这个词过于抽象,容易陷入空谈...

AI 发展史大事件 03:1969 感知机之争与第一次 AI 冬天

欢迎来到第三展厅。这里的主角不是一次“胜利”,而是一次“降温”。 很多新读者会问:AI 为什么会有“冬天”? 答案之一,就藏在 1969 年关于感知机的那场争论中。 一、背景:早期神经网络为何被寄予厚望? 1950-1960 年代,感知机(Perceptron)被看作“机器学习智能”的希望。 它的特点是: 结构简单 能从样本中学习分类边界 不依赖大量手工规则 在...

AI 发展史大事件 05:1997 Deep Blue 击败卡斯帕罗夫

欢迎来到第五展厅。这里有一张历史照片:1997 年,IBM Deep Blue 战胜国际象棋世界冠军加里·卡斯帕罗夫。 这是 AI 首次在全球关注的智力竞技中,正面击败顶尖人类选手。 一、为什么“下棋”在 AI 历史里意义特殊? 国际象棋长期被当作“理性思维”的象征。 所以当机器在棋盘上获胜,公众会自然联想到: 机器是否已经具备了某种“超越人类”的智能? 尽管这个推论并不...

AI 发展史大事件 02:1956 达特茅斯会议,人工智能学科诞生

欢迎来到第二展厅,这里陈列着一份很短却极其重要的研究提案。 1955 年,麦卡锡等人提交了著名提案,计划在 1956 年夏天于达特茅斯学院组织一次研讨会。提案首次系统使用了“Artificial Intelligence”这个名字。 一、为什么这次会议是“学科诞生”而不只是“学术活动”? 在达特茅斯之前,相关研究分散在数学、控制论、逻辑学、心理学和计算机科学中。 达特茅斯会议做了三件...

AI 发展史大事件 09:2022 ChatGPT 出圈,生成式 AI 全面产业化

欢迎来到第九展厅,也是当前系列时间线的最后一站。 2022 年 11 月,ChatGPT 发布后,AI 进入了一个全新的公共阶段: 不再只是研究论文和企业内部工具 而是全民可直接交互的产品形态 一、为什么是 ChatGPT,而不是更早的模型“破圈”? 在 ChatGPT 之前,大模型能力已经快速上升,但普通用户门槛仍高: 使用方式不友好 产品体验不连续 反...

AI 发展史大事件 04:1986 反向传播复兴,神经网络重获生命

欢迎来到第四展厅。这里是一场“方法论复活”。 如果说前一展厅讲的是“神经网络为何降温”,这一展厅讲的就是“神经网络如何重新站起来”。 一、关键问题:多层网络怎么训练? 早期研究者已经知道多层网络更强,但一直有个难点: 输出误差如何有效传回前面每一层参数? 1986 年,Rumelhart、Hinton、Williams 的工作系统化展示了反向传播(Backpropagati...

AI 发展史大事件 07:2016 AlphaGo 时刻,AI 进入大众视野

欢迎来到第七展厅。这里播放着那场全球直播:2016 年 AlphaGo 对战李世石。 这场比赛的意义,远超“围棋胜负”。 一、为什么围棋比国际象棋更难? 在当时的主流认知中,围棋的搜索空间远高于国际象棋,传统穷举搜索难以直接奏效。 所以在很多人看来,围棋是“人类直觉”的最后堡垒之一。 二、AlphaGo 的方法组合 AlphaGo 的核心并非单一算法,而是系统组合: 深度...