DeathWhispers

白话DeepSeek04-从矩阵到 CNN

全文总结于 Bilibili UP 主飞天闪客的一小时到 Transformer 系列视频! 矩阵表示、卷积与 CNN:从“密集连接”到“局部共享”的直观演绎 本篇目标: 一、回到矩阵表示:把复杂式子变得简洁且可并行 当网络刚开始只有少量节点时,我们可以直接用元素级公式写出每个神经元的输出。但随着层数和每层节点数增长,逐个写式子既繁琐又不利于数学推导与实现。用矩阵把这些运算...

白话DeepSeek03-调教神经网络的方法

全文总结于 Bilibili UP 主飞天闪客的一小时到 Transformer 系列视频! 🧠 神经网络训练中的问题与解决方法 ——从过拟合到正则化的全面解析 “训练一个模型不难,难的是让它在没见过的数据上依然聪明。” 🌱 一、从成功到困惑:模型为何“记住”了数据? 假设我们用数千张图片训练了一个神经网络,训练损失迅速下降,准确率高得惊人。 然而,当我们在新图片上测试...

白话DeepSeek02-如何计算神经网络的参数

全文总结于 Bilibili UP 主飞天闪客的一小时到 Transformer 系列视频! 如何计算神经网络的参数:从损失函数到梯度下降与反向传播 摘要 这篇文章用直观比喻与必要数学并重的方式,讲清楚三件事: 为什么需要“损失函数”来量化预测与真实之间的差距 如何用“梯度下降”把参数一步步调到更好 反向传播如何高效地计算大规...

白话DeepSeek01-从函数到神经网络

全文总结于 Bilibili UP 主飞天闪客的一小时到 Transformer 系列视频! 从函数到神经网络:技术演进与核心关联解析 摘要 神经网络是当前人工智能领域的核心技术之一,但其本质是对“函数”这一基础数学概念的复杂延伸与组合。从早期人工智能符号主义(追求精确函数)到现代联结主义(追求函数近似),技术路线的转变揭示了神经网络的本质:通过层级嵌套和参数优化,构造一个能够逼近任...

Spring Boot定时任务再进化:从@Scheduled到企业级动态调度框架的设计之旅(十)

引言 过去九章,咱一起走完了一趟挺带劲的技术远征。从吐槽@Scheduled那几个让人头疼的毛病开始,一路解决问题、填坑,最后搞出了一套全新的调度方案。 咱不只是做了个叫hadoken-scheduler的工具,更重要的是,完整走了一遍“从发现问题→定思路→搭架构→写实现”的软件工程流程。 这一章作为收尾,咱不聊新技术细节了,放慢节奏好好复盘:回顾这趟旅程的关键节点,提炼贯...

Spring Boot定时任务再进化:从@Scheduled到企业级动态调度框架的设计之旅(九)

引言 到目前为止,咱把hadoken-scheduler从一个想法,做成了功能全、够稳定的调度服务。对80%的常规场景来说,前面讲的功能已经够用了。但真实业务里总有那20%的“特殊情况”:比如公司技术栈全靠JPA/MongoDB,框架自带的Mybatis方案用不了;或者想把任务配置统一放到Nacos/Apollo里,改一处全生效。 这一章咱跳出框架的“舒适区”,聊点高级玩法...

PLANET

原文出处 歌・作詞:星街すいせい 作曲・編曲:酒井拓也 翻译:丁丁、Dragon Dance (找不到翻译大佬的联系方式,如果翻译侵权请告诉我删除。 目前只做了上篇学习的罗马音,等做完下篇视频会在这里更新, 手速快如果罗马音有错误请联系我改正,因为发现错误就直接在PPT上改了,文档就忘记改 了,而且唱歌的时候我一般看假名,如果有小错误有时候也没发现。) 星(ほ...