{"type":"rich","version":"1.0","provider_name":"Transistor","provider_url":"https://transistor.fm","author_name":"课代表立正","title":"E418. 深度访谈田渊栋：AI“顿悟”的关键，是对优雅的追求？","html":"<iframe width=\"100%\" height=\"180\" frameborder=\"no\" scrolling=\"no\" seamless src=\"https://share.transistor.fm/e/a71725dd\"></iframe>","width":"100%","height":180,"duration":2409,"description":"AI课程：https://www.ai-builders.com\n64分钟完整版：https://youtu.be/zAzsDHpR4xs\n文字总结：https://www.superlinear.academy/c/ai-resources/2025-10-24-ai\n腾讯新闻报道：https://view.inews.qq.com/wxn/20251030A05AJU00?openid=o04IBAJRCPyDLXQ1Moj4TQQRIYbM\n\n\n这次访谈，田博士科普了三个非常深刻的道理：\n1. 模型的表征和人类mental model的重要\n2. 模型的顿悟是如何发生的\n3. 在损失函数之上，AI还在（隐含地）追求优雅\n\n\nAI 究竟是在“记忆”还是在“泛化”？我们常说的“顿悟”时刻，在神经网络中是如何发生的？田渊栋博士（https://yuandong-tian.com/ ），将为我们揭示这些问题的答案。\n\n在这期视频中，我们将探讨：\n* 为什么说研究员的“直觉”比算力更宝贵？\n* AI 如何像金庸武侠里的高手一样，在大量“背诵”后突然“顿悟”？\n* “Scaling Law”会是通往 AGI 的唯一路径吗？是否存在天花板更高的研究范式？\n* Loss Function 竟然只是一个“代理”？那 AI 学习的真正目标是什么？\n* 如何与 GPT-5 这样的 AI “同事”一起做研究，极大地提升科研效率？\n\n如果你对 AI 的学习本质、大模型的未来以及人类研究员的价值感兴趣，这期视频不容错过。\n\n00:00:00 - 开场：在Meta工作十年后被裁\n00:01:14 - 为何要公开谈论裁员：为团队发声\n00:02:51 - 澄清团队贡献：我们解决了关键问题\n00:04:10 - 研究员的价值：从稀疏数据中获得洞见 (Insight)\n00:06:11 - 什么是研究的“品味”和“直觉”？\n00:08:14 - “顿悟”(Grokking)：AI如何从记忆到理解？\n00:10:55 - “读书百遍，其义自现”：表征学习的飞跃\n00:12:05 - 压缩与泛化：更优雅的理论总是胜出\n00:13:05 - 黑箱 vs. 白箱：Scaling Law 是唯一答案吗？\n00:15:54 - 我们该如何学习 AI 的学习方式？\n00:17:38 - 数据瓶颈下，理解模型内部机制的意义\n00:18:41 - AI 的产出，究竟是记忆还是泛化？\n00:20:41 - “顿悟”的内在机制：优化 landscape 上的山峰之争\n00:23:10 - 惊人观点：Loss Function 只是一个“代理”\n00:27:40 - 找到个人兴趣与行业应用的结合点\n00:32:05 - 未来展望：与 AI \"同事\" 一起做研究\n00:36:05 - 人类研究员的核心价值：注入关键的 Insight","thumbnail_url":"https://img.transistorcdn.com/6qJNndCuNNsETn3J2B9p3Z9vVJEgAowQiCfGrI1qgng/rs:fill:0:0:1/w:400/h:400/q:60/mb:500000/aHR0cHM6Ly9pbWct/dXBsb2FkLXByb2R1/Y3Rpb24udHJhbnNp/c3Rvci5mbS9jYzZl/YWYzMjA5NzJiMDY4/MjIxOGE0ZjYwMzY0/ODQ1ZC5qcGc.webp","thumbnail_width":300,"thumbnail_height":300}