{"type":"rich","version":"1.0","provider_name":"Transistor","provider_url":"https://transistor.fm","author_name":"课代表立正","title":"E446. 亚马逊AGI查晟：大模型训练的一线实践；训练AI有多难，人才和科学精神有多重要？","html":"<iframe width=\"100%\" height=\"180\" frameborder=\"no\" scrolling=\"no\" seamless src=\"https://share.transistor.fm/e/60aacaee\"></iframe>","width":"100%","height":180,"duration":3295,"description":"AI课程/风水宝地： https://www.superlinear.academy/ai-builders\n两小时完整版：https://youtu.be/emWRfc4s00c\n\n为什么 DeepSeek 能以 1% 的成本训练出顶尖模型，而拥有海量资源的硅谷巨头却步履维艰？训练大模型到底是玄学还是科学？\n\n本期视频，我们邀请到了 Amazon AGI 资深经理（Senior Manager）查晟。他曾与 Alex Smola、李沐等 AI 巨匠共事，深度参与了亚马逊第一代大模型的研发以及目前 Frontier 模型的训练。他将从技术路线、实验方法论、基础设施以及人才密度等维度，带你揭开大模型训练背后的真实挑战。\n\n你将在这段视频中获得：\n\n避坑指南：为什么模型在小规模实验时效果很好，Scale Up 之后却突然“崩了”？\n内部策略：为什么一个高产的团队应该追求 50% 的失败率？如何通过“信息增益”优化研发？\n硬核工程：GPU 功率激增为何会导致数据中心宕机？“静默数据损坏”如何毁掉一个模型？\n行业真相：公开榜单（Benchmarks）是如何被刷分的？为什么大厂必须拥有“秘密评测集”？\n未来判断：AI 自我进化的临界点在哪？当初级岗位消失，科技从业者该如何转型？\n这是一场拒绝空谈、直面工程细节的深度对谈。无论你是 AI 从业者，还是对技术变革感到焦虑的观察者，查晟的视角都会为你提供极具价值的参考。\n\n\n00:00 开场\n01:14 嘉宾介绍：查晟与Amazon AGI\n02:23 大模型训练的基本原理与为什么这么难\n07:47 反直觉的实验方法：为什么要做失败率50%的事\n09:05 训练大模型需要哪些团队协作\n15:15 数据质量：微波炉社区、SEO垃圾与合成数据的边界\n21:04 Evaluation为什么是最重要也最容易出错的环节\n29:57 团队如何衡量研发进度（cost-to-accuracy框架）\n36:01 人才缺口与NVIDIA的护城河\n39:26 未来趋势：模型自主学习将改变什么\n45:33 AI时代的职业与经济冲击\n53:33 结语","thumbnail_url":"https://img.transistorcdn.com/6qJNndCuNNsETn3J2B9p3Z9vVJEgAowQiCfGrI1qgng/rs:fill:0:0:1/w:400/h:400/q:60/mb:500000/aHR0cHM6Ly9pbWct/dXBsb2FkLXByb2R1/Y3Rpb24udHJhbnNp/c3Rvci5mbS9jYzZl/YWYzMjA5NzJiMDY4/MjIxOGE0ZjYwMzY0/ODQ1ZC5qcGc.webp","thumbnail_width":300,"thumbnail_height":300}