分享
【栏目对话和访谈】Sebastian 和 Nathan 在 Lex Fridman 播客深度解读 AI 现状:中美竞争、模型对比、规模定律、AGI 时间线
输入“/”快速插入内容
【栏目对话和访谈】Sebastian 和 Nathan 在 Lex Fridman 播客深度解读 AI 现状:中美竞争、模型对比、规模定律、AGI 时间线
用户4242
用户4242
2月1日修改
🔗 原文链接:
https://mp.weixin.qq.com/s/W4Oec49y...
原创 宝玉 宝玉 宝玉AI
2026年2月1日 13:53 美国
Sebastian Raschka 和 Nathan Lambert 坐在 Lex Fridman 的播客里,聊了整整 4 个小时。
Sebastian 是《从零构建大语言模型》一书的作者,那本书教你从零开始写一个 GPT-2。Nathan 是艾伦人工智能研究所(AI2)的后训练负责人,写了业界最权威的 RLHF(基于人类反馈的强化学习)书籍。两个人都是真正在一线做研究、训练模型的人。
这期播客覆盖了 AI 领域几乎所有热门话题:中美竞争、模型对比、规模定律(Scaling Laws,即模型性能随计算量增长的规律)、训练流程、AGI(通用人工智能)时间线、程序员是否会被取代……信息密度极高。以下是按访谈顺序整理的核心内容。
Lex 开场就抛了一个问题:国际层面,中国还是美国在赢?
Sebastian 的回答很谨慎:"赢"这个词太宽泛了。他认为 DeepSeek 赢得了开源社区的心,因为他们真的把模型放出来了。但长期来看,不会有任何一家公司独占某种技术——研究者频繁跳槽,想法会流动。真正的差异化因素是预算和硬件。
Nathan 补充了一个有趣的观察:Claude 4.5 的热度是有机增长的,而几个月前 Gemini 3 发布时营销攻势很猛,但热度很快就被 Claude 盖过了。
"差异化程度在降低,"他说。各家的想法空间很流通,但 Anthropic 在代码上的长期押注正在收到回报。
关于中国公司,Nathan 指出 DeepSeek 可能正在"失去王冠"——智谱 AI、MiniMax、月之暗面等公司在 2025 年下半年表现更加亮眼。DeepSeek 启动了中国的开源运动,就像 ChatGPT 启动了美国的聊天机器人运动一样。
"中国现在有大量科技公司在发布非常强的前沿开源模型。"
Lex 追问:中国公司会持续开源多久?
Nathan 的判断是:至少几年。中国公司很清楚,美国顶级科技公司出于安全顾虑不会购买中国 API 服务。开源模型是一种"曲线进入"美国市场的方式——用户在本地运行,既获得分发又不触发安全红线。
"他们对此非常现实,而且正在奏效。"
ChatGPT、Claude、Gemini、Grok:谁更强?
Lex 问:2025 年哪个模型赢了?2026 年谁会赢?
Nathan 坦言很难押注 Gemini 超过 ChatGPT,因为 OpenAI 是市场领先者,在科技行业这有巨大优势。但 Gemini 的势头确实在上升。他的判断是:Gemini 会继续蚕食 ChatGPT 的份额,Anthropic 会在软件和企业端持续成功。
关于个人使用习惯,三人的偏好完全不同:
Sebastian
:大多数时候用 ChatGPT 快速查东西,用非思考的快速模式。偶尔用 Pro 模式做深度检查,比如让它彻底审查一篇文章的引用、格式、逻辑。
Nathan
:从不碰 GPT-5 的非思考模式。信息检索一律用 GPT-5.2 思考模式或 Pro,快速问题用 Gemini,代码和哲学讨论用 Claude Opus 4.5(带扩展思考),实时信息用 Grok。
"我简直不敢相信你用路由模式和非思考模式。"
Lex
:用 Grok-4 Heavy 做硬核调试,其他模型解决不了的问题它能解。界面上更偏好 Gemini,因为它的长上下文能力——在"大海捞针"场景下(即从海量文本中找到特定信息),Gemini 对他来说表现最好。
Sebastian 总结了一个普遍规律:"你一直用到它出问题,出了问题就换一个模型。"
就像浏览器一样——Safari、Firefox、Chrome 功能差不多,你不会同时打开三个浏览器对比同一个网页。你用习惯的那个,直到它出问题。
Lex 提了一个尖锐的问题:我们三个都没提中国模型。这说明什么?
Sebastian 认为这是平台和模型的脱节——中国开源模型更多是作为权重被下载使用,而不是通过产品界面。Nathan 补充:美国用户愿意为边际智能付费,而中国公司还没找到让美国用户付费的方式。
"简单说,美国模型目前更好,我们就用它们。"