喝点VC｜a16z的未来展望：现在AI不是泡沫，因为它还没破裂；只有当投入打水漂，才能确认它曾经是泡沫

用户4242

2025年12月18日修改

🔗 原文链接： https://mp.weixin.qq.com/s/b16Ol_PN...

a16z Z Potentials2025年12月18日 11:28 北京

common.docs_name - LarkCCM_Docs_Menu_Image

图片来源： a16z

Z Highlights

•
目前来看，企业实际赚到的利润情况其实非常好。如果他们停止开发更大规模的模型，只靠现有的模型运营，按照当前的利润率，很快就能实现盈利。从这个角度来说，现在确实不像是泡沫。 ​

•
总有人说 AI 还没盈利，企业还在持续投入以求盈利。但实际上，他们很快就能收回过去所有的开发成本了。现在的投入，只是为了未来的进一步发展。 ​

•
要推进研发，必须进行更多实验，这也就意味着纯软件奇点很难实现 ​

•
在高端市场，我肯定会预期有新的工作岗位被创造出来。每个人依然可以成为影响者。但在高端领域，确实很难指出哪些具体工作是 AI 目前绝对无法自动化的。 ​

•
单纯砸钱并不会让基准测试变得更好，但平均来说，开发更高级的基准测试确实需要投入更多资源 ​

a16z ：全称 Andreessen Horowitz ，是一家美国私人风险投资公司，由马克 · 安德里森和本 · 霍罗威茨于 2009 年创立。该公司总部位于美国加利福尼亚州门洛帕克。安德里森 · 霍罗威茨投资于早期新创公司和已成熟的成长型公司。其投资范围涵盖医疗保健、消费者、加密货币、游戏、金融科技、教育以及企业信息技术等产业。 ​

AI 泡沫争议 —— 投入、价值与盈利的核心讨论

Erik Torenberg ： 各位，关于 AI 的宏观讨论有很多。我们现在正处于泡沫之中吗？该怎么看待这个问题？后面我们会聊预测相关的话题，不过现在不妨先说说，该如何着手分析这么宽泛的问题。 ​

David Owen ： 对我来说，思考这个问题的核心是看一个关键指标，比如大家在算力等方面的投入情况。另外还要考虑，这些投入之后会不会让人后悔。至于投入规模，看看英伟达每年的销售额就知道了，目前是持续增长的，情况还算不错。但要说会不会后悔，这就只能靠猜了，还得慢慢观察。 现在大部分算力都用在推理上，企业用这些算力提供服务，目前看来并没有后悔的意思。 所以单从这一点来说，我觉得还不算太泡沫。不过我也不敢太确定，还有其他因素需要考量。 ​

Yafah Edelman ： 目前来看，企业实际赚到的利润情况其实非常好。如果他们停止开发更大规模的模型，只靠现有的模型运营，按照当前的利润率，很快就能实现盈利。从这个角度来说，现在确实不像是泡沫。但另一方面，企业一直在投入资金构建更庞大的模型。要是顺利，利润会更可观；可如果不顺利，就算现在盈利再多，跟投入的成本比起来也只是小数目。所以从财务数据来看，目前并没有迹象表明存在泡沫。很多担心泡沫的人，可能是不习惯现在这么大的投入规模，也没适应 AI 已经取得的成功和扩张速度。但如果真的存在泡沫，它可能会突然破裂，而且后果会相当严重。 ​

David Owen ： 其实我们差不多能给你一个明确的答案： 我觉得现在不是泡沫，因为它还没破。泡沫这东西，只有破了之后你才能确定它是泡沫。 ​

Yafah Edelman ： 总有人说 AI 还没盈利，企业还在持续投入以求盈利。但实际上，他们很快就能收回过去所有的开发成本了。现在的投入，只是为了未来的进一步发展。所以我认为，至少目前 AI 有潜在的盈利能力，要是说现在有明显的泡沫，那反而有点出人意料。 ​

David Owen ： 大家在这些 AI 模型上花了不少钱，用户也在实际使用。他们愿意花钱，可能是因为确实从中获得了价值。你可能会说这种价值不真实，大家只是拿来玩玩而已，但不管背后的原因是什么，用户愿意付费这个现象，本身就是个相当可靠的信号。 ​

Erik Torenberg ： 没错，大家在这些模型上投入巨大，愿意花钱肯定是因为从中得到了价值。你可能会反驳说，这种价值不是真实的，只是大家图个新鲜，但不管付费原因是什么，这都是个很有说服力的信号。 我们其实已经能给出一个还算靠谱的答案了：这不是泡沫，因为它还没破裂。只有当投入打水漂、泡沫破裂之后，我们才能确认它曾经是泡沫。 ​

Yafah Edelman ： 总有人说 AI 还没盈利，企业还在不断投入以求盈利。但实际上，他们很快就能收回过去所有的开发成本了，现在的投入只是为了未来的进一步发展。 ​

David Owen ： 他们会不会后悔这些投入呢？投入规模到底有多大？看看每年的销售额就知道了，目前是持续增长的，情况还不错。 ​

Yafah Edelman ： 说实话，导航这类任务对 AI 来说其实特别简单。大家总说这需要 AI 达到极高的智能水平，但实际做起来就像创作艺术品一样， AI 的表现远比人们预想的要好。 ​

David Owen ： 几十年前的国际象棋就是这样，对吧？当时计算机成功攻克了国际象棋，大家都觉得这是推理能力的巅峰。结果等计算机真的做到了之后，人们又觉得，计算机能下棋也没什么大不了的。 ​

技术演进：预训练趋势、纯软件奇点与模型能力边界

Yafah Edelman ： 有个相关的问题想问问你，你之前提到了 2030 年 AI 报告，里面说没看到模型能力停滞的迹象，反而一直在提升，而且有基准测试支撑，数据量和算力也在持续增长。那你觉得模型在某些方面会不会已经出现停滞了？比如预训练技术。我们现在看到的是停滞，还是说大家还在不断探索创新？你怎么看？ ​

David Owen ： 这一点其实很难判断，因为我们现在进入了一个缺乏公开数据的领域。预训练确实不像以前那样是唯一的焦点了，部分原因是出现了后训练这个新方向，大家在推理等方面做了很多工作。但这并不意味着预训练就无法进一步扩展了。目前看来，还有很多未被利用的数据，而且这些技术之间很可能是协同作用的：先开发出更好的模型，再通过后训练技术优化，然后从模型的实际使用中获取大量数据 —— 不管是成功的还是失败的案例，其中很多都能用于下一轮预训练。 ​

Erik Torenberg ： 你们没有预测纯软件奇点的出现，也就是 AI 能够自动化 AI 研究，形成自我改进的反馈循环。为什么会这样呢？ ​

David Owen ： 这份报告并不是个人预测，它主要是审视当前的趋势，看看有没有明显的理由表明这些趋势无法持续。如果趋势能持续，又会导向什么结果？我觉得，这种自我改进的情况，很难通过现有趋势去推断。目前 AI 确实能在一定程度上辅助研发工作，比如编码或者选择数据集之类的。但这种辅助作用很难量化，而且也没有达到自我改进所暗示的那种显著效果。 有理由认为，要实现完全的自动化研发其实非常困难。 大家也讨论过，如果技术进展很大程度上依赖于算力的扩大，那么自动化研发能起到的作用可能就很有限。我觉得这种说法有一定道理，但也不能完全确定，毕竟这种超出常规的情况太难推测了。 ​

Yafah Edelman ： 纯软件奇点要出现，有一个必要条件：必须处于这样一个世界 —— 仅仅依靠增加研发人员的工作时间，就能改进 AI ，从而弥补无法扩展实验算力或预训练规模的不足。 如果真是这样，那我们应该会看到，实际使用的实验算力并不多，所有资金都流向了研究人员。但目前的情况是，虽然有大量资金投入到研究人员身上，但据我们所知，实验算力的投入规模也不相上下，甚至比最终发布模型的训练运行所投入的资金还要多很多倍。这一点让我改变了之前的看法 —— 大规模实验其实是研发的必要条件。我们没有足够的证据表明，只靠研究人员，不做更多实验，就能加速技术进展。不过这方面也有很多不同的观点，都有各自的道理。 我个人倾向于认为，要推进研发，必须进行更多实验，这也就意味着纯软件奇点很难实现。 但我并不觉得持相反观点的人是错的，他们的想法也有合理之处，毕竟我们现在都是在猜测一个数据很匮乏的领域。说到这里，我又想到一个问题。有些公司的研究人员在尝试探索超出可验证的领域，比如有观点认为，梯度下降在当前的数据集上学习效果很好，但如果反复训练，模型会开始忘记之前学过的内容，也就是所谓的 “ 灾难性遗忘 ” 。你怎么看待这个观点？孩子们学习可不是这样的。也许孩子们是通过模仿学习，也可能是通过某种探索的方式学习。我很好奇你的看法。如果孩子真的只靠模仿就能学习，那抚养孩子就简单多了。但抚养孩子之所以难，似乎就是因为他们会去探索各种各样的东西。那么在算法改进方面，除了数据和算力，我们还需要什么才能持续优化这些模型呢？ ​

Yafah Edelman ： 我不太愿意把 AI 学习和人类学习放在一起比较。不是说两者完全不能比，而是因为我们现在对 AI 学习的了解，远比对人类学习的了解要多。人们总爱对人类的学习方式做各种假设，然后说 AI 不是这么学习的。我不知道这种说法是不是真的，也许人类孩子确实是通过强化学习来成长的。我对这一点没有强烈的立场，但我觉得，人们总会找到利用现有算力的方法，毕竟过去他们一直都是这么做的。 ​

David Owen ： 我也不太倾向于做这种比较。就拿你说的灾难性遗忘来说，随着模型规模的扩大，我们在这方面其实已经做得越来越好了，模型能记住的东西也越来越多。这并不是说这个问题已经完全解决了，不需要再创新了，只是我也不会完全否定当前的技术路径。 ​

Yafah Edelman ： 我绝对不认为这些担忧已经导致模型能力的增长放缓了。人们总会有各种各样的担忧，但在这些担忧真正反映到实际数据之前，我是不会轻易相信的。 ​

AI 与编码：预测争议、效率衡量与实际影响

Erik Torenberg ： Anthropic 的 Dario 在 2025 年 3 月说过，六个月内 AI 将编写 90% 的代码，当然这个预测现在还没实现。他还说，我们可能在 2026 或 2027 年拥有相当于一个 “ 天才国家 ” 的 AI 系统。你们怎么看待 Anthropic 的这种乐观态度？你们和他们的核心分歧在哪里？ ​

David Owen ： 我的理解是，他们更相信自动化研发能带来技术的快速突破。他们认为，我们现在开发的 AI 非常适合研究工程类的编码工作，等这些 AI 足够好用之后，会迅速加速下一代模型的开发，到时候技术进展就会变得非常快。 ​

Yafah Edelman ： 这很难判断。就我所知，我们没有足够的证据证明纯软件快速突破的观点是错误的，只是 AI 要达到最低必要能力水平，所需要的时间可能比他们预测的要长一些。但这也只是我的猜测。 Dario 说话的时候经常会用 “ 最早 ” 之类的词来限定，所以他给出的可能是一个比较乐观的时间线，我也不确定。 ​

David Owen ： 还有些人会像解读塔木德一样，仔细抠他的措辞，还会讨论 Anthropic 团队生成的代码行数是否符合他的说法。所以这件事其实挺棘手的，没有一个明确的判断标准。 ​

Yafah Edelman ： 我记得 Uplift 论文说模型的效率实际上会变慢，但这很大程度上取决于他们当时使用的模型 —— 那份报告出来的时候，那些模型已经相当过时了。以我个人的经验来看， AI 确实能让工作效率大幅提升。仅仅是能掌握整个代码库的上下文，就是一个巨大的优势，这一点人类很难做到。现在我写的代码里，超过 90% 都是 AI 完成的，但我很清楚自己不是普通的程序员。不过我觉得，现在预测 AI 将编写 90% 的代码，也不算完全离谱。据我所知，在 OpenAI 或者其他地方，可能已经有人在用 AlphaCode 通过进化算法做大量试验，试图解决一些难题。目前到底有多少代码是 AI 编写的，其实很难说清楚。很多人直觉上会觉得 “ 程序员 90% 的工作都被 AI 替代了？肯定没有 ” ，但实际情况要复杂得多。 ​

David Owen ： 这确实是个很关键的区别。如果只看通过 Tab 补全等方式 “ 编写 ” 的代码行数，比例可能确实很高，但这并不意味着 AI 承担了程序员最核心、最困难的工作。你提到的 Uplift 论文很有意思，也很有价值，而且出人意料地新。你说里面的模型过时了，但那是 2025 年初的研究，当时大家确实觉得那些模型是有帮助的。论文里提到，参与者一开始就预测会提速，事后也表示确实提速了。这说明，我们可能真的很难准确判断 AI 到底有没有提升工作效率。 ​

喝点VC｜a16z的未来展望：现在AI不是泡沫，因为它还没破裂；只有当投入打水漂，才能确认它曾经是泡沫​

喝点VC｜a16z的未来展望：现在AI不是泡沫，因为它还没破裂；只有当投入打水漂，才能确认它曾经是泡沫