喝点VC｜a16z复盘消费级AI：为什么还没有AI社交软件？2026年多模态与应用生成为破局关键

用户4242

1月23日修改

🔗 原文链接： https://mp.weixin.qq.com/s/ZfabRds8...

a16z a16z Z Potentials2026年1月22日 11:56 北京

common.docs_name - LarkCCM_Docs_Menu_Image

图片来源：a16z

Z Highlights

•
目前已经出现了一些早期迹象， 通用LLM助手领域的市场格局，正朝着“赢家通吃”，至少是“赢家通吃大部分市场”的趋势发展。 在ChatGPT、Gemini、Claude 3和Cursor这几款产品中，仅有9%的用户会为一款以上的产品付费。​

•
不过，今年的一大突破在于，图像和视频生成模型在真实感和推理能力这两个维度都取得了长足的进步。 这里所说的真实感，指的是那些能让图像或视频看起来栩栩如生的细节。​

•
驱动社交应用发展的动力源于用户的两种心理：一种是积极的自我表达欲，另一种是消极的焦虑感。说到底，这就是一场 “地位博弈”。​

•

•
一款真正成功的社交产品，必须同时兼顾内容消费和内容创作两大功能，而且它所产出的内容，应该是其他平台无法替代的， 就像TikTok的短视频和YouTube的短视频那样，具有独特的平台属性。​

•

•
如今，大模型的性能已经达到了足以支撑开发者搭建真正可规模化应用的水平。 因此，我们有理由期待，2026年将会成为消费级AI应用开发者大放异彩的一年。​

2025年末，消费级AI已迈入全新发展阶段，市场格局渐显且多模态技术重塑创意工作流，行业变革与机遇并存。2025年12月29日，全球顶尖风投机构a16z消费领域合伙人Olivia Moore、Anish Acharya、Justine Moore和Bryan Kim受邀参与节目，一同回顾2025年AI领域在产品与模型层面的重大变革，展望2026年发展趋势，深入探讨消费级AI “赢家通吃” 格局成因、产品设计核心价值等关键议题。​

2025消费级AI市场格局：头部领跑与竞争态势

Olivia Moore ： 今天，我们要探讨的话题是“谁是2025年消费级AI赛道的赢家”。可以说，在这一年里，两大模型巨头——OpenAI和Google，比其他任何企业都更积极地向消费级市场发力。无论是推出新模型，还是发布面向主流用户的新产品、新功能与新交互界面，两家公司都动作频频。​

或许有人会疑惑，究竟谁在这场竞争中处于领先地位，这件事真的重要吗？ 目前已经出现了一些早期迹象，表明通用LLM助手领域的市场格局，正朝着“赢家通吃”，至少是“赢家通吃大部分市场”的趋势发展。数据显示，在ChatGPT、Gemini、Claude 3和Cursor这几款产品中，仅有9%的用户会为一款以上的产品付费。 而在今年的大部分时间里，使用ChatGPT的用户中，不足10%的人会去体验Gemini这类其他头部LLM服务商的产品。​

如果现在就下定论的话，ChatGPT无疑是当前的绝对领跑者，其周活跃用户数量达到了8亿至9亿。 据估算，Gemini在网页端的用户规模约为ChatGPT的35%，在移动端则达到了40%左右，其他所有产品都远远落后于这两者。例如，Claude 3、Grok和Perplexity的使用率仅在8%至10%之间。​

不过，尤其是在过去的3至6个月里，随着Nano Banana这类迅速走红的新模型问世，市场格局正发生着迅猛的变化。 Gemini的桌面端用户数量同比增长了155%，而且即便用户规模已经相当可观，其增长速度仍在加快，这一表现着实令人惊叹。相比之下，ChatGPT的同比增长率仅为23%。 与此同时，我们也注意到，像Anthropic这样的玩家，开始在消费级市场深耕特定细分领域，例如主攻技术需求极高的用户群体。​

因此，今天我们邀请到了a16z的消费级投资团队，一同回顾今年头部模型公司在消费级市场的表现，并预测2026年该领域的发展趋势。​

核心模型与产品创新：多模态突破与技术演进

Anish Acharya： 谢谢Olivia。这一年确实精彩纷呈。如果我们把时间拉回到去年一月，或许可以先从这一年里的产品发布、市场反响、成功经验与失败教训谈起。Justine，来和我们分享一下你今年的观察吧。对于OpenAI和Google这两家公司，你重点关注了哪些方面？又有哪些观点发生了转变？​

Justine M oore： 好的。正如Olivia所说，这两家公司今年在消费级市场的产品发布尤为密集。​

从模型层面来看，它们今年推出的最受消费者追捧的模型，当属图像与视频生成类模型。以OpenAI为例，今年推出的ChatGPT-4o图像功能曾引发了“Giblly时刻”那样的热潮——说起来有点不可思议，这一现象竟然就发生在今年，感觉却像过去了好几年。当然，还有Sora 2这款视频生成模型。​

再看Google，其推出的VO系列模型，包括VO3和VO3.1，以及图像生成模型Nano Banana和Nano Banana Pro，都迅速走红，其热度即便没有超过，也足以与OpenAI的“Giblly时刻”相媲美。​

在产品层面，我们能看到两家公司截然不同的策略：OpenAI倾向于将更多功能整合到ChatGPT的主界面中。例如，Pulse群聊、购物、研究任务等功能，都是以ChatGPT为核心平台推出的。唯一的例外是Sora，它作为一款独立的视频应用存在。​

而Google则更倾向于推出独立产品。虽然他们也通过Google AI Studio、Google Labs、Gemini等众多自有平台发布了不少产品，但同时也推出了许多可直接访问的独立网站。这种模式能够为不同类型的产品打造更具针对性的定制化界面，而不仅仅局限于“输入文本—输出文本”或“输入指令—生成图像/视频”这样单一的交互形式。​

Anish Acharya： Justine，关于这一点我有个问题想请教你。记得18个月前，我们还在热议Midjourney，当时大多数多模态模型的核心竞争力都体现在美学风格和真实感上。如今这种情况是否依然如此？今年该领域又发生了哪些变化？​

Justine Moore： 各类模型在风格上的差异依然存在。而且我发现，在深耕图像和视频生成领域的人群中，Midjourney的地位依旧无可替代——它具备一种独特的美学表现力，而这种能力，其他很多模型如果不借助精准的Prompt，是很难实现的。​

不过，今年的一大突破在于，图像和视频生成模型在真实感和推理能力这两个维度都取得了长足的进步。 这里所说的真实感，指的是那些能让图像或视频看起来栩栩如生的细节。比如，当画面中有人在行走交谈时，背景街道上行驶的车辆，其行驶方向必须符合常理，不能出现变形或违和的情况。​

而在推理能力方面，现在的模型已经能够接收多张输入图像和文本指令，并综合分析这些输入信息，生成出具有连贯性的设计方案之类的内容。这种能力，在去年是绝对无法想象的。​

Bryan Kim： 没错。我还记得，以前我们还会为模型能在图像中准确生成文字而兴奋不已，而现在，模型已经可以轻松生成精美的信息图表了。更令人惊叹的是，我们只需上传一段优质的YouTube视频，然后指令模型“生成一张能解释这段视频内容的图片”，它就能完美完成任务。这种进步真的是天壤之别。​

Olivia Moore： Nano Banana Pro甚至可以生成市场格局图，我就亲自试过一次，效果非常惊艳。 而且这款模型已经具备，或者即将具备在图像生成过程中整合网络搜索的能力——它能通过搜索获取准确的企业名单，还能自动抓取这些企业的相关图片并融入生成的图像中 ，这种功能简直太强大了。​

Justine Moore： 不过图像生成模型的推理能力目前还存在一个尚未攻克的难题。就在昨天，我测试了ChatGPT image 1.5，发现它在处理需要多步骤推理的任务时，依然存在困难。​

我设计的测试任务是这样的：上传一张大富翁游戏棋盘的图片，然后指令模型“移除棋盘上所有地产的名称，将其替换为AI实验室和初创企业的名称”。测试结果显示，ChatGPT image 1.5的表现已经是最接近目标的，但它仍然很难完成整个任务流程——既要删除原有名称，又要构思新的名称，还要将新名称准确放置在对应的位置上，同时还要确保没有重复命名，也不会遗漏任何重要的企业。由此可见，图像生成模型的发展依然有很长的路要走。​

Bryan Kim： 有意思的是， 我发现ChatGPT的图像生成模型有一个很突出的优势，就是它能在多次生成图像的过程中，保持角色形象和艺术风格的一致性。 这一点让非常惊艳，尤其在故事板创作这类场景中，这种能力会激发用户持续生成更多相关内容的欲望。​

Anish Acharya： 在我看来，Nano Banana这款模型最被低估的一点，在于它与搜索功能的整合。我们之前谈到，模型的真实感关乎物理规律等底层逻辑，推理能力则关乎能否精准执行用户的修改指令，而除此之外，还有一个关键维度就是准确性。​

产品摄影就是一个很好的例子。如果你让模型“生成这张专辑封面的图片”，或者“生成一张能还原某个历史瞬间的真实照片”，那么模型就必须借助搜索功能获取准确信息，才能完成任务。这种将图像生成与搜索整合的思路，虽然乍看之下并不直观，但实际应用价值却非常高。​

Olivia Moore： 完全同意你的看法。这让我想到了VO3模型的走红——当初，恐怕没人能预料到，将音频与视频融合在同一个模型中，竟然会成为引爆AI视频生成领域的关键突破。自VO3问世以来，我的社交平台信息流里就充斥着各种超逼真的AI生成视频，如今Sora或许已经成为了该领域的领军者，但VO3无疑是当之无愧的开拓者。​

Brya n Kim： 我专门统计过，我社交平台信息流里的内容，大约有五分之一都是AI生成的。真的太神奇了。​

产品设计与用户体验：细节决胜与场景落地

Anish Acharya： 聊了这么多今年的产品发布，其中不少产品，比如VO系列和Nano Banana，都取得了巨大的成功。那在各位看来，今年有哪些被低估的产品，或者哪些产品没有获得应有的关注呢？​

喝点VC｜a16z复盘消费级AI：为什么还没有AI社交软件？2026年多模态与应用生成为破局关键​

喝点VC｜a16z复盘消费级AI：为什么还没有AI社交软件？2026年多模态与应用生成为破局关键