分享
Agent 元年复盘:从 Claude Code 到 Deep Agent,Agent 的架构之争已经结束
输入“/”快速插入内容
Agent 元年复盘:从 Claude Code 到 Deep Agent,Agent 的架构之争已经结束
用户4242
用户4242
用户8537
用户8537
2025年12月25日修改
🔗 原文链接:
https://zhuanlan.zhihu.com/p/198351...
作者:周星星
前言
大家好,我是星仔。
随着 2025 年即将画上句号,我想对”Agent 元年“根据个人这一年的实践和认知进行一次收敛。
技术观点:Agent 架构之争已定,收敛至以
Claude Code
和 Deep Agent 为代表的「通用型 Agent」形态。
Claude Code 虽然在 2025 年 3 月作为“智能终端编程助手”推出,但其不止于编程。
•
社区里“不务正业”的玩法
:社区的开发者迅速挖掘了它的潜力,将其用于整理知识库、辅助博客创作、项目管理:
◦
案例:Claude Code 「全球“薅羊毛”第一人」刘小排(曾用 200 美元套餐消耗 5 万美元 Token)曾断言:
“只要有 SOP,就没有 Claude Code 执行不了的任务。”
•
官方的战略转向
:Anthropic 官方也注意到这种转变,2025 年 9 月,官方发布博文
《Building agents with the Claude Agent SDK》
,正式将 “Claude Code SDK” 更名为 “Claude Agent SDK”。
◦
背后的逻辑:Anthropic 意识到 Claude Code 核心的 Plan(规划)能力、上下文自动压缩、文件系统访问 等机制,不仅适用于编程,同样完美适配深度研究、视频制作等非编程任务。因此赶紧改名,防止大家从命名上认为它们只能做代码。
•
不是计划出来的,是演化出来的
:也许 Anthropic 一开始也不知道 claude code 能做这么多事情,随着社区里更多更多的玩法,才逐渐清晰。这也引出了一个关键问题:
它的核心架构究竟有何特点?我们又该如何对其进行修改适配,将其从“通用型”转化为特定领域的“垂类 Agent”?
,将在后文详细展开。
行业认知: 2025 年作为 Agent 元年,既没有悲观者眼中的“名不副实”,也未完全达到乐观者预期的“全面替代”,而是处于稳步落地的中间态。
作为一线从业者,我的评价是:
技术已就绪,爆发在局部。
•
验证过的成功:
Deep Research 和 Claude Code 已经完全融入日常工作流,成为了稳定可靠的生产力工具。
•
看不见的繁荣:
在招聘、市场营销、医疗等垂直领域,许多 Agent 产品早已实现百万美元营收。但由于大量业务集中在出海方向,导致国内体感不强。
•
核心瓶颈的变化:
年中时我们还在纠结技术架构,但现在架构已趋于统一。当前的真正挑战在于“业务重塑”——即依然需要懂技术的一线从业者,将传统 SOP(标准作业程序)解构和把行业知识提炼出来,以 Agent 友好的方式沉淀为新的工作流。
基于以上背景,本文将从 Deep Agent 为切入点,分享我作为一线开发者在 2025 年的实战感悟。
主要参考资料:
Anthropic
、
LangGraph
、
Manus
、
Philipp
。
关于参考资料的说明:在 Agent 领域,这些一线头部企业(特别是 Anthropic)对技术落地和架构的理解属于 T0 版本,其认知深度和实效性目前远超学术论文。如果你想真正研究 Agent,建议暂时放下学术论文,直接关注一线企业的落地实践和思考。
先来下个定义,什么是”Deep Agent“ ?
首先,它是“Deep”的
个人认为有两点需要做到
特征一:够“垂”(行业性)
具体示例如下:
1.
招聘 Agent 示例
•
输入:
一位 AI 芯片架构师的姓名。
•
任务:
一份专业背景报告。
•
衡量标准(如何才算“够垂”)
:报告内容(研究方向、核心项目、融资历史等)逻辑严谨、信息全面、专业性强,无任何重要信息遗漏和事实错误,达到高级招聘经理的水准。观感上,让老板无法分辨是人工还是 AI 生成。
1.
市场营销 Agent 示例
•
输入
:某品牌的产品信息和市场定位。
•
任务
:筛选符合品牌调性的网红(KOL/KOC)并给出市场报价。
•
衡量标准(如何才算“够垂”)
:最终筛选出的名单和报价,与公司市场部人工筛选的结果高度重合(例如 70% 以上重合),且报价在人工测算的合理区间内。
这些就是你的 agent 够“垂”的表现。假如你的 Agent 输出与通用型工具(如 Manus)一样,那就是不合格的。