分享
突发!OpenAI官方开源多智能体框架「Swarm」
输入“/”快速插入内容
突发!OpenAI官方开源多智能体框架「Swarm」
🔗 原文链接:
https://mp.weixin.qq.com/s/7o2UYvmr...
⏰ 发表时间:2024-10-12
原创: ElliotBai GLBai
一句话总结:
OpenAI终于自己下场做多智能体框架了,虽然还只是实验性的,但是很有用。
今天早上,OpenAI实施团队的 @shyamal在Github上开源了Swarm这个OpenAI官方的多智能体框架。
Swarm 里面定义了两个核心
「Agents」
和
「Handoffs」
。但是一个「Handoffs」,就把多智能体的关键,点的透透的。
大概过了一下文章和代码,简单看了下examples,不得不说,官方下场,就是不一样,下面就来带大家看看不一样在什麼地方,地址放在最后面。
为啥需要多智能体
我在之前的血泪史系列文章里有断断续续提到过很多关于Agent Tools调用和编排相关的内容,有兴趣的同学可以先读读我之前的一些内容:
•
AI Agent产品经理血泪史:一年来我摸过的那些石头【Tools篇】
•
AI Agent 产品经理血泪史(二)-欲知方圆,则必规矩【Workflow篇】
这两篇内容讲到,如何构建不同类型的Agent来满足不同的需求,复杂度从易到难,分别是:
1.
纯Prompt对话
2.
单个工具调用
3.
多个工具调用
4.
通过workflow来执行复杂流程
5.
Multi-Agent 多智能体协同
虽然单个Agent配上多个Tools,Workflow之后也能处理不同的问题,但是一个Agent的System Prompt是只有一个,能携带的Tools也是有数量限制的。
如果我们需要处理很多不同类别的复杂问题,要怎麼办?
相信大家都有打过10086客服电话的经验,或者电商客服咨询的经验:
如果你只是简单的问个常规问题,接线的客服直接就给你回答了,但是如果你问了一些其它业务线的问题时,比如宽带,那客服小姐姐就会温柔地跟你说“请稍等,我帮你转接到宽带部门”,一阵美妙的音乐声之后,另外一位专业的客服小姐姐接起了电话...
术业有专攻,智能体也一样。不能逮住一个牛马就使劲薅。
为啥用Swarm的多智能体
脚趾头:
因为是OpenAI出的。(君不见现在大多数大模型都在遵循OpenAI的接口规范...他们对自己做的东西更了解)
脑门:
其实单Agent这块,没有啥花里胡哨的东西,简单业务,OpenAI就一个 /api/completions 接口。但是「Handoffs」这块,Swarm的确做的非常优雅。(这里不得不给自己吹个牛,年初我就写了Swarm类似的多智能体了。)
多智能体的核心难题其实是不同智能体之间的通信问题。怎麼传递,传哪些信息,这些都很重要。