分享
AI Agent产品经理血泪史(一):一年来我摸过的那些石头【Tools篇】
输入“/”快速插入内容
AI Agent产品经理血泪史(一):一年来我摸过的那些石头【Tools篇】
🔗 原文链接:
https://mp.weixin.qq.com/s/0EhccjaO...
⏰ 发表时间:2024-07-20 作者: GLBai
这一系列文章其实3个月前就在准备了,结果新工作太忙,卷忘记了。
前几天刚好看到一篇关于GPT-6的报道,才想起来还有这麽回事情,于是赶紧把草稿捞出来改改交个任务。
至于为什麽贴这张图,以及为什麽血泪史从Tools开篇。
那是因为你看,即使到了GPT-6的时代,Tools仍然是AI Agent落地的基石。正如图中所示,即使AI模型不断进化,物理攻击还是物理攻击,Tools还是Tools,没有变成魔法攻击。
01 - 前言:从接口请求说起
如果从技术层面来看这个世界,其实并没有那麽科幻。 大模型也是如此,GPT-5, GPT-6同样如此。
在传统互联网时代,所有功能背后都是一个个接口。
•
代码块
Plain Text
入参 → 请求 → 返回结果
然后再通过UI和前端,把这些零散的接口包装成一个功能呈现在用户面前。
例如登录页面:
•
用户输入:用户名、密码
•
后台请求:验证接口
•
返回结果:成功/失败
正确就返回Yes,登录成功;不正确就返回No,告诉你账号或密码不正确
大模型的出现,让这套交互发生了些许的变化
Agent 可以直接拿着你的数据去请求登录(例子就不考虑数据安全问题了)
但背后的那个登录接口还是登录接口
AI Agent的出现并没有改变这个本质,它只是将人工编写的规则替换为了AI的决策。
Tools就是在这个过程中,帮助AI Agent生成正确API请求参数的关键。
02 - 起源:
大模型的魅力,其实并不是因为它是个吐字机。
而是可以通过它,把这个世界连接到一起。
当我第一次知道 ChatGPT 的时候,我刚好在解一个难题:
如何快速地从一堆非结构化数据中,抽取出结构化的候选人信息,然后提交到系统里。