AI Agent产品经理血泪史（一）：一年来我摸过的那些石头【Tools篇】

⏰ 发表时间：2024-07-20 作者： GLBai

这一系列文章其实3个月前就在准备了，结果新工作太忙，卷忘记了。​

前几天刚好看到一篇关于GPT-6的报道，才想起来还有这麽回事情，于是赶紧把草稿捞出来改改交个任务。​

至于为什麽贴这张图，以及为什麽血泪史从Tools开篇。

那是因为你看，即使到了GPT-6的时代，Tools仍然是AI Agent落地的基石。正如图中所示，即使AI模型不断进化，物理攻击还是物理攻击，Tools还是Tools，没有变成魔法攻击。​

01 - 前言：从接口请求说起

如果从技术层面来看这个世界，其实并没有那麽科幻。 大模型也是如此，GPT-5, GPT-6同样如此。​

在传统互联网时代，所有功能背后都是一个个接口。

•

代码块

入参 → 请求 → 返回结果

然后再通过UI和前端，把这些零散的接口包装成一个功能呈现在用户面前。​

例如登录页面:

•
用户输入：用户名、密码​

•
后台请求：验证接口​

•
返回结果：成功/失败​

正确就返回Yes，登录成功；不正确就返回No，告诉你账号或密码不正确​

大模型的出现，让这套交互发生了些许的变化

Agent 可以直接拿着你的数据去请求登录（例子就不考虑数据安全问题了）​

但背后的那个登录接口还是登录接口

AI Agent的出现并没有改变这个本质，它只是将人工编写的规则替换为了AI的决策。​

Tools就是在这个过程中，帮助AI Agent生成正确API请求参数的关键。​

02 - 起源：大模型的魅力，其实并不是因为它是个吐字机。

而是可以通过它，把这个世界连接到一起。

当我第一次知道 ChatGPT 的时候，我刚好在解一个难题：

如何快速地从一堆非结构化数据中，抽取出结构化的候选人信息，然后提交到系统里。​

AI Agent产品经理血泪史（一）：一年来我摸过的那些石头【Tools篇】​