分享
“Skill 不就是长一点的提示词吗?”
输入“/”快速插入内容
“Skill 不就是长一点的提示词吗?”
用户4242
用户4242
1月26日修改
🔗 原文链接:
https://mp.weixin.qq.com/s/05NzsYUx...
原创 宝玉 宝玉 宝玉AI
2026年1月25日 07:55 美国
上篇文章
别把整个 GitHub 装进 Skills,Skills 的正确用法
发出去后,收到一些质疑:
“说 skill 能做配图 prompt 不行。本来 skill 就是加载 md,没 skill 之前我们用 prompt 模板照样也是能做流程编排。”
“现在大部分 skill 不就是长一点的提示词吗?为什么说'单纯靠提示词做不了'?”
这些批评是对的。
我原文确实表达有问题。写“提示词”的时候,我下意识拿 Gem、Project、GPTs 里的那种提示词当例子。那些确实做不到一次性生成配图。
但“提示词”是个很宽泛的概念。如果我把 SKILL.md 的内容复制出来发给 Claude Code,再给它一个生成图片的脚本,它一样能完成配图任务。
这里的差异不在于提示词能不能复用,Gem 和 GPTs 里的提示词也能复用。
差异在于:提示词配套的是 ChatBot,还是 Agent?
ChatBot 和 Agent 的核心区别
Skills 的完整名称叫 Agent Skills。注意这个“Agent”,它不是装饰词。Skills 利用 Agent 的虚拟机环境,提供单纯提示词无法实现的能力。
一句话总结:ChatBot 只能对话,Agent 能动手干活。
具体来说:
ChatBot 不能调用工具。
你给它一段配图提示词,它能帮你分析文章、生成画图 prompt,但真要生成图片?它只能说“请把这段提示词复制到 Gemini”。剩下的活还是你干。
Agent 能调用工具。
同样的配图任务,它能像个经验丰富的编辑一样自己完成:
1.
读取你的文件
2.
分析需要几张图、放哪里
3.
为每张图设计内容和风格
4.
调用画图模型生成图片
5.
把图片插入正确位置
6.
输出成品交到你手上
全程自动化,你只需要验收。
那 Skill 到底是什么?
很多人把 Skill 理解成“一段很长的提示词”,这个理解对了一半。
SKILL.md 的核心确实是指令文本。但 Skill 不止于此。
一个 Skill 可以包含三层内容:
第一层:元数据。
就是 name 和 description,告诉 Agent 这个 Skill 是干嘛的、什么时候该用。这部分在启动时就加载,但只占几十个 token。
第二层:指令。
SKILL.md 的主体内容,工作流程、最佳实践、注意事项。只有 Agent 判断需要用这个 Skill 时,才会读取这部分。
第三层:资源和代码。
附带的脚本、模板、参考文档。Agent 按需读取,用的时候才加载。