“Skill 不就是长一点的提示词吗？”

用户4242

1月26日修改

原创宝玉宝玉宝玉AI2026年1月25日 07:55 美国

“说 skill 能做配图 prompt 不行。本来 skill 就是加载 md，没 skill 之前我们用 prompt 模板照样也是能做流程编排。”​

“现在大部分 skill 不就是长一点的提示词吗？为什么说'单纯靠提示词做不了'？”​

这些批评是对的。

我原文确实表达有问题。写“提示词”的时候，我下意识拿 Gem、Project、GPTs 里的那种提示词当例子。那些确实做不到一次性生成配图。​

但“提示词”是个很宽泛的概念。如果我把 SKILL.md 的内容复制出来发给 Claude Code，再给它一个生成图片的脚本，它一样能完成配图任务。​

这里的差异不在于提示词能不能复用，Gem 和 GPTs 里的提示词也能复用。 差异在于：提示词配套的是 ChatBot，还是 Agent？​

ChatBot 和 Agent 的核心区别

Skills 的完整名称叫 Agent Skills。注意这个“Agent”，它不是装饰词。Skills 利用 Agent 的虚拟机环境，提供单纯提示词无法实现的能力。​

一句话总结：ChatBot 只能对话，Agent 能动手干活。

具体来说：

ChatBot 不能调用工具。 你给它一段配图提示词，它能帮你分析文章、生成画图 prompt，但真要生成图片？它只能说“请把这段提示词复制到 Gemini”。剩下的活还是你干。​

Agent 能调用工具。 同样的配图任务，它能像个经验丰富的编辑一样自己完成：​

1.
读取你的文件​

2.
分析需要几张图、放哪里​

3.
为每张图设计内容和风格​

4.
调用画图模型生成图片​

5.
把图片插入正确位置​

6.
输出成品交到你手上​

全程自动化，你只需要验收。

那 Skill 到底是什么？

很多人把 Skill 理解成“一段很长的提示词”，这个理解对了一半。​

SKILL.md 的核心确实是指令文本。但 Skill 不止于此。

一个 Skill 可以包含三层内容：

第一层：元数据。 就是 name 和 description，告诉 Agent 这个 Skill 是干嘛的、什么时候该用。这部分在启动时就加载，但只占几十个 token。​

第二层：指令。 SKILL.md 的主体内容，工作流程、最佳实践、注意事项。只有 Agent 判断需要用这个 Skill 时，才会读取这部分。​

第三层：资源和代码。 附带的脚本、模板、参考文档。Agent 按需读取，用的时候才加载。​

“Skill 不就是长一点的提示词吗？”​