Agents学习调用外部 API 来获取模型权重中缺失的额外信息(通常在预训练后很难更改),包括当前信息、代码执行能力、对专有信息源的访问等。
图 1. LLM 驱动的自主Agents系统概述
第一部分:规划
一项复杂的任务通常涉及许多步骤。Agents需要知道这些步骤并提前进行规划。
任务分解
思想链(CoT; Wei et al. 2022)已成为增强复杂任务模型性能的标准提示技术。该模型被指示“一步一步思考”,以利用更多的测试时间计算将困难任务分解为更小、更简单的步骤。CoT 将大任务转化为多个可处理的任务,并对模型思考过程进行了解释。
思想树(Tree of Thoughts,Yao et al. 2023)通过在每一步探索多种推理可能性来扩展 CoT。它首先将问题分解为多个思考步骤,并在每个步骤中生成多个思考,从而创建树结构。搜索过程可以是 BFS(广度优先搜索)或 DFS(深度优先搜索),每个状态由分类器(通过提示)或多数投票进行评估。
任务分解可以通过以下方式进行:
•
(1) 通过 LLM 进行简单提示,如"Steps for XYZ.\n1."、"What are the subgoals for achieving XYZ?"
•
(2) 通过使用特定于任务的指令,例如,"Write a story outline."用于写小说
•
或 (3) 人工输入
另一种截然不同的方法是LLM+P(Liu et al. 2023),它依赖于外部的经典规划器来进行长期规划。这种方法利用规划领域定义语言(Planning Domain Definition Language,PDDL)作为中间接口来描述规划问题。