ReAct架构的核心是其“思想-行动-观察”(Thought-Action-Observation)的交错循环 。在此范式下,LLM不再是单纯地生成答案,而是扮演了一个中央控制器的角色 。首先,Agent通过“思想”(Thought)来分析任务、制定高层计划、分解子任务或处理异常情况。接着,它将思想转化为“行动”(Action),即调用外部工具,如搜索引擎、计算器或API 。当工具执行完毕后,Agent获得环境返回的“观察”(Observation),并利用这些新信息来指导下一轮的“思想”和“行动”,如此循环,直到任务完成 。