ReWOO（Reason WithOut Observation）

March 22, 2025

Content #

论文《ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models》提出了 ReWOO 思想，即如果大模型能一次性的把所有步骤都告诉人类，人类把每个步骤对应的工具调用结果一次性返回给大模型，不就可以只提问一次就解决问题了吗？

ReWOO 用了两个大模型，其中一个叫 Planner，另一个叫 Solver。当人类提出问题时，Planner 会直接规划出问题的解决步骤，以及每一步需要调什么工具，形成一个模板，返回给人类。例如：

我需要调用 A 工具，工具调用结果为：
我需要调用 B 工具，工具调用结果为：
我需要调用 C 工具，工具调用结果为：

人类可根据模板，调用工具后，填充，然后发送给 Solver 大模型，由 Solver 大模型给出最终答案。

这样就避免了，每解决一个小问题，都要带上历史对话反馈一次，极大地节省了 token。

Viewpoints #

From #

03｜Agent的常见推理模式：CoT、ReAct、Reflexion究竟是什么？-AI 重塑云原生应用开发实战-极客时间

ReWOO（Reason WithOut Observation）

Content #

Viewpoints #

From #

Links #