Content #
论文《ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models》提出了 ReWOO 思想,即如果大模型能一次性的把所有步骤都告诉人类,人类把每个步骤对应的工具调用结果一次性返回给大模型,不就可以只提问一次就解决问题了吗?
ReWOO 用了两个大模型,其中一个叫 Planner,另一个叫 Solver。当人类提出问题时,Planner 会直接规划出问题的解决步骤,以及每一步需要调什么工具,形成一个模板,返回给人类。例如:
我需要调用 A 工具,工具调用结果为:
我需要调用 B 工具,工具调用结果为:
我需要调用 C 工具,工具调用结果为:
人类可根据模板,调用工具后,填充,然后发送给 Solver 大模型,由 Solver 大模型给出最终答案。
这样就避免了,每解决一个小问题,都要带上历史对话反馈一次,极大地节省了 token。
Viewpoints #
From #
03|Agent的常见推理模式:CoT、ReAct、Reflexion究竟是什么?-AI 重塑云原生应用开发实战-极客时间