在搭建 Agent 时,实现其反思与改进可以从以下几个方面考虑:
规划方面:
子目标分解:将大型任务分解为较小可管理的子目标,以便更有效地处理复杂任务。 反思与改进:对过去的行动进行自我批评和自我反思,从错误中学习并改进未来的步骤,从而提高最终结果的质量。记忆方面:
短期记忆:将所有的上下文学习看成是利用模型的短期记忆来学习。 长期记忆:通过利用外部的向量存储和快速检索来存储和召回信息,为 Agent 提供长期存储和召回信息的能力。工具使用方面: Agent 学习调用外部 API 来获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。