今日arXiv最热大模型论文:港大&微软发布AgentGen提高大模型规划能力,8B模型接近GPT-4水平(港大eam)

AIGC动态欢迎阅读

原标题:今日arXiv最热大模型论文:港大&微软发布AgentGen提高大模型规划能力,8B模型接近GPT-4

水平

关键字:任务,环境,模型,能力,目标

文章来源:夕小瑶科技说

内容字数:0字

内容摘要:

夕小瑶科技说 原创作者 | Richard在大语言模型(LLM)问世之后,基于 LLM 的 Agent 引起了广泛的关注并且变得越来越流行。规划能力无论对人类还是 Agent 都是一个重要的决策步骤,规划的本质是通过预先设定的行动过程,以期望在未来达到特定的目标或者解决特定的问题。

规划是基于 LLM 的 Agent 一个关键的能力,涉及从初始状态达到预期目标的系统性过程。规划决定了 Agent 如何在复杂环境中自主操作,其中包括与环境交互、执行动作、考虑约束条件和可用资源等。

最近关于 Agent 训练的最新研究表明,通过使用轨迹数据(动作-观察对)序列对大模型进行微调可以增强其规划的能力。但是目前的工作主要集中于手动设计的规划任务和环境中的合成轨迹。

鉴于此,港大联合微软提出 AgentGen 框架,对自动合成多样化环境和从简单到困难的渐进规划任务进行探索。AgentGen 框架利用 LLM 生成多样化环境和规划任务,采用基于启发式规则构建的语料库和 BO-EVOL 方法提升任务难度多样性。

AgentGen 极大提高了 LLM 的规划能力,AgentGen指令微调的 Llama-

原文链接:今日arXiv最热大模型论文:港大&微软发布AgentGen提高大模型规划能力,8B模型接近GPT-4水平

联系作者

文章来源:夕小瑶科技说

作者微信:

作者简介:

0
分享到:
没有账号? 忘记密码?