三「模」联盟，谷歌DeepMind缔造终身学习智能体！（三模有用吗）

原标题：三「模」联盟，谷歌DeepMind缔造终身学习智能

体！

文章来源：新智元

内容字数：0字

新智元报道编辑：桃子

【新智元导读】打造终身学习智能体，是研究界以来一直追求的目标。最近，帝国理工联手谷歌DeepMind打造了创新联合框架扩散增强智能体（DAAG），利用LLM+VLM+DM三大模型，让AI完成迁移学习、高效探索。为了让AI实现终身学习，帝国理工、谷歌DeepMind竟动用了三大基础模型！

「大模型+视觉语言模型+扩散模型」三模并用，构建了全新框架——扩散增强智能体（DAAG）。

DAAG的诞生，就是让具身智能体进行迁移学习、高效探索。

最新框架利用了「后见之明经验增强」（Hindsight Experience Augmentation）技术，让扩散模型以时间和几何一致的方式转换视频。

让其与目标指令对齐，从而对智能体过去经验进行重新标记。

论文地址：https://arxiv.org/pdf/2407.20798

大模型在无需人类监督情况下，自主协调这一过程，使其非常适合终身学习场景。

经过一系列实验，结果表明，DAAG改进了奖励检测器的学习、过去经验的迁移以及新任务的获取。

这些都是开发高效终身学习智能体的关键能力。

‍无需人类监督，AI终身强化学习一直以来，

文章来源：新智元

作者微信：

作者简介：