三「模」联盟,谷歌DeepMind缔造终身学习智能体!(三模有用吗)

AIGC动态欢迎阅读

原标题:三「模」联盟,谷歌DeepMind缔造终身学习智能

体!

关键字:智能,任务,模型,经验,高效

文章来源:新智元

内容字数:0字

内容摘要:

新智元报道编辑:桃子

【新智元导读】打造终身学习智能体,是研究界以来一直追求的目标。最近,帝国理工联手谷歌DeepMind打造了创新联合框架扩散增强智能体(DAAG),利用LLM+VLM+DM三大模型,让AI完成迁移学习、高效探索。为了让AI实现终身学习,帝国理工、谷歌DeepMind竟动用了三大基础模型!

「大模型+视觉语言模型+扩散模型」三模并用,构建了全新框架——扩散增强智能体(DAAG)。

DAAG的诞生,就是让具身智能体进行迁移学习、高效探索。

最新框架利用了「后见之明经验增强」(Hindsight Experience Augmentation)技术,让扩散模型以时间和几何一致的方式转换视频。

让其与目标指令对齐,从而对智能体过去经验进行重新标记。

论文地址:https://arxiv.org/pdf/2407.20798

大模型在无需人类监督情况下,自主协调这一过程,使其非常适合终身学习场景。

经过一系列实验,结果表明,DAAG改进了奖励检测器的学习、过去经验的迁移以及新任务的获取。

这些都是开发高效终身学习智能体的关键能力。

‍无需人类监督,AI终身强化学习一直以来,

原文链接:三「模」联盟,谷歌DeepMind缔造终身学习智能体!

联系作者

文章来源:新智元

作者微信:

作者简介:

0
分享到:
没有账号? 忘记密码?