【标题】AnyMorph: Learning Transferable Polices By Inferring Agent Morphology
【作者团队】Brandon Trabucco, Mariano Phielipp, Glen Berseth
【发表日期】2022.6.17
【论文链接】https://arxiv.org/pdf/2206.12279.pdf
【推荐理由】强化学习的典型方法包括针对每一种新形态从零开始为特定智能体量身定制的训练策略。最近的工作旨在通过研究在具有类似任务目标的多个智能体上训练的形态不可知策略是否可以在无需再训练的情况下转移到具有未知形态的新智能体上,从而消除策略的再训练。这是一个具有挑战性的问题,需要以前的方法使用手工设计的新试剂形态描述。本文提出了一种数据驱动的方法,直接从强化学习目标学习形态学的表示,而不是手工设计这种描述。本文的算法是第一个强化学习算法,它可以训练一个策略来推广到新的智能体形态,而不需要预先描述智能体的形态。作者在智能体不可知控制的标准基准上评估了提出的方法,并在新智能体的零触发泛化方面改进了当前的技术状态。重要的是,本文的方法在没有明确描述形态学的情况下获得了良好的性能。