AWS AI Labs|基于组合扩散模型的数据保护训练(aws百科)

Training Data Protection with Compositional Diffusion Models

Aditya Golatkar, Alessandro Achille, Ashwin Swaminathan, Stefano Soatto

[AWS AI Labs]

基于组合扩散模型的数据保护训练

动机:随着扩散模型在生成图像等方面的应用越来越广泛,如何保护大规模训练数据的问题变得越来越重要。这包括限制训练样本的影响、移除错误包含在训练中的样本的影响,以及防止模型记忆和生成与训练数据相似的样本等。 方法:提出Compartmentalized Diffusion Models(CDM),一种训练不同扩散模型(或提示)在不同数据源上,并在推理时任意组合它们的方法。每个模型只包含其在训练期间接触到的数据子集的信息,从而实现了多种形式的训练数据保护。 优势:CDM是首个能实现大规模扩散模型的选择性遗忘和持续学习的方法,同时还允许根据用户的访问权限提供定制的模型。此外,CDM还可以确定生成特定样本时数据子集的重要性。

提出一种新的扩散模型,即Compartmentalized Diffusion Models(CDM),可以在不同的数据源上独立训练,在推理时进行组合,从而实现了对训练数据的保护,其性能与同时在所有数据上训练的模型相当。

https://arxiv.org/abs/2308.01937 

AWS AI Labs|基于组合扩散模型的数据保护训练AWS AI Labs|基于组合扩散模型的数据保护训练

0
分享到:
没有账号? 忘记密码?