AIGC动态欢迎阅读
大崩溃!牛津剑桥最新研究,登上Nature发警告
关键字:模型,数据,误差,样本,偏差文章来源:夕小瑶科技说
内容字数:0字内容摘要:
夕小瑶科技说 原创作者 | 谷雨龙泽我们都知道,AI大模型是需要现成的数据来训练,只有喂给AI大量的数据,AI才能“学富五车”。为此,不少AI模型在研发的时候,特别注重数据的数量以及质量——就好比上学的时候老师告诉你们,读书要读名著,不能读乱七八糟的东西是一个道理。
但是学着学着,人们发现了——AI的学习速度太快了,如果有一天,AI把所有现成的数据都学完了怎么办?
于是有人提出来了一个“好点子”——用AI自己生成的数据来喂给AI(事实上,现在AI生成的数据已经无孔不入,AI如果自己上网查资料学习,说不定吸收的就是AIGC)。
是不是感到兴奋了?是不是一下子放轻松了?
先别着急开香槟。近日,一群来自牛津、剑桥等的研究者在《Nature》上发表了一篇文章,提出了一个值得警惕的观点:
如果用AI生成的数据来训练AI,AI模型会“崩溃”掉!
论文标题:《AI models collapse when trained on recursively generated data》
论文链接:https://www.nature.com/articles/s41586-024-07566-y
“模型原文链接:AI数据训AI,引发模型大崩溃!牛津剑桥最新研究,登上Nature发警告
联系作者
文章来源:夕小瑶科技说
作者微信:
作者简介: