Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功

AIGC动态欢迎阅读

原标题:Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功

关键字:报告,企鹅,视频,模型,文本

文章来源:人工智能学家

内容字数:0字

内容摘要:

来源:机器学习研究组订阅

毫无预兆地,Meta版Sora——Movie Gen,就在刚刚抢先上线了!

Meta将其称为「迄今最先进的媒体基础模型」。

全新上线的大杀器Movie Gen Video,是一个30B参数的Transformer模型,可以从单个文本提示,生成高质量的高清图像和视频,视频为1080P、16秒、每秒16帧。一同推出的还有Movie Gen Audio。这是一个13B参数的Transformer模型。通过视频输入和文本提示,它就可以可控性生成和视频同步的高保真音频,时长最长45秒。

最惊人的是,这次Meta一并连论文都发布了。

论文中,详细介绍了Movie Gen的架构、训练方法和实验结果。

论文地址:https://ai.meta.com/static-resource/movie-gen-research-paper/?utm_source=twitter&utm_medium=organic_social&utm_content=thread&utm_campaign=moviegen

从论文可以看出,Movie Gen Video沿用了Transformer

原文链接:Meta版Sora深夜横空出世,小扎放出16秒高清大片!92页论文曝光技术细节,Llama 3架构立功

联系作者

文章来源:人工智能学家

作者微信:

作者简介:

0
分享到:
没有账号? 忘记密码?