谷歌真·AI配音神器来了!自动看懂画面、对齐音频,能为任何视频生成无数音频(谷歌配音软件)

AIGC动态欢迎阅读

原标题:谷歌真·AI配音神器来了!自动看懂画面、对齐音频,能为任何视频

生成无数音频

关键字:音频,视频,提示,画面,模型

文章来源:智东西

内容字数:0字

内容摘要:

谷歌DeepMind发布最新AI视频自动配音工具,AI视频正式开启有声时代!

编译|陈骏达

编辑|程茜

智东西6月18日消息,今日凌晨,谷歌DeepMind发布了一个名为V2A(Video-to-Audio)的系统,能根据画面内容或者手动输入的提示词直接为视频配音。它还可以为任何视频输入生成无限数量的音轨。

谷歌DeepMindV2A系统最大的特点就是无需人工输入提示词也可以为视频配音。DeepMind在博客中称V2A能依靠自己的视觉能力理解视频中的像素。也就是说,V2A能看懂画面,知道画面里正在发生什么,应该出现什么声音。

▲谷歌DeepMind发布的V2A Demo视频

当然,V2A也能够根据提示词生成所需的音频。使用者可以通过输入“正面提示词”来引导模型输出所需的声音,或输入“负面提示词”来引导其避免出现不需要的声音,这给了使用者更大的控制权。

与其它AI音频生成工具不同,V2A在生成音频后无需人工对齐音频视频,而是可以直接自动将音频与画面对齐。

但谷歌DeepMind也承认,这一系统目前仍然存在很大的局限性。如果输入的视频质量不高,那么输出的音频质量也会出现明显的下降。他们认为

原文链接:谷歌真·AI配音神器来了!自动看懂画面、对齐音频,能为任何视频生成无数音频

联系作者

文章来源:智东西

作者微信:zhidxcom

作者简介:智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。

0
分享到:
没有账号? 忘记密码?