清华系出手,推出全面对标Sora的视频大模型(模式识别清华大学课后题答案)

AIGC动态欢迎阅读

原标题:清华系出手,推出全面对标Sora的视频模型关键字:视频,字节跳动,模型,镜头,架构

文章来源:智东西

内容字数:5278字

内容摘要:

中国首个长时长、高一致性、高动态性视频大模型Vidu发布。

作者|ZeR0

编辑|漠影

智东西4月27日报道,在今日举行的2024中关村论坛人工智能主题日未来人工智能先锋论坛上,清华大学教授、生数科技首席科学家朱军宣布,生数科技与清华大学联合推出中国首个原创全自研长时长、高一致性、高动态性的视频大模型Vidu。

根据公开融资信息,成立于去年3月的生数科技,是当前主要国内累计融资额及估值最高的类Sora创企,迄今已完成数亿元融资,投资方包括百度风投、智谱AI、蚂蚁集团以及创始成员多数来自于原字节跳动投资团队的锦秋基金。

朱军现场展示了Vidu与Pika、Gen-2、Sora等行业现有文生视频大模型的生成视频效果对比。他评价说,Vidu在16秒长期保持和语义理解等方面表现得非常突出。

▲使用相同提示词,Vidu与Pika、Gen-2生成视频对比

▲使用相同提示词,Vidu与Sora生成视频对比

▲Vidu生成视频的部分动图

Vidu能根据文本描述直接生成16秒高质量视频,且生成视频流畅连贯,没有明显的插帧现象。据介绍,这是因为Vidu采用的是“一步到位”的生成方式,与Sora一样,文本到视

原文链接:清华系出手,推出全面对标Sora的视频大模型

联系作者

文章来源:智东西

作者微信:zhidxcom

作者简介:智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。

0
分享到:
没有账号? 忘记密码?