清华系出手，推出全面对标Sora的视频大模型（模式识别清华大学课后题答案）

原标题：清华系出手，推出全面对标Sora的视频大模型关键字：视频,字节跳动,模型,镜头,架构

文章来源：智东西

内容字数：5278字

中国首个长时长、高一致性、高动态性视频大模型Vidu发布。

作者|ZeR0

编辑|漠影

智东西4月27日报道，在今日举行的2024中关村论坛人工智能主题日未来人工智能先锋论坛上，清华大学教授、生数科技首席科学家朱军宣布，生数科技与清华大学联合推出中国首个原创全自研长时长、高一致性、高动态性的视频大模型Vidu。

根据公开融资信息，成立于去年3月的生数科技，是当前主要国内累计融资额及估值最高的类Sora创企，迄今已完成数亿元融资，投资方包括百度风投、智谱AI、蚂蚁集团以及创始成员多数来自于原字节跳动投资团队的锦秋基金。

朱军现场展示了Vidu与Pika、Gen-2、Sora等行业现有文生视频大模型的生成视频效果对比。他评价说，Vidu在16秒长期保持和语义理解等方面表现得非常突出。

▲使用相同提示词，Vidu与Pika、Gen-2生成视频对比

▲使用相同提示词，Vidu与Sora生成视频对比

▲Vidu生成视频的部分动图

Vidu能根据文本描述直接生成16秒高质量视频，且生成视频流畅连贯，没有明显的插帧现象。据介绍，这是因为Vidu采用的是“一步到位”的生成方式，与Sora一样，文本到视

文章来源：智东西

作者微信：zhidxcom

作者简介：智能产业新媒体！智东西专注报道人工智能主导的前沿技术发展，和技术应用带来的千行百业产业升级。聚焦智能变革，服务产业升级。