徐图智能徐东：文生视频创业，要用坚定信仰对抗 fomo 的大厂（徐图视频）

原标题：徐图智能徐东：文生视频

创业，要用坚定信仰对抗 fomo 的大厂

关键字：视频,模型,快手,科技,报告

文章来源：AI科技评论

内容字数：0字

不开源，文生视频模型仍是原子弹，而不是茶叶蛋。作者丨王悦

编辑丨陈彩娴

在 GPT-4 发布一年多后，OpenAI

推出 GPT-4o，是有史以来第一个真正实现「多模态输入—多模态输出」的多模态模型。

GPT-4o 的出现所传递的信息是：在底层模型并没有变得更智能的情况下，能够跨多种模态进行推理的模型必然是更加通用的。因为其不仅具备多种功能，还能以不同模态传递知识。

虽然具备了强大的多模态能力，但 GPT-4o 目前只可以接受文本、音频和图像/视频数据的任意组合作为输入，并生成文本、音频和图像作为输出，其中尚未涉及视频生成这一部分。其实，这也侧面证明了，视频生成是难啃的一块骨头。

即使是主打视频生成能力的 Sora 在今年发布后也尚未对外开放使用，其真正的技术稳定性仍然存疑，而国内则是处在闷头追赶 Sora 的技术研发期，各文生视频创业公司亦是把战力值加满，想在短暂的窗口期融到更多的钱来尽快在几个月内追赶上 Sora 的脚步。

「三个月内对齐到 Sora 的视频生成效果还是很难的，和 Sora 相比大家都还是在一个相对低的起跑线上，这样是个长期发力、急不得的事。」香港大学教授、欧洲科

文章来源：AI科技评论

作者微信：aitechtalk

作者简介：雷峰网旗下AI新媒体。聚焦AI前沿研究，关注AI工程落地。