视觉AI的「Foundation Model」，已经发展到哪一步？丨CVPR 2024现场直击（视觉 transformer 目标替换）

原标题：视觉

AI的「Foundation Model」，已经发展到哪一步？丨CVPR 2024现场直击

关键字：模型,视觉,数据,报告,快手

文章来源：大数据文摘

内容字数：0字

大数据文摘授权转载自AI科技评论

作者：房晓楠

编辑：陈彩娴

2024 年美国时间 6 月 17 日至 21 日，IEEE 国际计算机视觉与模式识别会议（CVPR）在美国西雅图召开。

如大家预料，视觉 Foundation Model 成为今年 CVPR 除自动驾驶、3D 视觉等传统研究课题以外的核心会议主题。

此外，由于会议召开前后，国内快手「可灵」开放图生视频功能火爆出圈、Runway 时隔一年推出新模型 Gen-3 Alpha，文生视频也成为 CVPR 2024 的一大热词。

今年， CVPR 的两篇最佳论文都颁给了 AIGC。从论文接收数量的角度看，图像和视频合成与生成（Image and video synthesis and generation）以329 篇论文成功占据榜首。而文生视频也属于视觉 Foundation Model 的研究讨论范畴。

事实上，Foundation Model 在人工智能领域的最早出圈就是在计算机视觉领域。

2021 年 8 月，斯坦福大学百位学者联名发表 Foundation Model 综述，作者队列里就有多位计算机视觉领域的翘楚，如李飞飞

原文链接：视觉AI的「Foundation Model」，已经发展到哪一步？丨CVPR 2024现场直击

文章来源：大数据文摘

作者微信：BigDataDigest

作者简介：普及数据思维，传播数据文化