视觉AI的「Foundation Model」,已经发展到哪一步?丨CVPR 2024现场直击(视觉 transformer 目标替换)

AIGC动态欢迎阅读

原标题:视觉

AI的「Foundation Model」,已经发展到哪一步?丨CVPR 2024现场直击

关键字:模型,视觉,数据,报告,快手

文章来源:大数据文摘

内容字数:0字

内容摘要:

大数据文摘授权转载自AI科技评论

作者:房晓楠

编辑:陈彩娴

2024 年美国时间 6 月 17 日至 21 日,IEEE 国际计算机视觉与模式识别会议(CVPR)在美国西雅图召开。

如大家预料,视觉 Foundation Model 成为今年 CVPR 除自动驾驶、3D 视觉等传统研究课题以外的核心会议主题。

此外,由于会议召开前后,国内快手「可灵」开放图生视频功能火爆出圈、Runway 时隔一年推出新模型 Gen-3 Alpha,文生视频也成为 CVPR 2024 的一大热词。

今年, CVPR 的两篇最佳论文都颁给了 AIGC。从论文接收数量的角度看,图像和视频合成与生成(Image and video synthesis and generation)以329 篇论文成功占据榜首。而文生视频也属于视觉 Foundation Model 的研究讨论范畴。

事实上,Foundation Model 在人工智能领域的最早出圈就是在计算机视觉领域。

2021 年 8 月,斯坦福大学百位学者联名发表 Foundation Model 综述,作者队列里就有多位计算机视觉领域的翘楚,如李飞飞

原文链接:视觉AI的「Foundation Model」,已经发展到哪一步?丨CVPR 2024现场直击

联系作者

文章来源:大数据文摘

作者微信:BigDataDigest

作者简介:普及数据思维,传播数据文化

0
分享到:
没有账号? 忘记密码?