开源视频版GPT-4o?快速记忆,实时问答,拿下CVPR24长视频问答竞赛冠军(开源视频格式)

AIGC动态欢迎阅读

原标题:开源视频GPT-4o?快速记忆

,实时问答,拿下CVPR24长视频问答竞赛冠军

关键字:字节跳动,视频,模型,记忆,能力

文章来源:机器之心

内容字数:0字

内容摘要:

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com张颢继:清华大学本科生,师从唐彦嵩老师,主要研究方向为视频理解。

王逸钦:清华大学深圳研究生院硕士生,师从唐彦嵩老师,主要研究方向为多模态学习。

唐彦嵩博士:清华大学深圳研究生院助理教授,主要研究方向为视频理解与 3D 生成。

刘镛:清华大学深圳研究生院博士生,师从唐彦嵩老师,主要研究方向为视觉分割、视频理解。

冯佳时博士:字节跳动视觉研究的负责人,他的研究领域包括深度学习及其在计算机视觉中的应用。

代季峰博士:清华大学电子工程系副教授,主要研究方向为视觉基础模型与自动驾驶。

项目 Leader,靳潇杰博士:现就职于字节跳动美国研究院,研究方向包括多模态基础模型、生成式学习、视频编辑等。

基于 ChatGPT、LLAMA、Vicuna [1, 2, 3] 等大

原文链接:开源视频版GPT-4o?快速记忆,实时问答,拿下CVPR24长视频问答竞赛冠军

联系作者

文章来源:机器之心

作者微信:almosthuman2014

作者简介:专业的人工智能媒体和产业服务平台

0
分享到:
没有账号? 忘记密码?