国产多模态大模型开源!无条件免费商用,性能超Claude 3 Sonnet(国产模型哪家还活着)

AIGC动态欢迎阅读

原标题:国产多模态大模型

开源!无条件免费商用,性能超Claude 3 Sonnet

关键字:腾讯,模型,图像,场景,图表

文章来源:量子位

内容字数:2651字

内容摘要:

简曈发自 凹非寺量子位 | 公众号 QbitAI又一个国产多模态大模型开源!

XVERSE-V,来自元象,还是同样的无条件免费商用。

此前元象曾率先发布国内规模最大的开源大模型,如今开源家族系列又多了一个。

最新的多模态大模型支持任意宽高比图像输入,在主流评测中保持着效果领先——

在多项权威多模态评测中,XVERSE-V超过零一万物Yi-VL-34B、面壁智能OmniLMM-12B及深度求索DeepSeek-VL-7B等开源模型。

在综合能力测评MMBench中超过了谷歌GeminiProVision、阿里Qwen-VL-Plus和Claude-3V Sonnet等知名闭源模型。

支持任意长宽比图像输入传统的多模态模型的图像表示只有整体,XVERSE-V 采用了融合整体和局部的策略,支持输入任意宽高比的图像。

兼顾全局的概览信息和局部的细节信息,能够识别和分析图像中的细微特征,看的更清楚,理解的更准确

这样的处理方式使模型可以应用于广泛的领域,包括全景图识别、卫星图像、古文物扫描分析等。

△示例- 高清全景图识别△示例-图片细节文字识别除了基本能力表现不错,也能轻松应对各种不同的实际应

原文链接:国产多模态大模型开源!无条件免费商用,性能超Claude 3 Sonnet

联系作者

文章来源:量子位

作者微信:QbitAI

作者简介:追踪人工智能新趋势,关注科技行业新突破

0
分享到:
没有账号? 忘记密码?