欧洲名将 Mistral 发布首个多模态模型,12B 开源下载,黄仁勋站台(欧洲历史十大名将)

AIGC动态欢迎阅读

原标题:欧洲名将 Mistral 发布首个多模态模型

,12B 开源下载,黄仁勋站台

关键字:报告,模型,图像,基准,图表

文章来源:Founder Park

内容字数:0字

内容摘要:

法国 AI 初创 Mistral AI,又扔出一条磁力链炸场了。

这次,与以往不同的是,他们发布了首个多模态模型 Pixtral 12B,集语言、视觉能力于一身。

这意味着,Mistral AI 正式跨界 MMML,开启多模态 AI 新时代,同时向OpenAI

、Anthropic 等劲敌发起挑战。

多模态 Pixtral 12B,是基于文本模型 Nemo 12B 完成训练。

GPT-4

o、Claude 类似,只需上传一张图、提供一个链接,模型就能根据提示回答问题。它不仅能够识别复杂手写笔记,还能看懂数学公式、图表等等。

在多项基准测试(文本、指令跟随、多模态)中,新模型性能大幅超越 Qwen2 7B、Phi-3 Vision 开源模型。

Hugging Face 技术负责人发现此处列举的 Qwen 的数据问题很大

相较于闭源模型,Pixtral 12B 在图表问答、文档问答、视觉数学推理、大学水平多学科等基准中,性能碾压 Claude3 Haiku、Gemini 1.5 8B。

除了大约 24GB 的磁力链,模型代码还可在 HuggingFace、GitHub 下载。(由社区开发

原文链接:欧洲名将 Mistral 发布首个多模态模型,12B 开源下载,黄仁勋站台

联系作者

文章来源:Founder Park

作者微信:

作者简介:

0
分享到:
没有账号? 忘记密码?