OpenAI推出了更快更便宜的GPT-4o mini,人人可免费使用(openai是哪个公司的)

今天起,ChatGPT 进入了新的「4」时代。

就在刚刚,OpenAI 官宣推出 GPT-3.5 Turbo 的替代品——GPT-4o mini,顾名思义,这是 GPT-4o 更小参数量的简化版本。

即日起,ChatGPT 的免费用户、Plus 用户和 Team 用户都可以使用 GPT-4o mini。下周,企业版客户也将获得使用 GPT-4o mini 的权限。

OpenAI 官方表示,「这一变化符合我们让所有用户都能享受到 AI 技术好处的目标。」

OpenAI推出了更快更便宜的GPT-4o mini,人人可免费使用。_图1

主打低成本和快速响应能力的 GPT-4o mini 适用于多种应用场景。

例如,它可以支持需要连续或同时调用多个模型的应用程序,如同时调用多个 API,能够处理大量上下文信息,如完整的代码库或对话记录,以及通过快速实时的文本回复与客户进行互动,如客户服务聊天机器人。

具体来说,GPT-4o mini 目前在 API 中提供了文本和图像处理功能,后续还将逐步增加对视频和音频的支持。

该模型具备处理长达 128,000 个标记的长上下文能力,其知识库截至日期为 2023 年 10 月,并且在处理非英文内容时表现更加友好。

OpenAI推出了更快更便宜的GPT-4o mini,人人可免费使用。_图2

ChatGPT 截图

从 OpenAI 分享的基准测试结果来看,GPT-4o mini 在推理基准结果 MMLU 上得分为 82%,而 Gemini Flash 为 77.9%,此前主打极高性价比的ClaudeHaiku 为 73.8%。

GPT-4o mini 在数学推理和编程任务方面展现出了优异的表现,远超过市场上其他小型模型。

在 MGSM 数学推理能力基准测试中,GPT-4o mini 的数学推理得分为 87.0%,而 Gemini Flash 的得分为 75.5%,Claude Haiku 的得分为 71.7%。

GPT-4o mini 在 HumanEval 基准测试中再次表现优异,取得了87.2%的高分,而 Gemini Flash 的得分为71.5%,Claude Haiku 的得分则为75.9%。

OpenAI推出了更快更便宜的GPT-4o mini,人人可免费使用。_图3

而在多模态推理 MMMU 中,GPT-4o mini 也表现出色,得分为 59.4%,而 Gemini Flash 得分为 56.1%,Claude Haiku 得分为 50.2%。

尤为显眼的是,GPT-三点五 Turbo 在这些基准测试中的得分均不如 GPT-四零 mini,甚至可以说被全面碾压。此外,GPT-四零 mini 在大模型盲测竞技场 LMSYS 中的表现也要优于 GPT-四T 01-25。

除了性能上的增强,GPT-4o mini 也以价格优势出现,为 API 市场带来了一些小小的震撼。@ArtificialAnlys 在 X 上发布了一些模型的价格对比,足以看出其价位水平:

OpenAI推出了更快更便宜的GPT-4o mini,人人可免费使用。_图4

OpenAI 表示,GPT-4o mini 现在可在 Assistant API、Chat Completions API 和 Batch API 中作为文本和视觉模型使用。

GPT-4o mini 每100 万输入 token 价格为 15 美分,每 100 万输出 token 价格为 60 美分,比 GPT-3.5 Turbo 便宜超过 60%。

也就是说,GPT-4o mini 生成一本 2500 页的书,价格只需要 60 美分。

对于 GPT-4o mini 的到来,OpenAI CEO Sam Altman 在 X 平台发文感慨:

回顾 2022 年,当时世界上最先进的模型是 text-davinci-003。与现在的新模型相比,它的性能要差得多。而且,它的使用成本比现在的新模型高出 100 倍。

OpenAI推出了更快更便宜的GPT-4o mini,人人可免费使用。_图5

另外,鉴于模型的安全性问题,OpenAI还邀请了70多位来自社会心理学和错误信息研究等领域的专家对GPT-4o的潜在风险进行了测试并根据反馈结果进行改进。

同时基于这些经验,OpenAI 还采用一些新的技术来增强对 GPT-4o mini 越狱攻击等防御能力,使其在大规模应用中更加安全,也更加稳定可靠。

今年以来,国内外掀起了新一轮大模型价格战,但没想到的是,OpenAI 也用响应速度更快、成本更低的 GPT-4o mini 模型加入了本就乱成一锅粥的战局。

OpenAI推出了更快更便宜的GPT-4o mini,人人可免费使用。_图6

Altman 进一步将其描述为「towards intelligence too cheap to meter」。

作为 GPT-3.5 Turbo 的免费替代品,GPT-4o mini 在性能方面也没有落后,甚至比同等级的 Claude 3 Haiku 和 Gemini 1.5 Flash 还要出色。很多用户在试用之后也纷纷表示赞赏。

值得一提的是,关于我们心心念念的 GPT-40 语音模式,Altman 也透露将在本月晚些时候到来,届时 APPSO 将第一时间跟进。

0
分享到:
没有账号? 忘记密码?