微软发布Phi-3，性能超Llama-3，可手机端运行（微软bibg）

AIGC动态欢迎阅读

原标题：微软

发布Phi-3，性能超Llama-3，可手机端运行

关键字：模型,报告,微软,数据,基准

文章来源：机器之心

内容字数：3522字

内容摘要：

机器之心报道

编辑：小舟、泽南数据已成为提升大模型能力的重点。Llama-3 刚发布没多久，竞争对手就来了，而且是可以在手机上运行的小体量模型。

本周二，微软发布了自研小尺寸模型 Phi-3。

新模型有三个版本，其中 Phi-3 mini 是一个拥有 38 亿参数的语言模型，经过 3.3 万亿 token 的训练，其整体性能在学术基准和内部测试上成绩优异。

尽管 Phi-3 mini 被优化至可部署在手机上，但它的性能可以与 Mixtral 8x7B 和 GPT-3.5 等模型相媲美。微软表示，创新主要在于用于训练的数据集。与此同时，Phi-3 与 Llama-2 使用相同的架构，方便开源社区在其基础上开发。此前，微软的 Phi 系列模型曾经引发了人们的热议，去年 6 月，微软发布了《Textbooks Are All You Need》论文，用规模仅为 7B token 的「教科书质量」数据训练 1.3B 参数的模型 phi-1，实现了良好的性能。

去年 9 月，微软进一步探索这条道路，让 1.3B 参数的 Transformer 架构语言模型 Phi-1.5 显示出强大的编码能力。

原文链接：微软发布Phi-3，性能超Llama-3，可手机端运行