微软发布Phi-3,性能超Llama-3,可手机端运行(微软bibg)

AIGC动态欢迎阅读

原标题:微软

发布Phi-3,性能超Llama-3,可手机端运行

关键字:模型,报告,微软,数据,基准

文章来源:机器之心

内容字数:3522字

内容摘要:

机器之心报道

编辑:小舟、泽南数据已成为提升大模型能力的重点。Llama-3 刚发布没多久,竞争对手就来了,而且是可以在手机上运行的小体量模型。

本周二,微软发布了自研小尺寸模型 Phi-3。

新模型有三个版本,其中 Phi-3 mini 是一个拥有 38 亿参数的语言模型,经过 3.3 万亿 token 的训练,其整体性能在学术基准和内部测试上成绩优异。

尽管 Phi-3 mini 被优化至可部署在手机上,但它的性能可以与 Mixtral 8x7B 和 GPT-3.5 等模型相媲美。微软表示,创新主要在于用于训练的数据集。与此同时,Phi-3 与 Llama-2 使用相同的架构,方便开源社区在其基础上开发。此前,微软的 Phi 系列模型曾经引发了人们的热议,去年 6 月,微软发布了《Textbooks Are All You Need》论文,用规模仅为 7B token 的「教科书质量」数据训练 1.3B 参数的模型 phi-1,实现了良好的性能。

去年 9 月,微软进一步探索这条道路,让 1.3B 参数的 Transformer 架构语言模型 Phi-1.5 显示出强大的编码能力。

原文链接:微软发布Phi-3,性能超Llama-3,可手机端运行

联系作者

文章来源:机器之心

作者微信:almosthuman2014

作者简介:专业的人工智能媒体和产业服务平台

0
分享到:
没有账号? 忘记密码?