10行代码让大模型数学提升20%，“野路子”研究谷歌也测上了，主要作者全靠自学成才（10行代码完成安卓USB串口通信1:核心代码）

原标题：10行代码让大模型

数学提升20%，“野路子”研究谷歌也测上了，主要作者全靠自学成才

关键字：概率,模型,创意,阈值,方法

文章来源：量子位

内容字数：0字

克雷西发自凹非寺量子位 | 公众号 QbitAI只要不到10行代码，就能让大模型数学能力（GSM8k）提升20%！

几名独立学者提出了大模型采样的改进方案，引起了开源社区的关注。

目前该方法已在Mistral-7B上取得成效，在Llama3-70B上的测试也正在进行。

这种方法叫做最小p采样（min-p sampling），目的是平衡生成文本的连贯性和多样性。

简单说就是让模型在不同场合发挥不同的特性，例如在事实问题上保持性能稳定，在写作等场景中又能发挥创意。

目前该方法已在Mistral-7B上取得成效，在Llama-70B上的测试也即将进行。

在论文中作者提到，该方法已经获得了开源社区的广泛应用。

同时作者还透露，Anthropic和谷歌等闭源模型厂商也已经或正在针对min-p进行测试。

消息也得到了谷歌方面的确认，从OpenAI

跳槽到谷歌的开发者社区负责人Logan Kilpatrick已经回复说“On it”（在做了）。

微软Copilot的研究人员Abram Jackson看了后表示，这是他看到的首个有关推理过程token采样的改进，未来还有很大进步空间。

值得一提的是，

原文链接：10行代码让大模型数学提升20%，“野路子”研究谷歌也测上了，主要作者全靠自学成才

文章来源：量子位

作者微信：

作者简介：