LLM的范式转移：RL带来新的 Scaling Law（drm范式）

AIGC动态欢迎阅读

原标题：LLM的范式

转移：RL带来新的 Scaling Law

文章来源：智猩猩AGI

内容字数：0字

内容摘要：

9月6-7日，智猩猩发起主办的2024全球AI芯片峰会将在北京辽宁大厦盛大举行。峰会设有开幕式、数据中心AI芯片专场、AI芯片架构创新专场、边缘/端侧AI芯片专场、智算集群技术论坛、Chiplet关键技术论坛、中国RISC-V计算芯片创新论坛。目前，终极议程已公布，50+位来自AI芯片、Chiplet、RISC-V、智算集群与AI Infra系统软件等领域的嘉宾，将带来报告、演讲、高端对话和圆桌Panel。扫码报名或购票～从几周前 Sam Altman 在 X 上发布草莓照片开始，整个行业都在期待OpenAI

发布新模型。根据 The information 的报道，Strawberry 就是之前的 Q-star，其合成数据的方法会大幅提升 LLM 的智能推理能力，尤其体现在数学解题、解字谜、代码生成等复杂推理任务。这个方法也会用在 GPT 系列的提升上，帮助 OpenAI 新一代 Orion。

OpenAI 不是唯一重视 RL 和 Self-Play 的公司，Google 用 AlphaGeometry 2 + Alphaproof 夺得 IMO 银牌之后，基于 LLM 做 rew

原文链接：LLM的范式转移：RL带来新的 Scaling Law