LLM的范式转移:RL带来新的 Scaling Law(drm范式)

AIGC动态欢迎阅读

原标题:LLM的范式

转移:RL带来新的 Scaling Law

关键字:模型,报告,范式,领域,数据

文章来源:智猩猩AGI

内容字数:0字

内容摘要:

9月6-7日,智猩猩发起主办的2024全球AI芯片峰会将在北京辽宁大厦盛大举行。峰会设有开幕式、数据中心AI芯片专场、AI芯片架构创新专场、边缘/端侧AI芯片专场、智算集群技术论坛、Chiplet关键技术论坛、中国RISC-V计算芯片创新论坛。目前,终极议程已公布,50+位来自AI芯片、Chiplet、RISC-V、智算集群与AI Infra系统软件等领域的嘉宾,将带来报告、演讲、高端对话和圆桌Panel。扫码报名或购票~从几周前 Sam Altman 在 X 上发布草莓照片开始,整个行业都在期待OpenAI

发布新模型。根据 The information 的报道,Strawberry 就是之前的 Q-star,其合成数据的方法会大幅提升 LLM 的智能推理能力,尤其体现在数学解题、解字谜、代码生成等复杂推理任务。这个方法也会用在 GPT 系列的提升上,帮助 OpenAI 新一代 Orion。

OpenAI 不是唯一重视 RL 和 Self-Play 的公司,Google 用 AlphaGeometry 2 + Alphaproof 夺得 IMO 银牌之后,基于 LLM 做 rew

原文链接:LLM的范式转移:RL带来新的 Scaling Law

联系作者

文章来源:智猩猩AGI

作者微信:

作者简介:

0
分享到:
没有账号? 忘记密码?