10人明星团队炼出首个微调Llama 3.1 405B！角色扮演一秒入戏，代码全开源（明星的微调是什么）

原标题：10人明星团队炼出首个微调Llama 3.1 405B！角色扮演一秒入戏，代码全开源

文章来源：新智元

内容字数：0字

新智元报道编辑：编辑部

【新智元导读】发布40天后，最强开源模型Llama 3.1 405B等来了微调版本的发布。但不是来自Meta，而是一个专注于开放模型的神秘初创Nous Research。Llama 3.1的405B模型终于等来了首个微调版本！

这个模型名为Hermes 3，来自初创公司Nous Research，是一个相当小型且低调的团队。

虽然公司低调，但技术实力相当强悍。Hermes系列已经微调了Mistral、Yi、Llama等多个开源模型，下载量超过3300万次。

跟着模型一起发布的，还有完整的技术报告和博客，Lambda Chat也同时在聊天界面中集成了模型。

从技术报告和博客来看，Nous Research的这次微调颇有成效，在使用了FP8量化后还能保持相当水准的模型性能。

这种优化有效地将模型的VRAM和磁盘需求降低了约50%，使其能够在单个节点上运行，方便更多开发者部署使用。

除此之外，SFT和DPO的微调过程经过了专门设计，让模型的对话能力和指令遵循能力大大增强，擅长复杂的角色扮演和创意写作。

除了创造力，Hermes 3还扩展出了函数调用、分步推理等智能体

原文链接：10人明星团队炼出首个微调Llama 3.1 405B！角色扮演一秒入戏，代码全开源

文章来源：新智元

作者微信：

作者简介：