《Python 机器学习》作者新作：从头开始构建大型语言模型，代码已开源（python编程）

AIGC动态欢迎阅读

原标题：《Python 机器学习》作者新作：从头开始构建大型语言模型

，代码已开源

关键字：机器,指令,模型,新书,人工智能

文章来源：机器之心

内容字数：0字

内容摘要：

机器之心报道

机器之心编辑部自ChatGPT

发布以来，大型语言模型（LLM）已经成为推动人工智能发展的关键技术。

近期，机器学习和 AI 研究员、畅销书《Python 机器学习》作者 Sebastian Raschka 又写了一本新书 ——《Build a Large Language Model (From Scratch)》，旨在讲解从头开始构建大型语言模型的整个过程，包括如何创建、训练和调整大型语言模型。最近，Sebastian Raschka 在 GitHub 上开源了这本新书对应的代码库。项目地址：https://github.com/rasbt/LLMs-from-scratch/tree/main?tab=readme-ov-file

对 LLM 来说，指令微调能够有效提升模型性能，因此各种指令微调方法陆续被提出。Sebastian Raschka 发推重点介绍了项目中关于指令微调的部分，其中讲解了：

如何将数据格式化为 1100 指令 – 响应对；

如何应用 prompt-style 模板；

如何使用掩码。《Build a Large Language Model

原文链接：《Python 机器学习》作者新作：从头开始构建大型语言模型，代码已开源