什么是微调（调味羊肉片）

微调（Fine-tuning）是一种迁移学习技术，常用于深度学习中。

首先，有一个在大量数据上预训练过的模型，它已学会一些基本的模式和结构，例如在自然语言处理任务中学会基本的语法和单词的语义。

然后，在特定的任务数据上继续训练这个模型，使其适应新的任务。

以下是一些例子帮助您更好地理解：

情感分类：先使用大量语料库预训练模型，再用标注过的电影评论继续训练，使其学会判断评论的情感。图像分类：类似的方式在图像相关任务中应用。

微调可带来诸多收益，如获得比即时设计更高质量的结果、能够训练比提示中更多的例子、由于更短的提示而节省 Token、更低的延迟请求。

GPT-3 在大量文本上预训练后，微调通过训练比提示中更多的示例来改进小样本学习，让您在大量任务中取得更好的结果。对模型进行微调涉及准备和上传训练数据、训练新的微调模型、使用微调模型等步骤。

在大型语言模型中，微调阶段是将互联网文档的格式转换为问答形式，类似于有用的助手。预训练阶段主要积累知识，微调阶段则是所谓的对齐。