微调(Fine-tuning)是一种迁移学习技术,常用于深度学习中。
首先,有一个在大量数据上预训练过的模型,它已学会一些基本的模式和结构,例如在自然语言处理任务中学会基本的语法和单词的语义。
然后,在特定的任务数据上继续训练这个模型,使其适应新的任务。
以下是一些例子帮助您更好地理解:
情感分类:先使用大量语料库预训练模型,再用标注过的电影评论继续训练,使其学会判断评论的情感。 图像分类:类似的方式在图像相关任务中应用。微调可带来诸多收益,如获得比即时设计更高质量的结果、能够训练比提示中更多的例子、由于更短的提示而节省 Token、更低的延迟请求。
GPT-3 在大量文本上预训练后,微调通过训练比提示中更多的示例来改进小样本学习,让您在大量任务中取得更好的结果。对模型进行微调涉及准备和上传训练数据、训练新的微调模型、使用微调模型等步骤。
在大型语言模型中,微调阶段是将互联网文档的格式转换为问答形式,类似于有用的助手。预训练阶段主要积累知识,微调阶段则是所谓的对齐。