我看到的经验介绍是通过不断迭代Prompt版本来训练适合自己的LLM功能,这合理吗?(迭代的意思)

合理。因为LLM 应用优化是个迭代过程,应该不断尝试:尝试->验证->再尝试->再迭代。通过 prompt 工程(或结合 RAG)先获取第一批高质量输入输出数据,然后微调模型,模型性能提升后,数据质量进一步提升,将更优质的数据用于模型训练,然后更好的模型产出更好的数据,如此循环,构建正向迭代循环(也称数据飞轮)。

0
分享到:
没有账号? 忘记密码?