以下是关于 RAG 的相关文档内容:
RAG 是由 Lewis 等人(2021)提出的一种通用微调方法。它使用预训练的 seq2seq 作为参数记忆,用维基百科的密集向量索引作为非参数记忆(通过神经网络预训练的检索器访问)。
RAG 在 Natural Questions、WebQuestions 和 CuratedTrec 等基准测试中表现出色。在 MS-MARCO 和 Jeopardy 问题测试中,生成的答案更符合事实、更具体、更多样,FEVER 事实验证使用后也得到更好结果,说明它是一种可行方案,能在知识密集型任务中增强语言模型的输出。
基于检索器的方法越来越流行,常与 ChatGPT 等流行 LLM 结合使用来提高能力和事实一致性。LangChain 文档中有使用检索器和 LLM 回答问题并给出知识来源的简单例子。
虽然网络上提示工程相关资料众多,但 RAG 任务中提示工程的资料相对较少。LangGPT 社区推出了 RAG 任务下的提示词实践经验系列分享,《RAG 提示工程》为系列文章,第一篇会带领大家了解 RAG 架构的概念、基本组成、常见痛点以及提示词工程在其中的应用,并逐步指导实操 RAG 提示词案例。
通用语言模型微调可完成常见任务,更复杂和知识密集型任务可基于语言模型构建系统访问外部知识源。Meta AI 研究人员引入的 RAG 方法把信息检索组件和文本生成模型结合,可微调,内部知识修改高效,无需重新训练整个模型。RAG 接受输入并检索相关文档,给出来源,组合后送给文本生成器得到最终输出,适应事实变化,让语言模型获取最新信息并产生可靠输出。