以下是关于 RAG 的相关资料:
RAG 的定义及工作流: RAG(Retrieval-Augmented Generation)是一个自然语言处理(NLP)技术,结合了检索和生成两种主要的 NLP 方法。工作流程如下:用户向 ChatGPT 查询最新事件,如 OpenAI 首席执行官的相关情况,ChatGPT 因预训练数据限制缺乏最新信息,RAG 从外部知识库检索最新文档摘录,如相关新闻文章,将其与初始问题合并成丰富提示,使 ChatGPT 能合成知情回答。从技术上讲,RAG 通过各种创新方法得到丰富,解决了“要检索什么”“何时检索”“如何使用检索到的信息”等关键问题,关于“要检索什么”的研究已从简单标记检索和实体检索发展到更复杂结构。
RAG 的优势: RAG 是解决某些问题的有效方案,能让大模型从权威、预先确定的知识来源中检索、组织相关信息,更好控制生成的文本输出,用户可深入了解 LLM 生成最终结果的过程。RAG 可与微调结合使用,两者不冲突。RAG 类似于为模型提供教科书,适用于回答特定询问或解决特定信息检索任务,但不适合教模型理解广泛领域或学习新语言、格式或样式。
参考资料:《Retrieval-Augmented Generation for Large Language Models:A Survey》(https://arxiv.org/pdf/2312.10997.pdf)