检索增强生成(RAG)是通过整合外部知识源的附加信息来改进大型语言模型(LLM)的过程。这样,大型语言模型就能做出更精确、更能感知上下文的反应,同时还能减少幻觉。
自 2023 年以来,RAG 已成为基于 LLM 的系统中最流行的架构。许多产品的功能都严重依赖 RAG。因此,优化 RAG 的性能,使检索过程更快、结果更准确已成为一个至关重要的问题。
在上一篇文章 [AI知识库检索增强生成(RAG)简介] 中,我们简单介绍了什么是AI知识库的检索增强(RAG)。今天开始,我们将以一系列的文章来重点介绍先进的 RAG 技术,以提高 RAG 生成的质量。
朴素 RAG 审查
下图展示了朴素 RAG 的典型工作流程: