智能体引用知识库效果不好,可以从哪些方面来着手调整(智能体是什么意思?)

智能体引用知识库效果不好,可以从以下方面着手调整:

整理知识库文档阶段: 确定包含的文档类型,如政策原文文档、业务积累的 QA、操作指引、产品说明等,并进行预处理。 注重知识库本身质量,因为这是大模型生成回答的原始语料。 优化文档格式,实践中根据场景测试 PDF 或.docx 等格式,一般 PDF 文档效果较好,因其格式信息简洁,对大模型干扰少。 规范文档命名,尽量控制在 10 字左右,涵义简洁明了,避免无意义的数字、符号或缩写。 统一文档语言,避免中英文、繁简体混杂。 优化文档内容,设置清晰的一二级标题,对难以处理的图片、表格、公式、超链接、附件、架构图、代码等进行特殊处理。 调优实践: 更换大模型,如从 ChatGLM2-6B 替换成 baichuan2-13b,针对特定场景可能提升性能。 更换 embedding 模型,如将 LangChain Chatchat 默认的 m3e-base 替换为 bge-large-zh。 测试不同 Top k 的值,如比较 Top 5、Top 10、Top 15 的结果,可能发现 Top 10 时效果最优。 处理文档名称,人工重命名文件,上传相同文件构建知识库,同时在构建时勾选【开启中文标题加强】选项,虽重命名文件效果不明显,但勾选该选项后回答的无关信息减少,效果有所提升。

0
分享到:
没有账号? 忘记密码?