知识图谱: 知识图谱是一种揭示实体之间关系的语义网络,能够对现实世界的事物及其相互关系进行形式化描述。它于 2012 年 5 月 17 日由 Google 正式提出,初衷是提高搜索引擎的能力,增强用户的搜索质量和体验,将 Web 从网页链接转向概念链接,支持用户按主题检索,实现语义检索。
关键技术包括:
知识抽取: 实体抽取:通过命名实体识别从数据源中自动识别命名实体。 关系抽取:从数据源中提取实体之间的关联关系,形成网状知识结构。 属性抽取:从数据源中采集特定实体的属性信息。 知识表示:包括属性图、三元组等。 知识融合: 实体对齐:消除异构数据中的实体冲突、指向不明等不一致性问题。 知识加工:对知识统一管理,形成大规模的知识体系。 本体构建:以形式化方式明确定义概念之间的联系。 质量评估:计算知识的置信度,提高知识质量。 知识更新:不断迭代更新,扩展现有知识,增加新知识。 知识推理:在已有的知识库基础上挖掘隐含的知识。在 AI Agent 系列中,外置知识包括知识图谱。外置知识由外部数据库提供,能够动态更新和调整。外置知识的数据库和图谱构成了智能体的知识库,包括向量数据库(优化了向量检索操作,常用于处理和索引非结构化数据,如图像和文本)、关系型数据库(通过表格形式存储结构化数据,支持复杂查询,适用于事务性数据存储)、知识图谱(以图的形式组织数据,强调实体之间的关系,适合于复杂的语义分析和知识推理)。在实际应用中,外置知识的集成和管理常常采用 RAG 架构,这是一种结合了检索和生成的模型,通过检索外部知识源来增强模型的生成能力,允许智能体在生成响应或执行任务时,不仅依赖内置知识,还能实时检索和整合最新的外部信息。