特约文章丨大语言模型的知识冲突:成因、根源与展望(语言模型训练中语料选取的细节)

AIGC动态欢迎阅读

原标题:特约文章丨大语言模型知识冲突

:成因、根源与展望

关键字:模型,知识,冲突,语言,信息

文章来源:人工智能学家

内容字数:0字

内容摘要:

文/李兴明,胡庆拥摘 要:

大语言模型在实际应用场景中经常面临知识冲突的问题,主要包括上下文 – 记忆知识冲突、多源上下文知识冲突和记忆内知识冲突。本文首先从训练数据的局限性、模型问题,以及外部信息缺陷三个方面深入分析知识冲突的成因;随后进一步探讨了知识冲突造成的影响,并全面回顾了知识冲突的解决方案,如领域事实增强、提示工程和模型结构层面的改进。最后对知识冲突领域未来研究方向进行了展望,包括建立可靠的评估框架、基于大模型的智能体研究,以及多模态背景下的知识冲突处理。关键词:

人工智能;大语言模型;知识冲突;智能体;多模态0 引言近年来,随着深度学习、Transformer架构等关键技术的突破,预训练大语言模型(large languagemodel,LLM)实现了飞跃式发展,成为人工智能领域最炙手可热的研究方向之一。自2022年底ChatGPT

系统面世以来,业界掀起了“大模型”研究热潮,全球研究机构与科技巨头纷纷布局,在大模型领域投入大量研发资源和力量。

大语言模型通过预训练的方式,在海量非结构化数据上学习获取通用知识和语义表征能力,可广泛应用于自然语言理解、生成、推理、问答等诸多任务

原文链接:特约文章丨大语言模型的知识冲突:成因、根源与展望

联系作者

文章来源:人工智能学家

作者微信:

作者简介:

0
分享到:
没有账号? 忘记密码?