Personality Traits in Large Language Models
M Safdari, G Serapio-García, C Crepy, S Fitz, P Romero, L Sun, M Abdulhai, A Faust, M Matarić
[Google DeepMind]大型语言模型的人格特征
动机:随着大型语言模型(LLM)在自然语言处理和对话智能体中的应用,这些模型通过大量的人类生成数据的训练,嵌入了一种合成的人格。人格是决定沟通有效性的重要因素,因此,本文提出一种全面的方法,用于管理验证的心理测量测试,并量化、分析和塑造广泛使用的LLM生成的文本中表现出的人格特征。 方法:提出一种使用心理测量学原则来描述和塑造LLM中合成人格的方法。开发了一种建立人格特征的结构有效性的方法,并提出一种模拟人群差异的新方法,以便可以像在人类社会科学数据中一样评估人格及其外部相关性之间的统计关系。最后,提供了一种独立于LLM的人格塑造机制,可以以受控的方式改变LLM观察到的人格特征水平。 优势:使用心理测量学的方法来量化和塑造LLM的人格特征,这是一个全新的领域。此外,研究还发现,某些LLM(在特定的提示配置下)模拟的人格是可靠和有效的;对于更大和更精细调整的模型,LLM模拟人格的可靠性和有效性的证据更强;LLM输出中的人格可以沿着期望的维度进行塑造,以模仿特定的人格特征。提出一种全面的方法,使用心理测量学的原则来描述和塑造大型语言模型中的人格特征,为理解和控制这些模型的行为提供了新的视角。
https://arxiv.org/abs/2307.00184