LLM 即语言逻辑模型(Language Logic Model),具有以下特点和工作原理:
在 LangChain 平台中,LLM 是与各种大模型进行交互的核心模型,是一个能够处理语言输入和输出的抽象概念。其输入是用户的请求或问题字符串,输出是模型的回答或结果字符串。它能根据不同输入调用不同大模型完成多种语言任务,如文本生成、理解、翻译等。其优势在于让开发者无需关心大模型细节和复杂性,只关注语言逻辑和意义,还能灵活选择和切换大模型,甚至自己封装 LLM 实现特定语言逻辑和功能。 大语言模型如豆包在回复时通常是流式输出,即一个字一个字地推理生成内容。这类似于输入法的输入联想逻辑,会根据输入的字推测下一个字。为提高推测准确性,会将上下文加入输入。但大模型学习数据规模海量,每次计算若带入全量数据,算力难以承受。 以下是一些 LLM 开源中文大语言模型及数据集集合: CPM-Bee:地址为https://github.com/OpenBMB/CPM-Bee,是一个完全开源、允许商用的百亿参数中英文基座模型。 TigerBot:地址为https://github.com/TigerResearch/TigerBot,是一个多语言多任务的大规模语言模型。 书生·浦语:地址为https://github.com/InternLM/InternLM-techreport,是由商汤科技等联合发布的千亿级参数大语言模型。