LLM是什么（llm是啥专业）

LLM 即语言逻辑模型（Language Logic Model），具有以下特点和工作原理：

在 LangChain 平台中，LLM 是与各种大模型进行交互的核心模型，是一个能够处理语言输入和输出的抽象概念。其输入是用户的请求或问题字符串，输出是模型的回答或结果字符串。它能根据不同输入调用不同大模型完成多种语言任务，如文本生成、理解、翻译等。其优势在于让开发者无需关心大模型细节和复杂性，只关注语言逻辑和意义，还能灵活选择和切换大模型，甚至自己封装 LLM 实现特定语言逻辑和功能。大语言模型如豆包在回复时通常是流式输出，即一个字一个字地推理生成内容。这类似于输入法的输入联想逻辑，会根据输入的字推测下一个字。为提高推测准确性，会将上下文加入输入。但大模型学习数据规模海量，每次计算若带入全量数据，算力难以承受。以下是一些 LLM 开源中文大语言模型及数据集集合： CPM-Bee：地址为https://github.com/OpenBMB/CPM-Bee，是一个完全开源、允许商用的百亿参数中英文基座模型。 TigerBot：地址为https://github.com/TigerResearch/TigerBot，是一个多语言多任务的大规模语言模型。书生·浦语：地址为https://github.com/InternLM/InternLM-techreport，是由商汤科技等联合发布的千亿级参数大语言模型。

猜你喜欢