大模型赛道盘点（汽车模型比赛b站）

以下是对大模型赛道的盘点：

Compass Arena 是由上海人工智能实验室和魔搭社区联合推出的大模型测评平台，集齐了国内主流的 20 多款大模型，包括阿里通义千问、百度文心一言、腾讯混元、讯飞星火、字节跳动豆包、智谱 AI、百川智能、零一万物、月之暗面等，用户可在平台选择大模型两两“对战”，实名或匿名对战皆可。在 Qwen 系列中，Qwen2 性能优越，所有尺寸的模型都使用了 GQA 以带来推理加速和显存占用降低的优势，针对小模型使用了 tie embedding 的方法让输入和输出层共享参数。所有预训练模型在 32K tokens 数据上训练，在 128K tokens 时仍有不错表现，指令微调模型还需进行长序列理解实验。伯克利的团队管理着聊天机器人竞技场，根据 ELO 评级对不同语言模型进行排名，计算方式与国际象棋相似。顶部是专有封闭模型，如 OpenAI 的 GPT 系列和 Anthropic 的 Claude 系列，下方是开放权重的模型，如 Meta 的 Llama2 系列，底部有 Zephyr 7b Beta 等。有观点认为大模型应用是除内容、电商、o2o、工具之外的第五条赛道，但当前其是否够资格有待商榷。许多产品同学未真正意识到大模型带来的变革，思路和视角仍停留在传统互联网商业模式上。

猜你喜欢