以下是对大模型赛道的盘点:
Compass Arena 是由上海人工智能实验室和魔搭社区联合推出的大模型测评平台,集齐了国内主流的 20 多款大模型,包括阿里通义千问、百度文心一言、腾讯混元、讯飞星火、字节跳动豆包、智谱 AI、百川智能、零一万物、月之暗面等,用户可在平台选择大模型两两“对战”,实名或匿名对战皆可。在 Qwen 系列中,Qwen2 性能优越,所有尺寸的模型都使用了 GQA 以带来推理加速和显存占用降低的优势,针对小模型使用了 tie embedding 的方法让输入和输出层共享参数。所有预训练模型在 32K tokens 数据上训练,在 128K tokens 时仍有不错表现,指令微调模型还需进行长序列理解实验。 伯克利的团队管理着聊天机器人竞技场,根据 ELO 评级对不同语言模型进行排名,计算方式与国际象棋相似。顶部是专有封闭模型,如 OpenAI 的 GPT 系列和 Anthropic 的 Claude 系列,下方是开放权重的模型,如 Meta 的 Llama2 系列,底部有 Zephyr 7b Beta 等。 有观点认为大模型应用是除内容、电商、o2o、工具之外的第五条赛道,但当前其是否够资格有待商榷。许多产品同学未真正意识到大模型带来的变革,思路和视角仍停留在传统互联网商业模式上。