中电信AI大模型TeleChat-12B评测：使用3T tokens预训练，已开源！（中国电信摩登与路由器怎么连接）

AIGC动态欢迎阅读

原标题：中电信AI大模型

TeleChat-12B评测：使用3T tokens预训练，已开源！

文章来源：算法邦

内容字数：6572字

内容摘要：

直播预告 | 5月14日晚7点，「智猩猩、AI新青年讲座」第235讲正式开讲，慕尼黑工业大学视觉实验室陈振宇博士将直播讲解《三维室内场景纹理图生成》欢迎扫码报名~01前言2月份的时候评测过TeleChat-7B大模型，见星辰AI大模型TeleChat-7B评测。最近中电信 AI 科技有限公司针对TeleChat-7B进行了性能升级，并开源了一个更大的模型TeleChat-12B，受邀对这个大模型进行新的评测。本文主要关注TeleChat-7B在做一些文学创作和代码生成方面相比于TeleChat-7B的提升。TeleChat-7B不仅在模型结构上有所微调，而且相比于TeleChat-7B的1.5T Tokens，TeleChat-12B使用了3T Tokens进行预训练，取得了更好的性能结果。下面红框部分是TeleChat-12B相比于TeleChat-7B在通用能力，推理和代码能力，语言理解能力等维度的数据集上的性能提升：

在这里插入图片描述

02TeleChat-12B相比于TeleChat-7B的差异点TeleChat-12B和TeleChat-7B均开源在https://gith

原文链接：中电信AI大模型TeleChat-12B评测：使用3T tokens预训练，已开源！