中电信AI大模型TeleChat-12B评测:使用3T tokens预训练,已开源!(中国电信摩登与路由器怎么连接)

AIGC动态欢迎阅读

原标题:中电信AI大模型

TeleChat-12B评测:使用3T tokens预训练,已开源!

关键字:模型,数据,代码,方面,指令

文章来源:算法邦

内容字数:6572字

内容摘要:

直播预告 | 5月14日晚7点,「智猩猩、AI新青年讲座」第235讲正式开讲,慕尼黑工业大学视觉实验室陈振宇博士将直播讲解《三维室内场景纹理图生成》欢迎扫码报名~01前言2月份的时候评测过TeleChat-7B大模型,见星辰AI大模型TeleChat-7B评测。最近中电信 AI 科技有限公司针对TeleChat-7B进行了性能升级,并开源了一个更大的模型TeleChat-12B,受邀对这个大模型进行新的评测。本文主要关注TeleChat-7B在做一些文学创作和代码生成方面相比于TeleChat-7B的提升。TeleChat-7B不仅在模型结构上有所微调,而且相比于TeleChat-7B的1.5T Tokens,TeleChat-12B使用了3T Tokens进行预训练,取得了更好的性能结果。下面红框部分是TeleChat-12B相比于TeleChat-7B在通用能力,推理和代码能力,语言理解能力等维度的数据集上的性能提升:

在这里插入图片描述

02TeleChat-12B相比于TeleChat-7B的差异点TeleChat-12B和TeleChat-7B均开源在https://gith

原文链接:中电信AI大模型TeleChat-12B评测:使用3T tokens预训练,已开源!

联系作者

文章来源:算法邦

作者微信:allplusai

作者简介:智猩猩矩阵账号之一,聚焦生成式AI,重点关注模型与应用。

0
分享到:
没有账号? 忘记密码?