国内大模型百花齐放,但追赶步伐仍需加快(人工智能模型部署)

当前,中国的大模型技术呈现蓬勃发展态势。近年来,在自然语言处理、机器视觉和多模态等领域,中国的大模型技术沿各技术路线迅速发展,并涌现出多个具有行业影响力的预训练大模型。

根据科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》,从全球已经发布的大模型分布来看,中美两国数量合计占全球总数的超过80%。虽然美国在大模型数量方面居全球之首,但中国目前已进入大模型快速发展期,并与美国保持同步增长态势。

截至今年5月,中国已发布79个规模达到10亿参数以上的大模型,这表明“百模大战”已经开启。根据IDC的预测,到2026年,中国人工智能软件及应用市场规模将达到211亿美元,人工智能将进入大规模落地应用的关键时期。科技企业们感受到了“一日千里”、“时不我待”的发展压力。

《报告》分析发现,中国自2020年进入大模型加速发展期,目前与美国保持同步增长态势。在自然语言处理、机器视觉和多模态等各技术分支上,中国在同步跟进、快速发展,并涌现出盘古、悟道、文心一言、通义千问、星火认知等一批具有行业影响力的预训练大模型,形成了紧跟世界前沿的大模型技术群。

这些发展表明,中国在人工智能领域取得了显著进步,大模型技术的快速发展为未来人工智能的应用提供了强大的支持,为推动技术创新和产业升级做出了重要贡献。随着技术的不断演进和应用场景的不断扩展,中国的大模型技术必将继续发挥重要作用,并为国家科技创新和经济发展带来新的机遇。

国内大模型百花齐放,但追赶步伐仍需加快_图1

《报告》显示,目前中国在14个省市/地区均有团队在开展大模型研发,北京、广东两地最多,地域集中度相对较高。从领域分布来看,自然语言处理仍是目前大模型研发最为活跃的重点领域,其次是多模态领域,在计算机视觉和智能语音等领域的大模型还较少。国内大学、科研机构、企业等不同创新主体都在积极参与大模型研发,学术界与产业界之间的联合开发还不充分。

国内大模型百花齐放,但追赶步伐仍需加快_图2

《报告》通过调研全国范围内的算力基础设施分布情况发现,北京、广东、浙江、上海等地的大模型数量最多,同时这4个地方也是近3年人工智能服务器采购数量最多的地区,表现出非常明显的强相关性,为大模型研发应用提供了重要支撑。同时,各地也在通过提供公共智能算力方式补充快速增长的人工智能算力需求,为大模型研发提供更多算力支撑。

《报告》分析发现,目前中国大模型产业化应用大致出现两种并行的发展路径,文心一言、通义千问、紫东太初等中国一批通用化大模型正在快速发展,打造跨行业通用化人工智能能力平台,其应用行业正在从办公、生活、娱乐向医疗、工业、教育等加速渗透。

国内大模型百花齐放,但追赶步伐仍需加快_图3

《报告》分析发现,目前中国大模型产业化应用大致出现两种并行的发展路径,文心一言、通义千问、紫东太初等中国一批通用化大模型正在快速发展,打造跨行业通用化人工智能能力平台,其应用行业正在从办公、生活、娱乐向医疗、工业、教育等加速渗透。

国内大模型百花齐放,但追赶步伐仍需加快_图4

与此同时,一批针对生物制药、遥感、气象等垂直领域的专业类大模型,正在发挥其领域纵深优势不断深化落地,提供针对特定业务场景的高质量专业化解决方案。

根据腾讯研究院、同济大学、腾讯云、腾讯新闻共同发布的《人机共生——大模型时代的AI十大趋势观察》报告,“大模型”已可以在多个领域催生出全新的商业价值,第一批跨功能的应用程序已在眼前:金融、零售、政府、制造、物流、地产、教育等多个行业,以及财务、HR、客服等应用场景,“大模型”展现了出色能力。报告预测,各行业都将迅速整合大模型的能力。与其他颠覆型技术一样,这种变革一开始会缓慢发展,然后迅速加速。

国内大模型列表如下

国内大模型百花齐放,但追赶步伐仍需加快_图5

AI大模型实力哪家强?

为了更好地评估和比较这些模型在中文领域的表现,已经有针对中文的通用大模型的测评基准。

用大模型基准(SuperCLUE)就是其中的一个测评基准,尝试对主流的AI通用模型进行一个可量化的对比评分。它主要回答的问题是:在当前通用大模型大力发展的情况下,中文大模型的效果情况。包括但不限于:这些模型不同任务的效果情况、相较于国际上的代表性模型做到了什么程度、 这些模型与人类的效果对比。SuperCLUE从三个不同的维度评价模型的能力:基础能力、专业能力和中文特性能力。其中专业能力包括中学、大学与专业考试,涵盖了从数学、物理、地理到社会科学等50多项能力。

近日,SuperCLUE发布了大模型6月榜单。6榜单由4部分组成:总排行榜、基础能力榜单、中文特性榜单、70亿参数量级榜单。

国内大模型百花齐放,但追赶步伐仍需加快_图6

2023年6月 SuperCLUE 中文大模型总排行榜

国内大模型百花齐放,但追赶步伐仍需加快_图7

2023年6月SuperCLUE基础能力榜单

国内大模型百花齐放,但追赶步伐仍需加快_图8

2023年6月SuperCLUE中文特性榜单

国内大模型百花齐放,但追赶步伐仍需加快_图9

2023年6月SuperCLUE-70亿参数量级榜单

国内大模型百花齐放,但追赶步伐仍需加快_图10

从榜单上的测评结果来看,GPT-4的综合能力和单项能力都表现非常出色,各榜单中GPT-4都是独占鳌头,比第二名GPT-3.5-turbo要强不少;其次是GPT-3.5-turbo、Claude,二者评分旗鼓相当。

国内的几个大模型的表现只能说是有待加强,与GPT4的差距还是相当明显的,在AI大模型的竞赛中,国内模型的追赶步伐还得再快些,按360集团创始人周鸿祎话说,目前中国AI模型与GPT-4之间的差距在2到3年左右。

0
分享到:
没有账号? 忘记密码?