科大讯飞星火大模型V3.0发布:全面超越gpt3.5,华为联手打造算力底座(科大讯飞创新)

10月24日,科大讯飞在2023全球1024开发者节上展示了一系列重要举措。最引人瞩目的是,他们发布了星火大模型V3.0,这一版本在各项性能指标上都已经明显超越了gpt3.5。

更为重要的是,科大讯飞与华为的合作关系进一步深化。在这次活动中,双方共同发布了基于华为昇腾生态的“飞星一号”算力底座平台。明年上半年,科大讯飞将在这一自主可控的平台上进行星火大模型V4.0的训练,以达到对标gpt-4的目标。

星火大模型V3.0如期发布

在2023全球1024开发者节上,科大讯飞董事长刘庆峰正式宣布星火认知大模型V3.0的发布,这一版本已经全面对标gpt3.5。刘庆峰表示,他对星火大模型寄予了更高期望,不仅要求它能够回答问题,还要求它能够提出问题,具备知识和个性。

202310250935513258.jpg

在中文方面,科大讯飞在星火大模型V3.0中引入了“AI人设”,也就是个性化。在一次现场演示中,星火大模型V3.0被要求“以孔夫子的人设写一篇演讲稿”,最终以文言文的形式呈现了演讲稿,并插入了多个孔子的经典名言。刘庆峰透露,AI人设涉及特定知识学习、大型模型的人格以及对话记忆学习。

据刘庆峰介绍,星火大模型V3.0已经实现了从多轮对话、主动对话到启发式探究对话的跨越。

在英文方面,根据OpenAI官网发布的英文任务测试集,在10月16日至20日的测试中,星火V3.0的英文表现与gpt3.5的48项任务结果相当,两者的得分分别为85.1%(星火V3.0)和84.3%。

不过,刘庆峰坦言,在英文开放式问答方面,星火大模型还不及gpt3.5,他表示与gpt-4相比,还有更多学习的空间。

根据记者的了解,综合考虑文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力七个方面,星火大模型V3.0相较于V2.0版本的能力提升在3-9%之间。

此外,根据《通用认知智能大模型评测体系》在10月16日-20日的测试中,星火大模型在上述七个方面:文本生成、语言理解、知识问答、逻辑推理、数学能力和代码能力都全面超越了gpt3.5。

特别是在代码能力方面,刘庆峰透露,科大讯飞内部最近完成了Windows到Linux的跨平台移植,其中涉及20万行代码,通常需要3个月的时间才能完成这项工作,但使用基于星火大模型的智能编程助手iFlyCode,整个过程只用了1个月的时间。据悉,iFlyCode自8月15日发布以来,已经与京东云、软通动力等107家机构实现深度合作。

然而,刘庆峰也指出,与gpt4相比,科大讯飞的代码能力还需要不断学习。

联手华为 明年对标gpt-4

在这次活动中,科大讯飞与华为的合作引起了广泛关注。据了解,华为轮值董事长徐直军也参与了这次活动。在活动中,科大讯飞宣布了与华为合作,共同打造基于昇腾生态的自主可控大型模型算力底座“飞星一号”平台。

202310250940536081.jpg

实际上,科大讯飞与华为在人工智能领域的合作日益密切。刘庆峰在活动中坦言,一旦被列入实体清单,他首先想到的是向华为请教如何应对。

科大讯飞在星火大模型V2.0发布同时,就联合华为推出了面向企业的讯飞星火一体机,以便在国内自主创新平台上进行大型模型的私有化部署。

民生证券在一份研究报告中分析称,讯飞星火一体机采用昇腾芯片,代表国内最强AI一体机水平,昇腾AI芯片提供2.5PFLOPS的核心性能,通过算力软硬件协同优化,构建了算力集中、性能卓越、供应稳定、数据安全的大型模型训练集群。它提供了130/650/1750亿的模型参数可选,实现开箱即用、安全可控。

科大讯飞最近的机构调研中也曾介绍,讯飞星火一体机在性能方面已经能够与A100平台媲美。太平洋证券认为,受数据安全和数据主权的推动,AI大型模型在中国国内将会迎来本地化部署的强烈需求。该机构预测,到2027年,G端AI一体机市场规模将超过4500亿元。

徐直军也在这次活动中介绍,目前,华为全球所有智能终端的语音技术都来自科大讯飞。他表示,星火大模型V3.0是双方合作的一个典范,为更强大的星火大模型V4.0提供了支持。

据了解,科大讯飞将开始训练星火大模型V4.0版本,计划在2024年上半年实现对标gpt-4,而训练所使用的平台正是“飞星一号”算力底座。

刘庆峰也正视了与gpt-4的差距。他认为,国内目前的大型模型在某些方面与gpt-4相比仍有差距,特别是在复杂知识推理、小样本快速学习、处理超长文本和跨模态统一处理等领域。“核心技术仍需不断进步,但这不是某一家公司或科研机构能够独立完成的事情。”

商用落地 赋能人形机器人

记者在活动现场观察到,星火大模型已经在多个领域迅速投入商用,包括医疗、教育和科研文献等领域。

在这次活动中,科大讯飞正式发布了讯飞星火医疗大模型。据刘庆峰介绍,gpt-4已经在国外医疗领域取得了显著成就。通过对12万例医疗知识问答、医疗复杂语言理解、医疗专业文本生成和医疗诊断治疗推荐的问题回答率进行数据抽查,并经第三方测试数据验证,讯飞星火医疗大模型在这些方面表现全面超越了gpt-4。

与此同时,科大讯飞还宣布即将发布12个行业大型模型,覆盖金融、汽车、运营商、工业、住建、物业、法律、科技文献、传媒、政务、文旅和水利等不同行业。

刘庆峰还透露了科大讯飞在机器人领域的发展计划。在去年的1024开发者日上,科大讯飞展示了自家研发的AI机器人,并发布了讯飞机器人超脑平台AIBOT,旨在为实体机器人赋予智能,通过云端协同和软硬件结合的方式推动AI机器人的发展。

刘庆峰表示,星火大模型将推动AIBOT的发展进入一个全新的阶段,提高人形机器人在处理复杂任务、物体寻找以及复杂地形运动等方面的能力,包括强化学习泛化抓取和仿人行走。

“下一步,我们将以人形机器人为引领,推动‘视觉-语言-动作’多模态具身大型模型,更好地赋能人形机器人,”刘庆峰表示。

202310250936047808.jpg

这一举措将进一步推动人形机器人的发展,使其在复杂任务执行、物体识别和处理、以及复杂地形移动方面表现更加卓越。这对于各种领域的应用,包括工业、医疗、教育等,都具有重要意义。

综上所述,科大讯飞在2023全球1024开发者节上展示了一系列重大动作,包括发布了星火大模型V3.0,与华为合作打造“飞星一号”算力底座平台,以及推动大型模型在不同领域的应用。这些举措标志着科大讯飞在人工智能领域的不断进步和创新,为未来的技术发展和商业应用带来了更多可能性。与此同时,刘庆峰也坦言,虽然取得了显著进展,但仍需不断努力,与gpt-4等国际领先技术进行竞争,共同推动人工智能技术的发展。

在未来,我们可以期待看到科大讯飞在人工智能领域持续取得重大突破,为更多行业和领域带来智能化的解决方案,推动人工智能技术的应用范围不断扩大。

0
分享到:
没有账号? 忘记密码?