周畅将离开阿里,创业去了(周畅长什么样)

36氪独家获悉,阿里通义千问大模型技术负责人周畅(花名:钟煌)将从阿里云离职,下场创业。

36氪了解到,周畅目前仍在阿里云系统中,尚未正式离职。但36氪从多方独立信源处得知,周畅已决定要创业。一位消息人士对36氪表示,周畅可能会投身于人工智能应用领域。

而另一位消息灵通的人士表明,周畅是通义实验室算法团队的核心技术骨干之一,属于正常离职。通义大模型的研发和开源工作仍在继续进行,目前通义实验室的领导者是阿里云CTO周靖人。

对于上述信息,36氪向阿里云求证,截至发稿,暂无回复。阿里云作为一家领先的云计算服务提供商,通常会对外部查询进行回应,但在此情况下,尚未获得官方的反馈。我们将继续关注此事的进展,并及时更新相关信息。

周畅为“通义千问”的大模型负责人,他于2012年本科毕业于复旦大学计算机科学与技术专业,2017年博士毕业于北京大学计算机软件与理论专业,随后加入阿里巴巴。他先后在阿里巴巴达摩院担任算法专家,之后成为“通义千问”的大模型负责人。他的研究领域涵盖深度学习、图挖掘和分布式计算,在机器学习、数据挖掘和数据库领域的国际顶级会议上发表了30余篇文章,并担任NeurIPS/ICML/KDD/WWW等学术会议的审稿人。

阿里是国内最早成体系地投入在大模型领域里投入研发的大公司。2019年,阿里就在BERT路线的基础上推出了预训练大语言模型structBERT,这一模型在自然语言处理的许多任务中表现出了优异的性能,显著提升了中文文本理解和生成的能力。而后在2021年,阿里推出了多模态大模型M6,该模型不仅可以处理文本数据,还能够处理图像、视频等多种数据类型,具有更强的综合处理能力。再到如今,阿里已经建立了涵盖不同应用场景的通义大模型家族,致力于推动人工智能技术的发展与应用。

达摩院下属的通义实验室,也是当前大规模模型领域内的“人才聚集地”。如前不久官宣创业的前字节模型技术研发负责人杨红霞,已加入Salesforce的前任实验室负责人司罗、通义视觉实验室负责人徐盈辉等等,都出自达摩院体系,这些人才是阿里大规模模型团队培养出的首批顶尖AI专家。

周畅则是完整经历过阿里大模型演变历程的核心技术骨干。在2020-2021年间,他带领团队设计并实现了超大规模的多模态预训练模型M6,在参数数量和低碳训练模式上曾取得突破。

而更早之前,他曾研发超大规模商品图表征算法APP、用户表征框架ATRank、基于自监督对比学习的向量召回算法CLRec系列,这些技术都有落地到实际应用场景中——比如在手淘多个个性化推荐场景下,让效果获得大幅提升。

进入2024年,国内大模型行业已经进入快速发展期,基础大模型层已经形成初步格局——主要参与者包括阿里、字节、腾讯等大厂,以及智谱AI、Minimax、月之暗面、百川智能等创业公司。市场普遍集中关注于AI应用的推广,关注焦点逐渐转向大模型如何在各行各业中实际应用,这也助推了新一轮AI人才的创业浪潮。

0
分享到:
没有账号? 忘记密码?