HPN 7.0:阿里云新一代万卡集群网络架构(阿里云智能网卡)

AIGC动态欢迎阅读

原标题:HPN 7.0:阿里

云新一代万卡集群网络架构

关键字:腾讯,报告,阿里,拓扑,通信

文章来源:智猩猩AGI

内容字数:0字

内容摘要:

9月6-7日,2024全球AI芯片峰会将在北京召开。目前,AMD人工智能事业部高级总监王宏强,清华大学交叉信息研究院助理教授、北极雄芯创始人马恺声,珠海芯动力创始人兼CEO李原,“吴文俊2023人工智能芯片专项奖”第一完成人、锋行致远创始人兼CEO孙唐等嘉宾已确认出席。欢迎报名或购票参会~01背景本文中,我们简单介绍 C4 底层的阿里云新一代智算集群网络架构 HPN 7.0。阿里在最近的智源大会上也有介绍,可以参考 https://event.baai.ac.cn/live/795,其提到了几个关键词:双上联,双平面,多轨,以及单层千卡,两层万卡。上面提到的几个介绍可以参考:

万卡 GPU 集群互联:硬件配置和网络设计

万卡 GPU 集群实战:探索 LLM 预训练的挑战

阿里 C4:通信驱动加速大规模并行训练效率

剖析大规模 GPU 集群:针对 LLM 场景的挑战和优化

02拓扑如下图所示(图片来自 星融元针对LLM大模型承载网发布星智AI网络解决方案)为常见的三层无阻塞 Fat-Tree 拓扑(SuperSpine-Spine-Leaf),可以将两层的 Spine-Leaf 看做一个

原文链接:HPN 7.0:阿里云新一代万卡集群网络架构

联系作者

文章来源:智猩猩AGI

作者微信:

作者简介:

0
分享到:
没有账号? 忘记密码?