华为昇腾CloudMatrix 384超节点将重构传统运算架构
来源:龙灵 发布时间:2 天前 分享至微信
据半导体研究机构SemiAnalysis近期报告显示,尽管华为芯片技术落后一代,但其扩展解决方案却领先NVIDIA和AMD在售产品一代。基于升腾910系列芯片打造的华为云CloudMatrix 384超节点,可与NVIDIA的GB200 NVL72直接竞争。

NVIDIA CEO黄仁勋坦言,华为的CloudMatrix 384超节点在效能上甚至超越NVIDIA,必须高度重视。华为将5G与AI技术融合的布局极具前瞻性,NVIDIA也在推进类似计划,但需要加快步伐。

超节点并非全新概念,Google和NVIDIA等厂商早已展开探索。然而,华为通过全面重构传统运算架构,在系统工程层面涵盖网络、光通讯和软件,构建了目前业界最大规模的超节点。CloudMatrix 384超节点由12个运算柜和4个汇流排柜构成,算力总规模达300PFlops,是NVIDIA NVL72的1.6倍。

据观察者网引述一位项目组专家透露,2022年下半年华为便启动超节点研发,涉及海思、运算和华为云等多个团队。最初的64卡方案虽够用,但华为选择超前部署,决定投入384超节点研发。

NVIDIA在2024年3月推出的GB200 NVL72超节点,通过NVLink整合36颗Grace CPU和72颗Blackwell GPU,总算力规模达180Pflops。然而,集群网络通信成为当前大规模模型训练和推理的主要挑战。

华为升腾CloudMatrix 384超节点选择重构传统运算架构,提出创新“全对等架构”,通过高速互联汇流排将汇流排从服务器内部扩展到整机柜甚至跨机柜。熟悉华为技术的专家透露,该架构通过点对点通信,突破了传统CPU调度的限制,实现更大算力密度和互连带宽。
[ 新闻来源:龙灵,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!