华为升腾910C芯片效能超越NVIDIA H800 GPU
来源:万德丰 发布时间:1 天前
分享至微信

据法新社报道,华为最新技术论文显示,其新一代数据中心架构CloudMatrix 384超节点使升腾910C芯片在运行DeepSeek R1模型时,效能超越NVIDIA H800 GPU。
CloudMatrix 384超节点专为大规模人工智能(AI)工作负载设计,整合了384颗升腾910C神经处理单元(NPU)和192颗鲲鹏CPU,通过统一总线连接,实现了高速率、低延迟的数据传输。为充分发挥这一架构的潜力,华为推出了名为CloudMatrix-Infer的服务解决方案,专门针对大规模混合专家(Mixture of Experts,MoE)模型进行优化。
测试数据显示,在R1模型4,000个token的预填充阶段,CloudMatrix-Infer达到了每NPU每秒6,688个token的处理速率,相当于每TFLOPS 4.45个token的效率;在解码阶段,其速度为每秒1,943个token,平均延迟小于50毫秒,表现优于搭载NVIDIA H100与H800的同类系统。
据南华早报报道,这是华为首次公开升腾910C的完整效能细节。论文作者之一、华为“天才少年”计划成员左鹏飞在知乎平台分享了这篇论文。
[ 新闻来源:万德丰,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!


万德丰
开创IC领域,共创美好未来!
查看更多
相关文章
华为升腾910D芯片开发进展:目标超越NVIDIA H100
2025-04-29
华为升腾910系列芯片库存告急
2 天前
华为下一代AI芯片升腾910D曝光
5 天前
美国众议院与英伟达闭门会议,谈及华为升腾910D芯片
2025-05-02
热门搜索