芯原股份发布高性能NPU IP,支持移动端大语言模型推理
来源:林慧宇 发布时间:2025-06-09 分享至微信
据报道,6月9日,上海芯原股份(股票代码:688521.SH)宣布,其自主研发的超低功耗、高性能神经网络处理器(NPU)IP已实现对移动端大语言模型(LLM)推理的支持,AI算力可扩展至40 TOPS以上。

芯原的NPU IP采用高度可配置与可扩展架构,支持混合精度计算、稀疏化优化及并行处理。其设计结合高效的内存管理与稀疏感知加速技术,显著降低了计算负载和延迟,确保AI处理流畅且响应迅速。该NPU IP兼容数百种AI算法,如AI降噪(AI-NR)、AI超分(AI-SR)等,并支持Stable Diffusion、LLaMA-7B等主流AI模型。此外,该IP还可与其他芯原处理器IP无缝集成,实现异构计算,助力SoC设计者开发满足多样化需求的AI解决方案。

芯原的NPU IP还支持TensorFlow Lite、ONNX、PyTorch等主流AI框架,为客户在不同应用场景中的部署提供便利,并简化集成流程。

芯原首席战略官、执行副总裁兼IP事业部总经理戴伟进表示:“随着生成式AI(AIGC)和多模态大语言模型技术的快速发展,AI算力已成为移动设备的关键差异化要素。在支持高强度AI计算负载时,能耗控制是最具挑战性的环节之一。芯原通过持续优化超低功耗NPU技术,并与主流SoC合作伙伴紧密协作,已成功推动该技术在新一代智能手机和AI PC中的量产应用。”
[ 新闻来源:林慧宇,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!