芯原股份发布高性能NPU IP,支持移动端大语言模型推理
来源:林慧宇 发布时间:2025-06-09
分享至微信

据报道,6月9日,上海芯原股份(股票代码:688521.SH)宣布,其自主研发的超低功耗、高性能神经网络处理器(NPU)IP已实现对移动端大语言模型(LLM)推理的支持,AI算力可扩展至40 TOPS以上。
芯原的NPU IP采用高度可配置与可扩展架构,支持混合精度计算、稀疏化优化及并行处理。其设计结合高效的内存管理与稀疏感知加速技术,显著降低了计算负载和延迟,确保AI处理流畅且响应迅速。该NPU IP兼容数百种AI算法,如AI降噪(AI-NR)、AI超分(AI-SR)等,并支持Stable Diffusion、LLaMA-7B等主流AI模型。此外,该IP还可与其他芯原处理器IP无缝集成,实现异构计算,助力SoC设计者开发满足多样化需求的AI解决方案。
芯原的NPU IP还支持TensorFlow Lite、ONNX、PyTorch等主流AI框架,为客户在不同应用场景中的部署提供便利,并简化集成流程。
芯原首席战略官、执行副总裁兼IP事业部总经理戴伟进表示:“随着生成式AI(AIGC)和多模态大语言模型技术的快速发展,AI算力已成为移动设备的关键差异化要素。在支持高强度AI计算负载时,能耗控制是最具挑战性的环节之一。芯原通过持续优化超低功耗NPU技术,并与主流SoC合作伙伴紧密协作,已成功推动该技术在新一代智能手机和AI PC中的量产应用。”
[ 新闻来源:林慧宇,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!


林慧宇
开创IC领域,共创美好未来!
查看更多
相关文章
小米发布首个开源AI推理大模型MiMo
2025-04-30
新加坡推出多语言模型MERaLiON
2025-06-04
国内首个光子芯片专用大模型发布
2025-05-11
Nextchip采用Ceva NeuPro-M NPU,助力ADAS性能升级
2025-04-27
热门搜索