|

财经

安谋科技Arm China“周易”X3 NPU IP,树立端侧AI新标杆!

来源:半导体行业观察

2025-11-18 09:41:39

(原标题:安谋科技Arm China“周易”X3 NPU IP,树立端侧AI新标杆!)

公众号记得加星标,第一时间看推送不会错过。

在“AI+”浪潮席卷全球、半导体产业迎来深刻变革的当下,端侧智能设备对AI计算的需求正呈爆发式增长。从智能汽车的辅助驾驶决策到AI PC的多模态交互,从物联网设备的实时推理到移动终端的大模型应用,算力受限、带宽瓶颈、开发门槛高等问题,成为制约端侧AI规模化落地的核心痛点。

在这一背景下,NPU作为AI计算的专用引擎,正成为推动端侧智能落地的关键力量。

“周易”X3 NPU IP,以软硬协同新架构引领端侧AI进化

2025年11月13日,安谋科技在上海正式举办“周易”X3 NPU IP新品发布会,以“All in AI”的战略决心,推出专为大模型而生的新一代NPU IP,为端侧AI计算效率树立全新标杆。


“周易”X3 NPU IP新品发布会现场

作为安谋科技“AI Arm CHINA”战略发展方向的关键实践,“周易”X3 NPU IP的发布并非偶然。


安谋科技Arm China产品研发副总裁刘浩

安谋科技Arm China产品研发副总裁刘浩表示:“在‘All in AI’产品战略的指引下,我们将持续加大投入,以前瞻性视野整合顶尖研发资源,秉持开放合作理念,积极适配主流模型与OS,为生态伙伴提供业界领先的从硬件、软件到技术服务的全流程解决方案,全力赋能伙伴的产品创新和商业化落地。”


自2018年布局NPU领域以来,安谋科技已成功交付5代NPU产品并实现终端商业落地,本土全栈式研发团队的技术积累,为“周易”X3的跨越式升级奠定了坚实基础。


硬件架构革新:从定点到浮点,专为大模型优化

据介绍,“周易”X3最核心的突破在于采用专为大模型设计的最新DSP+DSA架构,完成了从定点到浮点计算的关键转变,构建起通用+专用的融合架构。


安谋科技Arm China产品总监鲍敏祺

安谋科技Arm China产品总监鲍敏祺表示,其单Cluster最高支持4个Core,具备8–80 FP8 TFLOPS的灵活算力配置,单Core带宽高达256GB/s,配合自研解压硬件WDC,能让大模型Weight软件无损压缩后获得额外15%-20%的等效带宽提升,彻底破解端侧带宽瓶颈。


针对端侧大模型运行需求,“周易”X3新增W4A8/W4A16计算加速模式,通过低比特量化大幅降低带宽消耗,支持云端大模型向端侧高效迁移。集成的AI专属硬件引擎AIFF与专用硬化调度器,更实现了超低至0.5%的CPU负载与低调度延迟,可灵活应对多任务并行场景和任意优先级调度需求,显著提升处理能力。

软件生态开放:让AI开发从“好用”到“用好”

众所周知,硬件的强大性能,需要完善的软件生态来充分释放。

在软件层面,“周易”X3搭载全新升级的Compass AI软件平台,聚焦开放、易用、高效等核心指标,构建起覆盖开发全流程的工具链,破解端侧AI开发“适配难、周期长、门槛高”的痛点。平台广泛兼容TensorFlow、PyTorch、Hugging Face、ONNX等主流AI框架,同时原生支持Hugging Face模型库,通过AIPULLM工具链实现大模型实现“一站式”转化与部署,极大降低开发门槛。


据悉,在模型支持方面,Compass AI平台已覆盖超160种算子与270多种模型,包括LLM、VLM、VLA及MoE等前沿模型,支持GPTQ等主流量化方案和Tensor/Channel/Token Level多样量化方式。

更重要的是,平台已将Parser、Optimizer、Linux Driver等核心组件开源,提供丰富的调试工具和易用的DSL算子编程语言,允许客户开发自定义算子或打造专属模型编译器,实现差异化设计,进而帮助客户与开发者提升开发效率。


“周易”X3 NPU IP亮点

鲍敏祺指出:“‘周易’X3遵循‘软硬协同、全周期服务与成就客户’的产品准则,提供从硬件、软件到售后服务的全链路支持,以前瞻性设计、专业团队交付与深度服务投入,全面助力客户产品成功与商业化落地。”

在软硬协同的深度优化下,“周易”X3在实际测试中表现卓越:CNN模型性能较上一代“周易”X2产品提升30%-50%,多核算力线性度达70%-80%;同算力规格下,AIGC大模型能力提升10倍,Llama2 7B大模型Prefill阶段算力利用率高达72%,Decode阶段有效带宽利用率超100%,充分释放硬件潜力,远超行业平均水平。

此外,“周易”X3支持int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32等多精度融合计算,能灵活适配从传统CNN到前沿大模型的多样化数据类型需求,平衡性能与能效,为不同场景的AI应用提供精准算力支持。

多场景全面赋能:从无形IP到AI万象


安谋科技Arm China NPU产品线负责人兼首席架构师舒浩博士

针对“周易”X3 NPU IP架构,安谋科技Arm China NPU产品线负责人兼首席架构师舒浩博士在分享中强调:“‘周易’X3的产品优势,源于通用、灵活、高效且软硬紧密协同的系统架构设计,这一设计使其兼具广泛的行业适用性与灵活的边端侧AI应用场景匹配能力。”


软硬件的深度协同,让“周易”X3不仅能提供极致算力,更能让开发者高效发挥硬件潜力,加速AI应用落地。据悉,“周易”X3 NPU IP的应用场景已全面覆盖基础设施、智能汽车、移动终端、智能物联网四大核心领域,为各类AI设备注入强劲算力。


在基础设施领域,“周易”X3 NPU IP支持CNN与大模型等多样结构的AI模型加速,为数据中心及边缘计算节点提供核心算力;在智能汽车领域,既可为ADAS系统的自动泊车功能提供高性能AI算力,也能支持IVI系统的语音与视频智能互动;在移动终端领域,可实现AI PC、AI手机的超分渲染,并支持基于大模型的AI Agent应用;在智能物联网领域,为智能网关、智能IPC等设备提供本地AI推理能力,提升响应速度并保障隐私安全。

在发布会现场的Demo区,安谋科技还系统展示了“周易”NPU产品家族的技术演进路径与落地成果:从Z1系列赋能AIoT基础感知,到X2系列实现端侧多模态AI流畅运行,再到X3系列展现主流大模型的文生文、文生图、图生文等复杂认知能力,端侧AI正从单一功能实现迈向全民普及的新阶段。


“周易”NPU IP系列家族现场demo展示区

展望未来,安谋科技在NPU架构领域的演进方向清晰明确:将持续强化计算架构的通用计算能力与扩展能力,提升单核Scale-up/Down与多核Scale-out性能,探索多Die、多Chip协同技术;软件层面将优化编程模型,打造更友好的软件使用界面与层次化完备的接口,支持更多数据格式与网络结构;同时将深化开放生态布局,拓展更多合作模式,推动软硬件协同开发与高效部署。


深耕本土创新,共筑AI产业基石

整体来看,作为国内领先的芯片IP设计与服务提供商,安谋科技始终坚持本土研发与开放创新,致力于为中国智能计算“芯”生态的发展助力赋能。

从2018年组建国内最早的NPU研发团队之一,到如今形成覆盖Z系列与X系列的NPU技术演进路径与产品矩阵,安谋科技的每一步都紧扣行业需求,以技术创新破解产业痛点。

本次“周易”X3 NPU IP的发布,标志着安谋科技“All in AI”产品战略的全面落地。在“AI+”行动计划的指引下,安谋科技将继续深耕技术创新,连接全球前沿技术,携手生态伙伴共建开放、共赢的产业生态,为国内“AI+”产业升级构建坚实的智能计算基石,为千行百业的智能化转型注入更强IP“核芯”动力。

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4229期内容,欢迎关注。

加星标第一时间看推送,小号防走丢



求推荐


半导体行业观察

2025-11-18

半导体行业观察

2025-11-18

半导体行业观察

2025-11-18

半导体行业观察

2025-11-18

首页 股票 财经 基金 导航