来源:时代财经
媒体
2026-04-02 11:20:06
(原标题:当算力开始按Token计价,这家芯片公司换了一种打法)
本文来源:时代财经 作者:庾子山
2026年的算力产业,正在从“比芯片”,走向“比体系”。
过去很长一段时间里,行业的竞争逻辑高度收敛:谁能做出更先进制程的芯片、谁能在单卡上跑出更高的性能,谁就掌握话语权。但大模型的爆发,正在把这套规则一点点拆解。训练不再是终点,推理成为主战场;算力不再是一次性投入,而是持续消耗的生产资料。
一个更直观的变化是,算力开始被重新“计量”。随着Token成为AI应用的基本单位,数据中心的角色也在发生转变,它不再只是堆叠服务器的物理空间,而更像一座持续运转的“工厂”,以电力和数据为原料,稳定输出Token。衡量算力能力的标准,也从“峰值性能”,转向“单位成本下的持续产出”。
在这样的背景下,单芯片性能的重要性被系统效率所稀释。芯片、互联、存储、软件栈以及调度能力,构成一个高度耦合的整体,任何短板都会放大成本、吞噬性能。算力的竞争,开始从“点”的突破,转向“面”的协同。
也正是在这一轮范式切换中,壁仞科技的路径逐渐清晰起来。
如果简单将其定义为一家GPU公司,已经很难解释其近几年的动作。从早期聚焦通用GPU芯片落地,到构建面向大模型训练与推理的超节点集群,再到持续补齐软件栈能力,提供软硬件深度协同的整体解决方案,壁仞的重心,正在从“做一颗芯片”,转向“交付一套算力”。
商业模式正在进化
在国内GPU公司中,壁仞科技是较早“出圈”的玩家之一。2022年,其首款旗舰芯片BR100发布,以高峰值算力迅速引发市场关注,也被视为国产GPU中少数具备对标国际一线水平潜力的产品。在这一阶段,壁仞的定位仍然清晰,一家以产品力突围的芯片设计公司。
但随着大模型的爆发,尤其是“OpenClaw”等智能体应用的兴起,模型的运行方式正在发生根本变化。它不再是被动响应一次提问,而是围绕用户目标展开持续行动:调用工具、分解任务、反复推理,在多轮交互中不断修正路径。
这直接改变了算力的消费逻辑,从“买设备”,转向“买产出”。客户关心的,不再只是单卡性能,而是单位时间内能生成多少Token、单位Token成本是多少,以及系统能否长期稳定运行。
壁仞科技的转向,正是由此展开。通过“芯片+系统+生态”的整合型商业模式,壁仞科技正在将算力从硬件产品,转变为高效、稳定的系统级能力。
过去几年,壁仞科技产品形态逐步从单一芯片扩展至覆盖芯片、板卡、服务器及集群的完整体系。在硬件层,持续迭代GPGPU架构与SoC设计,并通过Chiplet技术推动多裸晶封装;在系统层,提供PCIe卡、OAM模块及整机服务器等多形态产品,并支持风冷与液冷方案,以适配数据中心能耗与密度约束。
从实际落地情况看,这一路径已在部分场景中得到验证。根据灼识咨询的资料,壁仞科技是中国首批在商业化产品中引入PCIe Gen5、CXL、高性能DRAM及双裸晶芯粒设计的GPGPU公司之一,同时也是较早完成高性能OAM及通用底板开发、原型验证并实现量产的厂商之一。
更关键的变化,发生在软件与集群层。
围绕自研的BIRENSUPA软件平台,壁仞将各类硬件系统与AI应用场景打通,提供包括程序设计界面、高性能资料库、训练与推理框架以及完整工具链在内的一体化能力,从而显著降低AI开发与部署的复杂度。在此基础上,其进一步强化生态兼容性,即BIRENSUPA与其他第三方GPGPU计算软件平台兼容,大幅降低了GPGPU产品成本。
顺着这一能力延伸,壁仞将软硬件体系与服务器、存储及网络等基础设施整合,形成面向大规模训练与推理的集群解决方案。换句话说,其试图解决的,已不再只是“芯片能跑多快”,而是“系统能否稳定、高效地运行”。
灼识咨询资料显示,壁仞是国内最早实现千卡级GPU集群商用的公司之一;在实际运行中,千卡集群可连续稳定运行5天以上无软硬件故障,训练任务持续30余天不中断。
高速成长的财务印证
商业模式是否跑通,最终要在财务数据中得到验证。壁仞科技2025年的表现,提供了一组相对清晰的信号。
2025年,壁仞科技实现收入10.35亿元,同比增长207.2%。这轮高速增长的直接驱动因素,是旗舰通用GPU产品的规模化量产与交付,以及多个千卡级智算集群项目的落地。其中,BR106与BR166系列完成全形态量产,而作为最新旗舰产品的BR166于2025年8月才开始放量,在不到半年的时间里便贡献了可观增量。
这一表现具有一定指示意义:在放量时间相对有限的情况下仍实现收入跃升,侧面反映出市场对国产高端算力产品的需求正在快速释放,也从侧面验证了壁仞在高性能算力市场中的产品竞争力。
盈利能力的改善同样值得关注。毛利率达到53.8%,已进入相对健康区间。在通用GPU这类高研发、高门槛行业中,毛利水平往往直接反映产品定价能力与客户接受度。毛利的提升,意味着其不仅“卖得动”,且具备一定议价空间。
在可持续性层面,客户与订单结构提供了另一重支撑。收入增长并非依赖单一产品或单一客户,而是建立在通用GPU产品与千卡级集群项目的组合交付之上,客户覆盖算力平台、电信运营商及大模型公司等高需求主体。这种多元结构,有助于平滑周期波动,并为后续增长提供延续性。
资金侧亦较为充裕。截至2025年底,壁仞科技持有现金及金融资产28.96亿元,叠加2026年初IPO募集资金,总体资金规模超过85亿元,为持续研发、产能扩张及项目交付提供支撑。
事实上,壁仞的商业逻辑,正从单一的技术驱动,过渡到技术与商业化能力同步推进的阶段。收入的快速放量验证了市场接纳度,毛利改善体现产品竞争力,而多元客户与在手项目,则构成其增长延续的基础。
向上突破:下一代技术与生态
如果说过去几年,壁仞科技完成的是从“芯片设计公司”向“系统级算力提供者”的转身,那么其后续成长空间,取决于技术演进与生态绑定。
首先是技术侧的前瞻布局。
在既有产品体系之外,壁仞已明确推进基于新一代架构的BR20X系列,面向云端训练与推理场景。从技术方向看,这一代产品并非简单性能升级,而是围绕当前大模型计算特征进行针对性优化,包括对FP8、FP4等更广泛数据格式的原生支持,更大更快的内存、更高速的互连带宽及超节点系统设计。本质上,其目标是提升单位算力的有效产出,并压低整体拥有成本,以适应“Token工厂”的算力需求。
此外,更长周期的产品节奏亦已铺开。面向云端训练与推理的BR30X,以及面向边缘侧的BR31X,预计于2028年前后进入商业化阶段。目前相关产品仍处于可行性分析及早期研发过程中,但其指向较为明确,在算力能力、扩展能力及生态适配性上继续外延,为后续市场竞争预留空间。
与芯片演进同步推进的,是对超大规模集群的前置投入。
基于自主原创的Chiplet架构大算力GPU和光互连技术,壁仞正在构建万卡级乃至更大规模的国产GPU集群体系。相较传统铜缆互连,光互连在带宽、延迟与传输距离方面具有明显优势,被视为支撑超大规模算力集群的关键基础设施。
在生态层面,壁仞正尝试从“适配模型”转向“参与定义模型”。其与阶跃星辰、上海仪电旗下智算服务共建的人工智能联合实验室,即是这一思路的体现。三方分别在算力、模型与基础设施运营侧形成分工,试图打通从芯片到模型、再到应用落地的闭环。在这一体系中,GPU不再只是被动执行计算任务,而是与模型架构形成更深层协同。
这种“芯模联合定义”的路径,一旦形成,将在性能优化、成本控制以及迭代效率上形成复合优势,进而构筑更稳固的竞争壁垒。
从需求侧看,这一布局亦有现实支撑。一方面,AI应用仍处于渗透初期,Token消耗随智能体等新形态快速增长,对算力的需求呈现持续性;另一方面,在国产替代与自主可控政策推动下,本土算力体系建设加速,为国产厂商提供了明确的市场空间。
技术迭代、生态协同与市场扩张三者叠加,构成了壁仞科技未来增长的基本框架。
时代财经
2026-04-02
时代财经
2026-04-01
时代财经
2026-03-30
时代财经
2026-03-29
时代财经
2026-03-27
时代财经
2026-03-26
证券之星资讯
2026-04-02
证券之星资讯
2026-04-02
证券之星资讯
2026-04-02