当算力开始按Token计价，这家芯片公司换了一种打法

来源：时代财经

媒体

2026-04-02 11:20:06

（原标题：当算力开始按Token计价，这家芯片公司换了一种打法）

本文来源：时代财经作者：庾子山

2026年的算力产业，正在从“比芯片”，走向“比体系”。

过去很长一段时间里，行业的竞争逻辑高度收敛：谁能做出更先进制程的芯片、谁能在单卡上跑出更高的性能，谁就掌握话语权。但大模型的爆发，正在把这套规则一点点拆解。训练不再是终点，推理成为主战场；算力不再是一次性投入，而是持续消耗的生产资料。

一个更直观的变化是，算力开始被重新“计量”。随着Token成为AI应用的基本单位，数据中心的角色也在发生转变，它不再只是堆叠服务器的物理空间，而更像一座持续运转的“工厂”，以电力和数据为原料，稳定输出Token。衡量算力能力的标准，也从“峰值性能”，转向“单位成本下的持续产出”。

在这样的背景下，单芯片性能的重要性被系统效率所稀释。芯片、互联、存储、软件栈以及调度能力，构成一个高度耦合的整体，任何短板都会放大成本、吞噬性能。算力的竞争，开始从“点”的突破，转向“面”的协同。

也正是在这一轮范式切换中，壁仞科技的路径逐渐清晰起来。

如果简单将其定义为一家GPU公司，已经很难解释其近几年的动作。从早期聚焦通用GPU芯片落地，到构建面向大模型训练与推理的超节点集群，再到持续补齐软件栈能力，提供软硬件深度协同的整体解决方案，壁仞的重心，正在从“做一颗芯片”，转向“交付一套算力”。

商业模式正在进化

在国内GPU公司中，壁仞科技是较早“出圈”的玩家之一。2022年，其首款旗舰芯片BR100发布，以高峰值算力迅速引发市场关注，也被视为国产GPU中少数具备对标国际一线水平潜力的产品。在这一阶段，壁仞的定位仍然清晰，一家以产品力突围的芯片设计公司。

但随着大模型的爆发，尤其是“OpenClaw”等智能体应用的兴起，模型的运行方式正在发生根本变化。它不再是被动响应一次提问，而是围绕用户目标展开持续行动：调用工具、分解任务、反复推理，在多轮交互中不断修正路径。

这直接改变了算力的消费逻辑，从“买设备”，转向“买产出”。客户关心的，不再只是单卡性能，而是单位时间内能生成多少Token、单位Token成本是多少，以及系统能否长期稳定运行。

壁仞科技的转向，正是由此展开。通过“芯片+系统+生态”的整合型商业模式，壁仞科技正在将算力从硬件产品，转变为高效、稳定的系统级能力。

过去几年，壁仞科技产品形态逐步从单一芯片扩展至覆盖芯片、板卡、服务器及集群的完整体系。在硬件层，持续迭代GPGPU架构与SoC设计，并通过Chiplet技术推动多裸晶封装；在系统层，提供PCIe卡、OAM模块及整机服务器等多形态产品，并支持风冷与液冷方案，以适配数据中心能耗与密度约束。

从实际落地情况看，这一路径已在部分场景中得到验证。根据灼识咨询的资料，壁仞科技是中国首批在商业化产品中引入PCIe Gen5、CXL、高性能DRAM及双裸晶芯粒设计的GPGPU公司之一，同时也是较早完成高性能OAM及通用底板开发、原型验证并实现量产的厂商之一。

更关键的变化，发生在软件与集群层。

围绕自研的BIRENSUPA软件平台，壁仞将各类硬件系统与AI应用场景打通，提供包括程序设计界面、高性能资料库、训练与推理框架以及完整工具链在内的一体化能力，从而显著降低AI开发与部署的复杂度。在此基础上，其进一步强化生态兼容性，即BIRENSUPA与其他第三方GPGPU计算软件平台兼容，大幅降低了GPGPU产品成本。

顺着这一能力延伸，壁仞将软硬件体系与服务器、存储及网络等基础设施整合，形成面向大规模训练与推理的集群解决方案。换句话说，其试图解决的，已不再只是“芯片能跑多快”，而是“系统能否稳定、高效地运行”。

灼识咨询资料显示，壁仞是国内最早实现千卡级GPU集群商用的公司之一；在实际运行中，千卡集群可连续稳定运行5天以上无软硬件故障，训练任务持续30余天不中断。

高速成长的财务印证

商业模式是否跑通，最终要在财务数据中得到验证。壁仞科技2025年的表现，提供了一组相对清晰的信号。

2025年，壁仞科技实现收入10.35亿元，同比增长207.2%。这轮高速增长的直接驱动因素，是旗舰通用GPU产品的规模化量产与交付，以及多个千卡级智算集群项目的落地。其中，BR106与BR166系列完成全形态量产，而作为最新旗舰产品的BR166于2025年8月才开始放量，在不到半年的时间里便贡献了可观增量。

这一表现具有一定指示意义：在放量时间相对有限的情况下仍实现收入跃升，侧面反映出市场对国产高端算力产品的需求正在快速释放，也从侧面验证了壁仞在高性能算力市场中的产品竞争力。

盈利能力的改善同样值得关注。毛利率达到53.8%，已进入相对健康区间。在通用GPU这类高研发、高门槛行业中，毛利水平往往直接反映产品定价能力与客户接受度。毛利的提升，意味着其不仅“卖得动”，且具备一定议价空间。

在可持续性层面，客户与订单结构提供了另一重支撑。收入增长并非依赖单一产品或单一客户，而是建立在通用GPU产品与千卡级集群项目的组合交付之上，客户覆盖算力平台、电信运营商及大模型公司等高需求主体。这种多元结构，有助于平滑周期波动，并为后续增长提供延续性。

资金侧亦较为充裕。截至2025年底，壁仞科技持有现金及金融资产28.96亿元，叠加2026年初IPO募集资金，总体资金规模超过85亿元，为持续研发、产能扩张及项目交付提供支撑。

事实上，壁仞的商业逻辑，正从单一的技术驱动，过渡到技术与商业化能力同步推进的阶段。收入的快速放量验证了市场接纳度，毛利改善体现产品竞争力，而多元客户与在手项目，则构成其增长延续的基础。

向上突破：下一代技术与生态

如果说过去几年，壁仞科技完成的是从“芯片设计公司”向“系统级算力提供者”的转身，那么其后续成长空间，取决于技术演进与生态绑定。

首先是技术侧的前瞻布局。

在既有产品体系之外，壁仞已明确推进基于新一代架构的BR20X系列，面向云端训练与推理场景。从技术方向看，这一代产品并非简单性能升级，而是围绕当前大模型计算特征进行针对性优化，包括对FP8、FP4等更广泛数据格式的原生支持，更大更快的内存、更高速的互连带宽及超节点系统设计。本质上，其目标是提升单位算力的有效产出，并压低整体拥有成本，以适应“Token工厂”的算力需求。

此外，更长周期的产品节奏亦已铺开。面向云端训练与推理的BR30X，以及面向边缘侧的BR31X，预计于2028年前后进入商业化阶段。目前相关产品仍处于可行性分析及早期研发过程中，但其指向较为明确，在算力能力、扩展能力及生态适配性上继续外延，为后续市场竞争预留空间。

与芯片演进同步推进的，是对超大规模集群的前置投入。

基于自主原创的Chiplet架构大算力GPU和光互连技术，壁仞正在构建万卡级乃至更大规模的国产GPU集群体系。相较传统铜缆互连，光互连在带宽、延迟与传输距离方面具有明显优势，被视为支撑超大规模算力集群的关键基础设施。

在生态层面，壁仞正尝试从“适配模型”转向“参与定义模型”。其与阶跃星辰、上海仪电旗下智算服务共建的人工智能联合实验室，即是这一思路的体现。三方分别在算力、模型与基础设施运营侧形成分工，试图打通从芯片到模型、再到应用落地的闭环。在这一体系中，GPU不再只是被动执行计算任务，而是与模型架构形成更深层协同。

这种“芯模联合定义”的路径，一旦形成，将在性能优化、成本控制以及迭代效率上形成复合优势，进而构筑更稳固的竞争壁垒。

从需求侧看，这一布局亦有现实支撑。一方面，AI应用仍处于渗透初期，Token消耗随智能体等新形态快速增长，对算力的需求呈现持续性；另一方面，在国产替代与自主可控政策推动下，本土算力体系建设加速，为国产厂商提供了明确的市场空间。

技术迭代、生态协同与市场扩张三者叠加，构成了壁仞科技未来增长的基本框架。

特别推荐

长期向好趋势不变伟明环保三大业务蓄势待发

证券之星资讯

2026-04-02

从OpenAI关停Sora看AI公司必须跨过的坎

证券之星资讯

2026-04-02

中国移动：2025年净利下滑，通信服务收入萎缩，加码算力尚存挑战

证券之星资讯

2026-04-02

首页股票财经基金导航

举报专区联系我们

当算力开始按Token计价，这家芯片公司换了一种打法

相关个股

相关阅读

特别推荐