来源:21世纪经济报道
媒体
2026-06-17 16:54:26
(原标题:Token走向零毛利时代 智谱路在何方?)
5月22日晚间,DeepSeek没有开发布会,没有通稿,只是静悄悄地在官方渠道更新了一则公告。
公告写得极其简短,核心只有一句话:全系API输入降价。尤其是旗舰模型DeepSeek-V4系列,限时叠加1/4优惠,相当于永久降价75%。
若是将DeepSeek-V4 Pro的最新定价与OpenAI和Claude同档位模型做对比,这中间产生的Token(词元)输出价差超100倍。可以说,DeepSeek这一刀下去,砍出全球头部大模型报价历史最低点。
这不是在卷同行,而是在逼所有人回答一个问题:“如果你的模型性价比拼不过DeepSeek,你的市场定位是什么?”一位国内头部云厂商AI产品负责人深夜在朋友圈里发出灵魂拷问。
而这颗石子激起的涟漪里,最耐人寻味的样本之一,是智谱——一个在Token走向零毛利时代的浪潮中,选择逆流而上的公司。
“赚1元,亏6.5元”的烧钱困境
进入6月,全球多家大模型厂商紧跟DeepSeek步伐,开启调价潮。据公开消息,国内的小米MiMo-V2.5系列、字节跳动Seedance 2.0系列、腾讯云接入的MiniMax-M3都宣布降价;国外的OpenAI也于6月11日启动首轮大规模API降价。
对DeepSeek来说,低价是武器。但对绝大多数中国大模型创业公司来说,同样的低价,到底是“黎明前的黑暗”,还是“注定填不满的无底洞”?
以已上市的智谱(2513.HK)为观察样本,“Token走向零毛利时代”这句话正在从预言变为现实。
2025年,智谱全年营收达到7.24亿元,同比增长131.9%;年内净亏损47.18亿元,同比扩大59.5%。这样算下来,智谱2025年每赚1元收入,就要亏去6.5元。
其中,智谱2025年研发开支高达31.8亿元,约为其当年收入的4.4倍。这意味着智谱每赚1元,就要投入4.4元在研发上。这样的商业模式,可谓是越努力,越亏损。
而这还不是智谱“烧钱”的全部。据智谱2025年报,智谱单是经营本身就“吃掉”约22.46亿元现金,外加投资所用掉的现金3.76亿元,全年共流出26.22亿元现金。而其账面现金之所以没崩,是因为后续有融资活动补了进来。
2026年1月,智谱成功登陆港股市场,融得45.16亿元,而这里面有26.14亿元作为融资净流入进入报表。
把流入和流出一算可以发现,智谱2025年经营活动本身并未产生现金积累。可以说,当下的智谱根本不是一个正常盈利公司,而是一个靠融资输血的研发型公司。
这也是为什么智谱在2026年6月公告,拟冲刺科创板A股上市,计划募资150亿元。这本质上还是在拉长“资本续命”的跑道。
当全球大模型厂商掀起Token降价潮,若是智谱也被裹挟着降价,那么其现金流状况危如累卵。
谁降价谁更弱势?
为此,近2年,智谱做了两件看似矛盾的事——先降价,再提价。
2025年4月,智谱BigModel开放平台进行了一次大规模调价:GLM-4-Plus降价90%,从50元/百万tokens降至5元/百万tokens;GLM-4-FlashX定价10元/亿tokens;GLM-Z1-Air定价50元/亿tokens。
彼时,字节豆包报价压到0.0008元/千tokens,大家都在比谁更便宜,智谱也不例外。
2026年成了分水岭。智谱是国产头部厂商中第一个实质性提价的,而且涨了好几轮。
2026年2月,伴随GLM-5发布,智谱对GLM Coding Plan进行了结构性调价,涨幅30%起,并取消了首购优惠。
2026年3月,智谱发布GLM-5-Turbo,API价格再上调20%,相对上代GLM-4.7累计涨幅约83%。
2026年4月,智谱发布GLM-5.1,API价格再提10%;4月中旬,智谱GLM Coding Plan海外版全线涨价80%至150%,Lite、Pro、Max版本的套餐价格从原先的每月10美元、30美元、80美元,分别涨至18美元、72美元、160美元,这个价格已经几乎等同于ChatGPT、Gemini、Claude等国外模型的订阅费。
对于涨价策略,智谱CEO张鹏在业绩会上用一组数据打消市场疑虑:2026年一季度智谱API涨价83%后,调用量不降反升,市场依然供不应求,调用量增长400%。
张鹏表示,这印证了高质量Token是当下的稀缺资源。他还称,当模型足够强,API本身就是最好的商业模式,定价权是由技术实力以及长期趋势所带来的领先地位决定的。
不同于智谱硬气提价,同样港股上市的MiniMax(0100.HK)选择了降价,在旗舰模型MiniMax-M3上线一周后,宣布永久降价50%。
针对两家的不同策略,摩根大通6月12日发布了研究报告,并对中国两家上市AI模型公司作出截然相反的评级判断——维持智谱“增持”,将MiniMax下调至“中性”。
摩根大通在报告中指出,在AI使用需求仍超过推理供给的阶段,没有任何开发者会在需求过剩时主动降价。如果一家模型公司在新模型上线后迅速从溢价回撤,实际上就是在用定价行为承认——市场不接受这个溢价。
值得注意的是,MiniMax降价后已与DeepSeek系列处于同一价格区间,意味着其在定价上选择与“由DeepSeek设定价格的那一层”竞争。这将直接导致MiniMax丧失该价格区间的定价权。
反倒是智谱通过GLM-5和5.1持续刷新国内SOTA(最优模型),并在提价后使用量继续增长。摩根大通认为,这意味着下游工作流对GLM系列的依赖度足以支撑涨价。而市场以实际行动拒绝了MiniMax-M3的溢价预期。
智谱的“窄门”
参照云厂商的发展路径,通用推理Token正在走IaaS化的老路:可标准化的部分必然商品化,利润率趋近零,而真正的钱在上面的PaaS和SaaS层。这就是所谓的“K型分化”。
放到大模型行业里,通用推理Token加速商品化,沿着IaaS的老路滑向零毛利;活路只能往上走,要么做垂直场景Agent拿中等毛利,要么啃企业私有化部署的合规与替换成本,靠壁垒扛溢价。
而DeepSeek这次出手,恰恰是把这条K型曲线上的分岔口彻底焊死了。它用极致低价将所有试图停留在“通用Token批发商”位置的玩家,一把推进了零毛利的深渊。
回到DeepSeek那一刀砍下去的夜晚。它不只是砍出了历史最低价,更是把整个行业劈成了泾渭分明的两条路:一条是“Token批发商”的康庄大道,规模越大,离零毛利越近;另一条是企业级AI服务商的窄门,门槛越高,活得越久。
智谱选择了后者。它用2025年全年7.24亿元营收、47.18亿元亏损、22.46亿元经营现金流净流出的代价,换来了一组比财务报表更重要的数字:API涨价83%后调用量反增400%,GLM-5系列在多个基准上刷新中国SOTA,摩根大通给出“增持”评级。
这些数字告诉市场一件事:当你的模型足够强,客户愿意为你支付溢价,哪怕外面到处都是“地板价”。
但这条路并不好走。智谱2025年每赚1块钱就要亏6.5元的结构性缺口,不会因为一两轮涨价就自动弥合。它需要在现金烧完之前,完成三重跨越:收入从7亿级跨向数十亿级,让固定成本被大规模摊薄;自研推理效率逼近DeepSeek的水平,把第三方算力依赖降下来;本地化部署从项目制转向订阅制,让现金流从脉冲式变成持续式。
这三件事,任何一件都不容易。但比起在零毛利的Token红海里和DeepSeek拼刺刀,这至少是一条有出口的路。
Token走向零毛利时代,智谱路在何方?
答案或许就在张鹏那句表态里:“当模型足够强,API本身就是最好的商业模式。”但这句话有一个前提,那就是你不仅要真的足够强,还要市场也这么认为。
证券之星港美股
2026-06-17
证券之星港美股
2026-06-17
证券之星港美股
2026-06-17
证券之星港美股
2026-06-17
证券之星港美股
2026-06-17
证券之星港美股
2026-06-17
证券之星资讯
2026-06-17
证券之星资讯
2026-06-17
证券之星资讯
2026-06-17