来源:21世纪经济报道
媒体
2026-01-30 22:36:49
(原标题:十七年闭关 阿里“通云哥”雏形初现)
“通云哥”不是一个新词,它是阿里旗下“通义实验室、阿里云、平头哥”组成的“大模型+云+芯片”全栈架构,但首次浮出水面是在近日。
早在2025年春天,马云就给阿里的AI战略提炼了这个名字,“通云哥”听起来和“风清扬”、“逍遥子”同属武侠江湖。
彼时马云并没有谈论太多具体的技术参数,而是定调,“‘通云哥’的使命,是让每一个人、每个企业都能参与AI时代。”
在当时,外界对此一无所知。直到九个月后,平头哥(阿里旗下芯片子公司,即将独立上市)官网悄然上线了“真武810E”高端AI芯片,“通云哥”所代表的阿里巴巴AI黄金三角,正式对外亮相。
过去很长一段时间,全球科技巨头在AI领域的角逐被简化为模型的参数之争。但是随着Scaling-Law放缓,AI应用挺进深水区,硅谷和中关村都在达成新共识,AI生态战是一整套系统工程。
在这个维度上,世界的目光曾只聚焦于谷歌,因为谷歌是拥有顶尖自研芯片(TPU)、世界级云平台和头部大模型(Gemini)的少数公司。
现在,中国的互联网巨头,也在搭建自己的全栈架构。阿里是“通云哥”,百度是“智能云+文心大模型+昆仑芯”,腾讯不太一样,“腾讯云+混元大模型”和腾讯旗下重仓的燧原科技,也在搭建系统化AI能力。
从2009年创建阿里云,到2018年成立平头哥芯片公司,再到2019年启动大模型研究,“通云哥”战略的成形,实际经过了长达17年的战略投入和垂直整合。
但是做全栈的路并不好走。阿里的Qwen大模型能力是有市场口碑的,做芯片,又是另一条完全不一样的路,生产工艺的短板一时半会儿补不上,类似于英伟达CUDA的生态更是要漫长的时间搭建。
有芯片行业投资人告诉21世纪经济报道记者,要想跟上全球头部公司的实力,我们国内厂商的芯片、算法等能力都还需要优化。
平头哥PPU,出货量已跻身前列
芯片的突破,是整个故事最坚实的基础,也是最艰难的起点。
自2018年合并中天微系统与达摩院芯片团队而诞生,平头哥半导体公司的使命就是在由国际巨头高度垄断的芯片领域,为中国科技公司撕开一道突破口。随后,阿里相继推出含光800、玄铁处理器、倚天710等产品,并在云计算与推理加速场景中逐步落地。
“真武810E”这款芯片,在业内传闻已久,却一直“只闻其声不见其人”。甚至在2025年9月,央视《新闻联播》在报道三江源绿电智算中心项目时,其参数在对比表格中一闪而过,才引发了外界最早的猜测。
直到29日,它的技术细节才公开,并且极为低调,没有正式的发布会,只在平头哥官网上做了更新。
据平头哥官网介绍,“真武”PPU采用自研并行计算架构和片间互联技术,配合全栈自研软件栈,实现软硬件全自研。其内存为96G HBM2e,片间互联带宽达到700 GB/s,可应用于AI训练、AI推理和自动驾驶。
据悉,阿里巴巴已将“真武”PPU大规模用于千问大模型的训练和推理,并结合阿里云完整的AI软件栈进行深度优化,为客户提供一体化产品和服务。
有芯片行业投资人对21世纪经济报道记者表示,互联网公司自己投入芯片研发,是很正常的选择。毕竟,在大模型训练的过程中,对于算力的需求十分强大,自研芯片一方面节约成本,一方面也可以更加稳定提升效率。未来可能会对英伟达造成影响。
据业内人士透露,对比关键参数,“真武”PPU的整体性能超过了英伟达A800和主流国产GPU,与英伟达H20相当。另据外媒最新报道,升级版“真武”PPU的性能强于英伟达A100。
多位行业从业者告诉记者,“真武”PPU性能优异稳定、性价比突出,在业内口碑良好,市场供不应求。据报道,真武PPU累计出货量已达数十万片,超过寒武纪,在国产GPU厂商中属于第一梯队。
与“国产GPU四小龙”等几乎同期成立的创业公司不同,平头哥从诞生起就拥有一个确定且庞大的内部客户——阿里云。据悉,“真武”PPU已在阿里云实现多个万卡集群部署,服务了国家电网、中科院、小鹏汽车、新浪微博等400多家客户。
对于阿里来说,自研芯片不仅能优化性能、降低对英伟达等国际巨头的依赖,还能在架构层面与自家的AI框架、模型进行深度协同。近期行业讨论中多位芯片行业人士都有提及,“模型与芯片的双向奔赴,才是国产AI生态成型的关键”。
不过,和众多国产芯片一样,平头哥也面临着行业困境,自研芯片并不意味着能通吃一切。
首先是硬件层面的差距。
平头哥等国内芯片企业无法使用目前最先进的芯片制程,存在约两代的代际差距。更大的短板在于缺乏高效的大规模互联技术,难以组建高性能万卡级集群,限制了其在超大模型训练场景的竞争力。
软件方面,则存在生态适配困境。
“芯片不是一个孤立的东西”,有芯片行业投资人向记者表示,上面还需要大量软件适配,尤其是与英伟达CUDA生态的兼容——这是几乎所有中国AI芯片公司共同面临的“高墙”。
此外,AI模型架构本身仍在快速演进,上述人士向记者表示,从Transformer到可能出现的下一代基础架构,芯片设计需具备足够的弹性与前瞻性。一旦技术路线发生突变,专用芯片可能面临“刚量产即过时”的风险,在这方面,英伟达总是动作更快的。
尽管如此,平头哥依然拥有独特的生存土壤与发展逻辑。“市场空间依然很大。英伟达依然在高增长,但它的芯片不是什么场景都适合,互联网大厂研发的芯片还是会有机会,在一些更偏应用层的领域能率先用起来,比如消费电子、电器类产品。”上述投资人向记者表示。
在中国市场,算力自主已成为不可逆的战略方向。政策引导、信创采购与本土云巨头的自研需求,共同构成了国产AI芯片的基本盘。
“通云哥”黄金三角,阿里的全栈AI野心
“真武”芯片的亮相,像一块决定性的拼图,让阿里巴巴的AI全景图完整浮现出来。这就是“通云哥”组合。
在模型层,通义千问大模型需要巨量且高效的算力进行训练和推理;在基础设施层,阿里云需要提供稳定、有竞争力且成本可控的算力服务;在硬件层,平头哥则致力于提供能满足前两者需求的自研芯片。
三者协同,理论上可以在芯片架构、云平台架构和模型架构上实现统一设计与联合优化,从而提升整个系统的效率。
这种全栈自研的路径,在全球范围内也仅有少数科技巨头在尝试。
亚马逊和微软有云和芯片,但缺乏顶级的模型,通常依赖外部合作,比如微软绑定OpenAI,AWS接入Anthropic、Mistral。接入多家模型供应商的策略初期见效快,但长期面临合作风险。2025年,OpenAI已开始将部分负载迁移至Google Cloud和Oracle,并计划下调与微软的分成比例。
OpenAI则是另一个极端。它拥有全球最受关注的大模型,但没有自己的云底座,也没有芯片。这意味着它的技术演进始终受制于合作伙伴的资源分配和商业节奏。一旦云厂商调整优先级,或地缘政治干扰供应链,其扩张就可能受阻。
正因如此,整合的能力差异,正成为决定未来AI产业格局的关键因素。对于大多数客户而言,他们需要的不是某个孤立的高性能模型或芯片,而是一套能稳定交付、持续迭代、安全可控的端到端解决方案。
谷歌是这一模式的先行者。其TPU芯片专为PaLM大模型设计,Gemini系列模型深度集成Android、Workspace等生态,不久前推出的Nano Banana图像生成模型更推动Gemini APP登顶AI应用榜首。这种软硬一体的协同,使其在AI推理效率和用户体验上建立壁垒。
阿里走的也是类似路径。回望阿里巴巴过去的布局,2009年创建阿里云,2018年成立平头哥芯片公司,2019年启动大模型研究,经过长达17年的战略投入和垂直整合,实现“通云哥”全栈AI的完整布局。
“全栈AI技术能力已成为阿里云的关键竞争优势。”阿里巴巴CEO吴泳铭在2026财年第二季度财报分析师电话会上表示。
眼下,阿里巴巴正在将“通云哥”打造成一台AI超级计算机,在芯片架构、云平台架构和模型架构上协同创新,从而实现在阿里云上训练和调用大模型时达到最高效率。
目前,阿里和谷歌是全球唯二在大模型、云和芯片三大领域均有布局、还有实力的科技公司。有行业人士向记者表示,垂直整合虽前期投入巨大、见效慢,但一旦跑通,便能在性能调优、成本控制和迭代速度上建立系统性优势。
不过,这套路径是否能落地仍待检验,芯片的能力仍占据核心位置。有芯片行业投资人向记者表示,这条路径在国内面临的挑战会大于机遇。在他看来,阿里在大模型层面的投入是坚决的,通义的表现也属不错,但在芯片环节的薄弱可能会拖累全栈能力的真正落地。
他认为,在中国当前的技术与生态条件下,更理性的路径或许是“联合起来扶持一到两家国内芯片企业,集中力量把它们做好”。
2025年,AI竞争已经进入深水区,真武芯片与“通云哥”恰逢中国AI产业发展的一个关键转折点,一条从底层芯片到上层应用完全自主可控的技术路径,其战略意义或许已经超过商业本身。但在全栈AI落地这条路上,阿里面前不止有技术的山,还有生态的海。
国际金融报
2026-01-30
国际金融报
2026-01-30
国际金融报
2026-01-30
证券时报网
2026-01-30
证券时报
2026-01-30
证券之星港美股
2026-01-30
证券之星资讯
2026-01-30
证券之星资讯
2026-01-30
证券之星资讯
2026-01-30