|

财经

开源破局AI落地:中小企业的技术平权与巨头的生态暗战

来源:21世纪经济报道

媒体

2025-11-11 22:07:06

(原标题:开源破局AI落地:中小企业的技术平权与巨头的生态暗战)

21世纪经济报道记者孔海丽、实习生吴佳芸 北京报道

开源与闭源的路线之争已经不存在,但市场不知道的是,开源大幅影响了AI落地的速度与模式。

麦肯锡报告显示,越来越多企业在部署AI驱动的解决方案时,开始扩大采用开源技术。超过50%的受访企业在AI技术栈的数据、模型与工具层面使用开源技术,其中科技、媒体与通信行业的开源AI使用率最高,达到70%。

与限制核心技术访问的“闭源”工具不同,开源通过公开源代码与全球协作,让企业能够根据自身需求,快速定制解决方案。

近日,21世纪经济报道记者在一个AI开源技术分析会上采访了从业者,以了解当下开源AI到底如何“接地气”。

从DeepSeek-v3.2到阿里云的Qwen 3,从Meta的Llama到谷歌的Gemma 3,“百模大战”中掀起的开源浪潮,为中小企业降低了技术跃迁门槛。模型不再是稀缺资源,而是企业落地AI的入口。

“大模型虽然百家争鸣、百花齐放,但依然处在‘春秋战国’时代,难以决胜。”德华安顾人寿总经理助理、首席信息官肖萍表示。目前,德华安顾人寿已通过搭载统一AI平台,集中管理GPU资源,在金融理财的客服、理赔等业务部署AI。

肖萍指出:“作为行业末端的企业,我们要迅速的接入大模型,但也要合理应用以规避风险,不能在一个模型厂商上‘绑死’。”

在AI落地过程中,企业面临的挑战之一是如何高效利用异构资源。许多企业同时拥有GPU、CPU等多样化算力,以及公有云、边缘计算和私有数据中心等多种部署环境。

红帽大中华区资深市场总监赵文斌指出,不同部门或业务场景可能使用不同的大模型或定制小模型,使资源管理更加复杂。

“开源生态可以兼容这些环境,支持企业的不同业务。” 赵文斌说。

因此,随着AI走向生产线,开源AI的叙事也在转变:从“造模型”到“跑模型”,从比拼算法到构建生态。

“开源社区最大的优势是,全球开发者已经打下了一个很好的基础,企业只需要在这个社区中找到觉得不错的技术,拿过来并‘企业化’。”红帽全球副总裁兼大中华区总裁曹衡康说。

曹衡康透露,企业需要有弹性、可扩容的AI应用平台,同时要兼顾成本与信息安全。其中,AI操作系统(AI OS)是“核心中枢”,负责推理任务调度,并提供标准化接口,保证多模型、多硬件环境下的高效运行。

红帽大中华区首席技术官张家驹进一步解释说,AI OS应通过标准化接口和模块化设计,不仅能对应不同的硬件,还要对应不同模型。

“AI的OS要具备真正的价值,一定是标准化的,可被南向或北向的生态合作伙伴集成的,才会成为市场上单独细分的一层。”

张家驹表示:“AI OS的核心应该是推理引擎。”推理引擎类似于传统操作系统在CPU上的作用,通过标准化和模块化设计,实现GPU和其他算力的高效利用,同时支持多模型并行运行。

推理引擎虽然从今年年初起开始被广泛讨论,但依然处于早期阶段。红帽联合产业调研显示,在超过350个企业中,仍有超过51%的企业尚未部署任何推理引擎。

其中,vLLM是一个由加州大学伯克利分校团队开发的高性能、开源 LLM 推理和服务引擎,核心目标是提升 LLM 的推理速度(吞吐量)和GPU资源利用率,同时兼容 Hugging Face 等流行模型库,并支持高并发实时服务。

张家驹介绍,红帽在vLLM上的投入,也是其差异化竞争力的重要体现。今年5月,红帽发布了开源项目llm-d,进一步增强vLLM推理能力,为AI推理的规模化落地提供方案。

全球范围内,Meta的Llama系列也配有推理引擎、微调工具、数据集平台与API接口的生态,但推理框架主要针对自家服务,在跨模型与硬件适配能力方面有限。英伟达的TensorRT则通过GPU的硬件升级,如低精度计算、层融合,提升推理速度和吞吐量。

相比之下,vLLM和SG Lang等开源推理引擎,由于支持多种模型和硬件,更适合企业场景。

这种多模型、多算力兼容的特性,使企业能够不依赖特定厂商,选择最合适的技术方案。

曹衡康强调,从AI试点到规模化落地,企业应充分利用开源社区的“集群效应”,结合企业级AI平台,实现任意云环境、任意模型和加速器的AI部署。

首页 股票 财经 基金 导航