来源:半导体行业观察
2025-10-20 09:47:56
(原标题:OpenAI的芯片战略)
公众号记得加星标,第一时间看推送不会错过。
来 源: 内容编译自WSJ 。
没人能指责 OpenAI 首席执行官Sam Altman目光短浅。他曾提议在太阳周围建造太阳能电池阵列,为未来的人工智能提供动力。
他的公司与博通达成的新协议是根据 OpenAI 未来客户的需求定制芯片,这也许并不离奇,但无疑是大胆的。
阿尔特曼表示,为了提供消费者所需的人工智能服务,其公司的数据中心将需要为每个用户配备至少一块人工智能专用芯片。换句话说,需要数十亿块芯片。
专家们也认同这一观点。非营利性人工智能研究机构艾伦人工智能研究所(Allen Institute for AI)首席执行官阿里·法哈迪(Ali Farhadi)表示,如果人工智能接管我们承诺的所有任务,那么全球所需的人工智能微芯片数量将与目前的传统微芯片数量相当。
当企业构建数据中心来训练他们的人工智能时,英伟达仍然是首选。但定制芯片可以加快人工智能的交付过程(即所谓的推理过程),并降低成本。这可以帮助 OpenAI 在努力实现盈利的过程中节省成本,而目前它还远未实现盈利。
OpenAI 最近与博通和英伟达就像人工智能界的花生酱和巧克力。OpenAI 想要实现其目标,即在英伟达的芯片上训练出世界上最强大的模型,然后在博通的定制芯片上以低成本交付模型,这两者都必不可少。
自研芯片
亚马逊和谷歌长期以来一直致力于将定制芯片与复杂软件相结合,以支持云计算,并且两家公司都设计了自己的定制芯片,用于训练和交付人工智能。Meta和微软正处于尝试定制人工智能芯片的早期阶段。
通常,对于计算机而言,软件开发人员必须编写针对现有硬件(特别是微芯片)量身定制的程序。当一家公司开始设计自己的芯片时,就像苹果在 2000 年代中期所做的那样,他们就有机会将芯片和软件更紧密地结合起来。这就是 iPhone 速度快、功耗低的原因。对于 OpenAI 来说,更高效的芯片意味着可以减少向客户提供 AI 服务的电力消耗。
惠普企业前工程师、半导体和人工智能研究公司 SemiAnalysis 技术人员乔丹·纳诺斯 (Jordan Nanos) 表示,博通正在为 OpenAI 提供一种重新混合典型人工智能芯片配方的方法。
Nvidia 致力于打造灵活的芯片。它们性能强大、功能多样,能够适应各种 AI 应用。在训练模型方面,行业领袖一致认为 Nvidia 是最佳选择:根据多项估算,Nvidia 在训练模型方面的市场份额高达 70%。
通过推理向用户交付 AI 模型时,硬件需求与训练该模型时有所不同。这为 AI 公司创造了机会,他们可以使用定制芯片来更快、更高效地运行其特定应用程序。
Nanos 表示,在推理阶段,OpenAI 的模型在支持大量高带宽内存的芯片上运行效果最佳。本月早些时候,该公司宣布与两家领先的内存制造商三星和SK 海力士建立合作伙伴关系。
这种对高带宽内存的依赖在AI模型中很常见,但并非普遍现象。OpenAI对此类芯片的需求在某种程度上特定于其开发的模型,以及其认为未来客户将最常使用的应用程序。
OpenAI 并未透露这些未来的应用是什么,但在公司发布声明时,奥特曼表示,其 Pulse 产品使用人工智能代理搜索互联网,每天早上向用户介绍感兴趣的话题,这需要非常强大的计算能力,因此公司必须将其推广范围限制在每月支付 200 美元购买 Pro 级别的用户。
芯片设计与能耗相关的另一个因素是“稀疏性”。早期的模型是“密集型”的:每次收到提示时,神经网络中相当一部分节点都必须被激活才能回答。这相当于相当大量的计算。
较新的模型会将模型的专业知识进行划分,因此神经网络的各个部分会针对特定类型的查询发挥各自的优势。通过激活更少的“专家”,所需的计算量也会减少。早期模型可能会激活四分之一的神经网络来回答一个典型问题;而最新的模型只会激活不到百分之一的神经网络。专为这种工作方式的模型设计的芯片可以运行得更高效。
人工智能超级计算机
虽然 AI 芯片是 OpenAI 与博通交易的核心,但更大的目标是打造完整的千兆瓦级 AI 超级计算机。这意味着博通也需要提供将所有这些连接在一起所需的网络芯片、线缆和光纤互连。
Altman 曾表示,OpenAI 的 AI 总计算能力达 2 千兆瓦,尽管并非全部集中在一个地方。与博通的协议涉及到 2030 年推出由 OpenAI 和博通联合开发的高达 10 千兆瓦的 AI 系统。这是在过去三周与 AMD 和英伟达宣布的 16 千兆瓦交易的基础上,OpenAI 和博通达成的一项协议,其计算能力规模令人难以置信。
总的来说,这些承诺可能需要近一万亿美元的投资和相当于两个纽约市的电力。
OpenAI 并非唯一一家耗费芯片和能源的公司。今年 9 月,xAI 宣布其位于孟菲斯的 AI Colossus 超级计算机的发电量已达到 1.21 千兆瓦。Meta 正在路易斯安那州建设的代号为 Hyperion 的 AI 超级计算机已获批,发电量可达 2.3 千兆瓦。今年 7 月,首席执行官马克·扎克伯格宣布,该超级计算机的发电量最终将达到 5 千兆瓦。
奥特曼在宣布与博通交易的播客中称,建设人工智能基础设施是“历史上最大的工业联合项目”。然而,他补充道,这笔交易“与我们需要达到的目标相比,只是九牛一毛”。
这笔交易的另一个目标是实现 OpenAI 供应商的多元化。OpenAI 的星际之门 (Stargate) 数据中心将由甲骨文在德克萨斯州阿比林建造,用于训练,因此很可能几乎完全由英伟达芯片组成,而英伟达芯片仍然是该应用的行业标准。OpenAI 也承诺从 AMD 采购芯片,但这些芯片可能主要用于推理。
Nanos 表示:“OpenAI 的眼光非常长远,并试图确保他们能够获得足够的芯片供应。”
https://www.wsj.com/tech/ai/openai-broadcom-ai-chip-strategy-26f79487
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4200期内容,欢迎关注。
加星标第一时间看推送,小号防走丢
求推荐
半导体行业观察
2025-10-20
半导体行业观察
2025-10-20
半导体行业观察
2025-10-20
半导体行业观察
2025-10-20
半导体行业观察
2025-10-20
半导体行业观察
2025-10-20
证券之星资讯
2025-10-20
证券之星资讯
2025-10-20
证券之星资讯
2025-10-20