|

财经

以太网和InfiniBand外,第三种选择

来源:半导体行业观察

2025-06-24 09:32:53

(原标题:以太网和InfiniBand外,第三种选择)

公众号记得加星标⭐️,第一时间看推送不会错过。

来源:内容编译自IEEE。

在过去的美好时光里,网络只是连接少量本地计算机。但时代变了。在人工智能主导的世界里,关键在于协调数万台服务器的活动,以训练大型语言模型,并且不造成任何通信延迟。现在,有一个经过优化的架构可以实现这一点。Cornelis Networks表示,其 CN500 网络结构可最大限度地提高人工智能性能,支持部署多达 50 万台计算机或处理器(比现在高出一个数量级),并且不会增加延迟。

继以太网和InfiniBand之后,这项新技术为网络领域带来了第三款重要产品。它旨在使人工智能和高性能计算机(HPC,即超级计算机)能够以更高的效率实现更快、更可预测的完成时间。Cornelis 声称,在 HPC 方面,其技术优于2022 年推出的InfiniBand NDR版本,每秒传递的消息数量是后者的两倍,延迟降低了 35%。在人工智能应用方面,与基于以太网的协议相比,其通信速度提高了六倍。

以太网长期以来一直是局域网(LAN)的代名词。软件补丁使其通信协议经受住了时间的考验。InfiniBand 的发明是一项改进,但它的设计目标仍然是相同的:连接少量本地设备。“这些技术发明之初,与并行计算毫无关联,”宾夕法尼亚州 Cornelis 公司联合创始人、总裁兼首席运营官Philip Murphy表示。

当数据中心开始兴起时,工程师们需要一种新的网络解决方案。由于不同的系统使用不同的软件,它们无法共享资源——因此,扩展以太网和 InfiniBand 等网络以适应最繁忙的运营时段显得颇具挑战性。“这引发了整个云计算的演变,”墨菲说道。在不同的计算机甚至不同的组织之间共享基于云的 CPU 成为了当时流行的解决方案。

然而,尽管数据中心先驱们试图最大限度地增加单台服务器上运行的应用程序数量,墨菲和他的同事们却看到了相反方法的价值:最大限度地增加单个应用程序上运行的处理器数量。“这需要一个完全不同的网络解决方案,”他说道,而这正是 Cornelis 现在提供的。该公司的Omni-Path架构由英特尔开发,用于超级计算应用,例如模拟气候模型或药物设计的分子相互作用,它提供了最大的吞吐量,并且零数据包丢失。

无拥堵数据高速公路

协调处理器来训练人工智能模型需要以极高的带宽交换大量消息(数据包)。每毫秒的消息速率很重要,延迟(即接收方需要多长时间才能做出响应)也很重要。

在整个网络中共享如此多的数据包所带来的一个主要挑战是流量拥堵。墨菲解释说,你需要一种可靠地绕过拥堵点并避免其他问题的方法。例如,如果数据包通过不同的路由到达同一目的地,它们可能会出现乱序。

Cornelis 的动态自适应路由算法通过绕过短暂拥塞事件来缓解拥塞,而其拥塞控制架构则将流量路由到“热门”目的地。“如果某个体育场举办了一场我们都想去的活动,你肯定不希望经过体育场的流量也卡在那里,”Murphy 说。中央调速技术实现了这种拥塞控制架构。交换机会检测流量的形成位置,然后指示发送方减速,直到拥塞消散。“想象一下,当车辆驶入高速公路入口匝道时,如何缓解交通拥堵,”Murphy 解释道。

另一个挑战是避免延迟。在传统的以太网架构中,发送数据包需要端点有足够的内存。“如果我发送给你,而你的内存不足,你必须回来告诉我,”墨菲说。这是一个漫长的循环,需要大量的不可扩展的缓冲区。相反,科内利斯使用了一种名为“基于信用的流量控制”的算法,可以提前分配内存。“你什么都不用告诉我,我就能知道还能发送多少,”墨菲说。

最后,系统避免了 GPU 或链路故障导致的宕机。在传统架构中,如果服务器宕机,应用程序也会宕机。修复这个问题需要从最近的检查点重新启动——这本身就需要大量的计算能力来创建。“想象一下,如果每次点击文档上的‘保存’,你都必须等待 20 分钟,”Murphy 说。相反,由于 Cornelis Networks 的服务器分布在多台计算机上,因此即使带宽略低,应用程序也能保持运行,直到故障链路被替换——无需检查点。

高效的人工智能

从物理上讲,CN5000产品是一款基于定制芯片构建的网卡。这些网卡可以插入每台服务器,“就像你在家里的电脑上插以太网卡一样,”Murphy 解释道。机架顶部交换机通过线缆连接到每台服务器和其他交换机,而导向器级交换机则配备 48 或 576 个端口,用于连接机架交换机。“每台服务器都插有网卡,因此你可以构建数千个端点集群,”Murphy 说。

该公司的主要市场是那些希望升级到新集群以实现 AI 或更快 HPC 模拟的组织。Cornelis 会通过与其合作的三家服务器和网络交换机原始设备制造商之一来实现这一目标。OEM 会从 Cornelis 购买物理卡,并将其插入服务器,然后再完成订单。

直到最近,训练一个神经网络模型还是一次性的事情。但现在,训练一个拥有数万亿参数的人工智能模型意味着需要反复进行微调或更新。Cornelis 希望能够利用这一点。“如果你不采用人工智能,你就会倒闭。如果你使用人工智能效率低下,你仍然会倒闭,”Murphy 说。“我们的客户希望以尽可能最高效的方式采用人工智能。”

Nvidia 在数据中心以太网销售额上超越思科和竞争对手 Arista

以太网业务并非单一的,而是多种多样的。如今,随着用于后端AI集群网络的以太网交换机的演进,出现了一种新的业务,有可能主导收入和利润。这四大以太网细分市场——园区、边缘、数据中心前端和数据中心后端——并非步调一致,尽管它们之间的协议兼容,但基本上各行其是。

例如,不管你信不信,根据 IDC 的研究,1Gb/秒交换机市场在今年第一季度实际上实现了增长,而该市场仍然占据数据中心以外以太网产品销售收入的一半以上。

第一代以太网交换机遵循在互联网泡沫鼎盛时期最终确定的光纤和铜线协议传输标准,于2000年问世,而1 Gb/秒以太网则花了几年时间才在数据中心和运营商网络中成为主流,并最终进入园区网络。因此,如果我们对IDC近期以太网市场公开声明中的解读和估计准确无误,那么在800 Gb/秒以太网交换机的销售在大约25年后开始在数据中心获得实质性增长的情况下,1 Gb/秒交换机在2025年第一季度仍能带来约25亿美元的销售额,这或许会令人感到惊讶。


另一方面,IDC 在其以太网交换和路由市场数据中首次公布了 800 Gb/秒产品的销售额。具体来说,如果 IDC 过去的表现可以作为其当前表现的参考,我们怀疑它是否会再次这样做。该公司表示,800 Gb/秒设备在第一季度带来了 3.501 亿美元的收入,占同期全球 117 亿美元以太网交换机总销售额的 5.1%。

200 Gb/秒和400 Gb/秒设备的销售额增长了2.9倍,这些设备完全在数据中心销售,有时也用于路由设备和交换工作。根据IDC过去的声明以及我们据此构建的模型,我们认为200 Gb/秒和400 Gb/秒设备合计创造了约45亿美元的销售额,本季度端口数量可能超过1800万个。IDC对100 Gb/秒以太网的销售额只字未提。100 Gb/秒以太网即使在销售十五年后仍用于高端园区市场以及企业和服务提供商网络。10 Gb/秒设备的销售额则在2023年开始批量出货。我们的最佳预测是,100 Gb/秒以太网在第一季度创造了约30亿美元的收入,而10 Gb/秒交换机的销售额可能达到5亿美元以上。校园和边缘的 2.5 Gb/秒、5 Gb/秒、25 Gb/秒和 50 Gb/秒设备的销售占据了剩余的大部分。

路由器市场发展缓慢,路由工作量随着时间的推移基本保持稳定,即使部分路由工作被转移到也能承担路由任务的现代交换机上——这在超大规模企业、云构建商和能够自行设计硬件和路由软件堆栈的电信运营商中很常见。其他服务提供商的规模不足以承担这样的任务,这就是为什么思科和华为技术公司仍然拥有路由硬件业务的原因。


IDC 还在其刚刚发布的 2025 年第一季度报告中开始单独跟踪 Nvidia。

当然,Nvidia 已迅速崛起,在数据中心领域挑战思科系统和 Arista Networks,这主要是因为其 InfiniBand 超级计算互连在后端 AI 网络方面的应用正在减弱,而其 Spectrum-X 以太网(具有与 BlueField DPU 配合使用的现代拥塞控制和自适应路由功能)正越来越多地被其 AI 系统客户所采用。对于运行机密工作负载的能力级机器,HPC 中心对 Spectrum-X 的热情程度还有待观察。但对于那些运行能力级 HPC 系统且拥有数千名用户运行各种相对较小的作业的人来说,我们认为 Spectrum-X 所需的溢价可能是值得的,因为 Spectrum-X 具有接近 InfiniBand 的网络性能以及与共享云实用程序相当的网络微分段和安全性。

我们对 Nvidia 以太网交换机的销量有自己的估计,但在下面的图表中,我们通过计算上图中 Nvidia 的像素来确定 IDC 认为的销量。


如你所见,Nvidia 绝对是以太网交换领域的有力竞争者,而且其崛起速度远超 Arista Networks。Arista Networks 于 2009 年凭借 10 Gb/秒的设备起步,并在 100 Gb/秒时代真正崭露头角。(Arista 最近才扩展到园区交换领域,如今在这个领域与思科竞争比十五年前在数据中心领域与思科竞争更加艰难。)

本季度,思科的以太网交换机收入增长了4.7%,达到36.4亿美元,占以太网市场份额略低于三分之一。相比之下,英伟达的以太网交换机收入同比增长了8.6倍,环比增长了1.84倍。如果我们进行三角计算,就会发现英伟达在第一季度的以太网交换机销售额为14.6亿美元,在117亿美元的以太网交换机市场份额中占据了12.5%的份额。而Arista Networks长期以来一直占据着以太网交换机市场份额的榜首,其收入增长了27.1%,达到16.3亿美元,占市场份额的13.9%。

惠普企业(HPE)的以太网交换机销售额略高于410亿美元,下降了5%,这主要得益于其Aruba无线网络业务。华为的销售额为7.04亿美元,同比增长15.4%,不到2024年第四季度销售额的一半。传统上,第一季度对华为来说是一个非常疲软的季度。根据IDC的数据以及我们构建模型时已知的信息,全球原始设计制造商(ODM)——主要销售数据中心产品——共计贡献了14.1亿美元的销售额,同比增长67.5%,环比增长18.6%。

至于我们,关心的是当谈到切换时,世界各地的数据中心内发生的情况。


据IDC数据显示,数据中心以太网交换机销售额增长54.6%,达到69.2亿美元,占总销售额的59.1%。在2020年第一季度至2022年第四季度(GenAI热潮开始之时),数据中心以太网交换机销售额占整个市场的平均份额为43.5%,因此,数据中心以太网支出出现了大幅增长,这完全归功于用于训练和推理的AI集群。

非数据中心市场部分(即园区和边缘计算)的销售额达到47.8亿美元,同比增长9.5%。正如我们上文所述,其中略多于一半的销售额来自园区领域销售的1 Gb/秒设备。

在上图中,红线标示了IDC停止公布全球数据中心和非数据中心出货量端口数量的点。我们已经尽力估算了这些数字,但必须承认,我们的估算是基于一个较为简单的框架。

让我们更深入地研究一下数据中心。以下是过去五个季度的数据,这次英伟达从“其他”类别中被剔除,而 H3C 和瞻博网络则重新被归入“其他”类别,这意味着我们再也看不到它们了,因为 IDC 只公开讨论排名前五的厂商以及 ODM 厂商。请看下图:


如果剔除校园和边缘计算,那么 Nvidia 将紧随 Arista Networks 之后,后者自 2023 年第四季度以来一直是数据中心以太网交换机的最大销售商。

2025年第一季度,Arista Networks 数据中心以太网交换机销售额达14.8亿美元,同比增长26.4%,占据数据中心业务21.3%的份额。Nvidia 紧随其后,销售额达14.6亿美元,市场份额达21.1%,其迅猛增长的势头在本文开篇有所提及。思科在数据中心领域位居第三,以太网设备销售额达12.5亿美元,在我们的模型中同比增长17.7%。正如我们之前提到的,ODM(原始设计制造商)销售额增长了67.5%,达到14.1亿美元,但同样,该领域仍有十几家公司在生产规模可观的网络设备。

以下是数据中心以太网销售的更长趋势线,供您参考:


所以问题是:您认为 Arista Networks 能在数据中心领域超越 Nvidia 吗?

如果 Nvidia 试图将其 Spectrum-X 网络的销售额与其当前的 Grace-Blackwell 和未来的 Vera-Rubin 机架式系统的销售额直接挂钩,它可能会发现自己陷入了反垄断的困境。捆绑销售是绝对不允许的,尤其是在一家公司拥有 85% 或更高的市场份额,并且相关市场(在本例中为人工智能系统)定义严格的情况下。HPE 已经对美国和欧洲的超级计算实验室进行了一定程度的施压,迫使它们在其百亿亿次级和百亿亿次级机器中采用“Rosetta” Slingshot 互连技术,但购买这些机器的政府知道,为了市场的长期利益,HPE 需要资金来投资于适合高性能计算 (HPC) 的以太网变体。利润丰厚的 Nvidia 很难说服任何反垄断机构相信它没有捆绑销售,即使它实际上没有捆绑销售。

因此,即使 Nvidia 可能并非如此,也必须表现出开放的态度。正因如此,Nvidia 才与思科合作开发 Spectrum-X 互连产品,并同意将其 NX-OS 网络操作系统移植到 Spectrum-4 及更高版本的 ASIC 上。Arista 是否会与 Nvidia 在交换机 ASIC 上建立类似的合作关系,这值得关注——考虑到 Arista 和思科过去的法律纠纷和普遍的敌意,双方合作前恐怕难有进展。

只需再进行一两笔大型 AI 训练和推理交易,Nvidia 就能远远超越 Arista。我们认为,今年实现这一目标的可能性非常高。即便如此,Arista 及其 ASIC 合作伙伴博通也并未就此止步。

https://spectrum.ieee.org/ai-network-architecture

https://www.nextplatform.com/2025/06/23/nvidia-passes-cisco-and-rivals-arista-in-datacenter-ethernet-sales/

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4074期内容,欢迎关注。

加星标⭐️第一时间看推送,小号防走丢

求推荐

半导体行业观察

2025-06-24

半导体行业观察

2025-06-24

半导体行业观察

2025-06-24

证券之星资讯

2025-06-24

首页 股票 财经 基金 导航