|

财经

Chiplet,刚刚开始!

来源:半导体行业观察

2025-03-29 09:54:20

(原标题:Chiplet,刚刚开始!)

如果您希望可以时常见面,欢迎标星收藏哦~

来源:内容编译自semiengineering,谢谢。

随着芯片超越大型芯片制造商的专有设计并与封装或系统中的其他元素进行交互,管理芯片资源正成为一项重大而多方面的挑战。

芯片中资源管理不善为通常的功率、性能和面积权衡增加了一个全新的维度。它可能导致性能瓶颈,因为当芯片跨边界通信时,其固有延迟比单个芯片内更长。它还可能增加开发成本,因为添加到系统中的每个芯片也会在多个层面上增加复杂性。它还会影响功耗,随着设计中的芯片数量增加且必须不断相互通信,功耗变得更难管理。

最大的系统和处理器供应商已经有效地使用了这种方法,通过增加计算密度来提高性能,通过提高产量来降低成本。但使用第三方芯片优化这些系统是一个更困难的问题,需要时间来解决。

Blue Cheetah产品工程副总裁 John Lupienski 指出:“Chiplet 是全新的,除了 NVIDIA 这样的大公司之外,其他每家公司都是第一次尝试。” “你可以说很多人都在努力追赶。人们现在犯的一个大错误是他们没有从内到外的概念来工作,所以他们的工作是从芯片内部开始的。很多人真的在互操作性和通用性方面陷入了困境,而他们并没有关注他们所需的功率、性能和带宽。我见过一些公司专注于 I/O 互连,基本上已经浪费了一年的时间,当他们最终意识到他们需要在系统方面工作时,他们不得不从头开始一切。要做到这一点,需要从系统总线和 NoC 开始,也就是从内核内部开始。你正在做的是优化你的 NoC 和系统总线以及协议。它可以是 CHI 或 AXI,或者你为特定应用程序和带宽使用的任何协议,它可以配置为许多不同的数据包大小。你可以为 CHI 和 AXI 自定义各种不同的变量,因此那里有很大的灵活性。在芯片领域也不例外。但你需要针对具体应用和目标市场进行调整,以达到功率、性能和面积。一旦你确定了这一点,你就可以从内而外地开始工作了。”

所有芯片组的系统总线必须相同。“在理想情况下,I/O 互连是通用的,可以完美连接,我们希望有一天能实现这一点。但目前情况并非如此,”Lupienski 指出。

这给小芯片子系统领域的 IP 供应商增加了复杂性和新的挑战,因为他们需要不断适应客户群的新变化。

目标市场

小芯片有三个主要市场——专属市场、本地生态系统和开放市场。

Synopsys产品管理执行总监 Manmeet Walia 表示:“垄断市场只是一家供应商在自言自语。另一个极端是开放市场,许多供应商认为这是伴随 chiplet 而来的宏伟愿景,它们将相互连接和交流。中间是本地生态系统,五到七家公司聚集在一起,‘你做这个,我做这个,我们做这个。’他们制定了非常严格的规范以实现彼此之间的互操作。本地生态系统中的很好的例子是日本和欧洲的一些汽车供应商。我们看到的另一个这样的本地生态系统是 RISC-V 处理器,一群想要与 Arm 竞争的 RISC-V 公司聚集在一起。”

如今,大约 95% 到 99% 的 chiplet 市场已被垄断,可能是一家供应商,也可能是多家供应商按照某个规格进行设计。“他们需要的是最好的资源,”Walia 说。 “他们关心关键性能指标 (KPM)。这些通常是大型市场制造商——美国前四大超大规模企业、中国前几大超大规模企业等等。他们想要最好的 KPM。他们喜欢 UCIe,但他们不想使用 UCIe 一词,因为他们想要超越标准中的任何内容。他们想超越其他所有人。这意味着他们想要最优化的芯片到芯片,他们想要在功率和带宽、延迟和性能方面获得最佳指标,他们想要进入高级封装。对于他们来说,我们有三类 UCIe。我们有合规版本。然后我们有定制版本,我们超越了规范。而且因为他们不关心 UCIe 互操作性,他们中的许多人想要更低的驱动强度或降低延迟的不同方式,等等。超大规模企业想要最好的 KPM,同类中最好的。他们希望领先一代 (OGA),因此第一次就做对是“这绝对重要,因为规格周期非常短。如果我们不能一次成功,那么我们就会失去市场机会。”

芯片分区

行业刚刚开始向芯片的下一阶段发展,从专属生态系统到本地生态系统。与此同时,芯片开发人员正在寻找构建芯片的最佳方法。

是德科技流程和数据管理总经理兼业务部负责人 Simon Rance 表示: “我们目前正处于向本地生态系统发展的阶段,但仍然有限。” “Cadence 与 Arm 的合作就是一个例子。当你开始引入更多 IP 时,复杂性就会变得更具挑战性。Cadence 选择与 Arm 合作的好处在于,当今 SoC 和小芯片中使用的大多数 IP 都是 Arm IP。它们有通用总线。协议是已知的,握手是已知的。时间也是如此——甚至测试用例和验证也是如此。工具面向如何利用这些 IP 并将其集成。然后,你只需要处理其他 IP,无论是来自 Cadence 还是其他公司,无论它是自产的还是其他的,你都可以将其集成。当你使用其他 IP,尤其是 RISC-V IP 时,可能会更加混乱,这将是一个真正的挑战。我还没有看到关于如何做到这一点、如何管理资源以及如何确保互操作性的正确剧本。目前,它更多地是关于已知协议、已知时间和共享以及互操作性。”

解决芯片设计复杂性的一种方法是通过分区。“第一步,就是简化,”Rance 说。 “这意味着要根据技术对芯片进行划分——选择模拟部分,这些部分可以位于更高的工艺节点。这是一个简单的划分。在此基础上,当你将这些部分划分出来时,这些 IP 协同工作的理想总线和协议是什么?虽然模拟和混合信号处于更高的工艺节点,但你必须处理射频和电磁类型设计的热问题和能源问题。在较低的技术节点,比如 4nm,那些现在有 CPU、GPU、AI 加速器的设备,所有这些都是耗能的。它们都需要彼此靠近。但是当你把所有这些东西放在一起时,你就遇到了一个巨大的能源问题,因为它正在耗尽芯片那部分的寿命。在 SoC 中,我们只有处理器和 GPU,我们需要这些设备之间某种缓存一致性来确保视频和音频的同步。引入 AI/ML 芯片来与这些其他强大的处理器一起使用,增加了一个挑战,我们还没有真正深入研究如何解决它们。我们可以对其进行分区,但是所有耗电量大且工艺节点低的东西仍然会存在于芯片的一部分中。”

其他人也同意这一观点。Cadence杰出工程师 Moshiko Emmer 表示:“当我们设想使用 chiplet 时,它是一种构建更大系统的方法,而不必将所有系统都放在同一块硅片上。这就是我们的思维方式。如果我们对想要在单个 SoC 上构建的内容有一个参考,那么就芯片内组件的交互和连接而言,它总是比将其放在单独的 chiplet 中更快。但从成本、上市时间和模块化的角度来看,这并不会更好。我们设想的 chiplet 是构建更大的系统,而不必在同一 SoC 上放置更多东西。我们希望通过基于功能进行拆分来实现这一目标。”

想想汽车设计领域正在发生的事情。“ADAS 是物理 AI 的一个很好的例子,它将计算能力与摄像头、视觉和 DSP 处理 AI 以及所需的所有接口融合在一起,”Emmer 说。 “显然,汽车需要它。例如,机器人、无人机、航空航天和国防系统也需要它。理想情况下,您希望在同一系统上拥有尽可能多的功能,如果您考虑今天的汽车,看看汽车中的 ECU 数量,低端汽车大约有 30 个,高端汽车则有 100 多个。这需要很多成本,因为它需要不同的平台。此外,软件管理变得非常复杂,有时您希望能够通过无线软件更新和补丁来升级和验证软件,所有这些都变得非常复杂。在考虑 chiplet 时,您有能力在单个系统或单个平台上连接更多功能。我可以说,‘这些都是我在 ADAS 解决方案上需要的所有功能。’我可以围绕特定功能进行分组。例如,我可以将 CPU 分组为单个芯片,采用专用工艺技术进行设计,然后将其连接到其他芯片。这可以作为系统的核心,并包含系统级组件,从系统角度来看的所有控制 - 安全性、安全、电源、时钟、DFT、调试,应有尽有。系统级连接或集成处理特定功能的其他每个分立芯片。”

本地生态系统方法也为芯片领域中规模较小的 IP 提供商的创新打开了大门。Alphawave Semi芯片首席产品线经理 Sue Hung Fung解释说,作为 Arm Total Design (ATD) 的合作伙伴,她的公司正在与 Arm 合作开发芯片。 “为了满足计算芯片的这种要求,我们必须与 Arm 芯片系统架构 (CSA) 保持一致。我们需要能够根据该文档中的定义和规范以及它们的基础系统架构 (BSA) 构建我们的计算芯片、I/O 芯片和集线器芯片。因此,对于任何已定义的芯片,如果其他开发人员想要创建某些东西,他们可以连接到我们的计算芯片。如果他们制造了一个 I/O 芯片,我们希望能够将所有这些组合在一起。这更像是一个开放的芯片生态系统。Arm 正在帮助定义这一点,我们通过围绕它进行构建来遵守这一点。一旦我们构建了符合 Arm 提出的规范的东西,那么其他同样符合该规范的人就可以连接到我们。计算和加速器之间的 AMBA CHI 芯片到芯片 (C2C) 一致性结构就是一个很好的例子,因为如果我们构建一个部件,其他人也会构建另一个部件并希望连接到我们。”

误解比比皆是

不过,要让这一切发挥作用,还有很多工作要做。 Arteris 产品管理总监 Ashley Stevens 说:“说到可互操作的 chiplet 市场,每个人都在谈论它,但实现它要比很多人意识到的困难得多。我们认为,短期内,如果你不试图实现互操作性,那么全球标准实际上没有任何额外的好处,因为你只与你自己或亲密合作伙伴正在做的事情进行互操作。互操作性的想法对很多人来说非常有吸引力,但这需要一些时间。目前,每当人们设计 chiplet 系统时,他们都会先一起验证它们,然后再进行硅片验证,以检查它是否可行,而现在人们在开放 chiplet 市场上谈论的是设计一个 chiplet,或者让其他人完全独立地设计一个 chiplet,然后将它们组装在一起并期望它们能够工作。”

史蒂文斯认为,只有在拥有非常好的、且得到一致认可的验证 IP 的情况下,这才会起作用。 “与其使用不同的芯片检查工作,不如使用这个验证 IP 检查工作是否正常,如果其他人使用该验证 IP(希望是同一个)检查他们的工作,那么它应该可以正常工作。但目前,据我所知,没有一个适用于芯片的行业标准验证 IP 可以解决这个问题,除非是在非常低级的接口级,比如 UCIe。但这只是一种点对点连接。它并没有给你提供实际的通信协议,你需要能够互操作,让芯片相互理解。我最近在一次网络研讨会上听到有人说,只要你有 UCIe,你就可以切换到另一个芯片。这绝对不是真的。这是最低级别的标准。它允许你将 1 和 0 从 A 传输到 B,但这并不意味着你可以理解另一端的情况。需要一些东西来理解它。所以这比这复杂得多,短期内我们认为全球标准并不是那么重要。但以后会变得重要。”

其他人也同意这一观点。Eliyan 战略营销副总裁 Kevin Donnelly表示,他知道有些公司从其他供应商(不是 Eliyan)购买了 IP,但发现它无法与其他任何人的 IP 兼容。“他们已经制造了芯片,他们很失望,”他说。 “他们正在试图弄清楚下一代产品该做什么。PCI Express 就是人们喜欢指出的一个很好的例子。他们希望在物理层实现互操作性,因为在物理层之上有一大堆软件堆栈来实现互操作。USB、HTML 或任何物理层芯片到芯片互连都是如此。设计师认为他们只需插入芯片就可以工作。

但事实并非如此。英特尔试图为 PCIe 解决这个问题,但它不是一个常见的应用。人们通常希望使用 AXI 或 CHI 或某些基于 Arm 的处理器,他们希望将其扩展到某些芯片。但这些都没有在行业中定义,因此,除非有更多关于如何使芯片互操作的软件级定义,否则构建的所有芯片都不会互操作。这会发生。我们一直在推广开放的芯片市场。但人们普遍误以为,只选择特定的 PHY 而不选择芯片上的其他任何东西,就能让芯片互操作让他们互相交谈。”

那么为什么会有这么多误解呢?追溯 chiplet 基础设施的发展,一切都始于一个主要由半导体制造商推动的 die-to-die 接口。“他们首先想出了一种在封装内集成各种东西的方法。‘嘿,我们有一个很酷的中介层,或者我们有这个硅桥,你为什么不试试呢?’这就是业界真正采用 chiplet 的方式,”西门子 EDA中央工程解决方案总监 Pratyush Kamal 说。 “垂直设计公司正面临着光罩尺寸限制,或者由于芯片太大而无法在某些先进节点上正常生产,导致已知良好芯片成本非常高的问题,因此他们被推向了这一方向。就芯片而言,垂直设计公司已经做了很多工作。

但现在,在过去几年中,我们开始看到,一些公司开始谈论参与开放芯片经济。他们展望未来,我们可以在一个封装中即插即用地使用来自多个供应商的芯片。最初,这是一门全新的科学,需要一层一层地剥开洋葱,在获得理想的架构后才能触及核心。当你看 UCIe 1.0 或 BoW 1.0 时,最初非常重视物理层本身,因为这是整个事情的起点——从物理上可用的更小的凸块间距开始。今天也是一样。我们开始在行业中了解到,我们很快就会有微米间距通孔或微米间距混合键合,我们可以用它来进行小芯片的 3D 堆叠。代工厂为我们提供了这些技术跨越式发展的机会,作为一家设计公司,我们才刚刚学会振作起来,思考如何最大限度地利用它。”

下一步

芯片行业才刚刚开始这段旅程。当它只是研究芯片到芯片接口定义时,它关注的是数据移动,而不是资源管理。“芯片本质上有一些功能核心、一个 CPU、一个 GPU、一个与 SRAM 通信的内存控制器,”Kamal 解释道。 “然后有外部 I/O 外围设备从外部世界获取数据并将数据发送回外部世界。但这里有一个非常关键的问题。如何构建一个强大的底盘?每个核心都有自己的需求。时钟具有动态电压和频率缩放。所有这些都与当今的架构息息相关。核心旨在执行一项单一任务。然后由底盘管理器决定。有些公司称它们为底盘,有些公司称它们为简单的资源管理器,但它们涵盖了非功能性数据的整个层面,即管理核心及其交互。广义上讲,你有测试,有调试,有时钟,有电源决策,有安全性。所有这些都构成了一个底盘。到目前为止,当我们定义这些 die-to-die 接口时,我们专注于数据移动。我们只是盲目地看着它,但我们足够谨慎地为它留出了空间,当我们开始定义这些底盘或资源管理模式时,我们将有 die-to-die 接口来至少支持它。”

但是,如果一个封装中有 1,000 个芯片呢?Kamal 说:“如果你知道美国政府试图通过其国家先进封装制造计划 (NAPMP) 做什么,你就会知道他们向行业提出的挑战是为他们提供一个完全自动化的 1,000 个芯片封装、设计流程、分析流程和模拟流程。当你考虑这种规模的系统时,仅仅一个简单的启动过程就可能非常耗时。那里可能有数千个依赖项,那么你如何定义你的信任根、你的信任链,因为每个芯片都有不同的授权层,这些必须作为芯片标准的一部分来建立和定义。”

https://semiengineering.com/challenges-in-managing-chiplet-resources/

半导体精品公众号推荐

专注半导体领域更多原创内容

关注全球半导体产业动向与趋势

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4078期内容,欢迎关注。


『半导体第一垂直媒体』

实时 专业 原创 深度

公众号ID:icbank

喜欢我们的内容就点“在看”分享给小伙伴哦


fund

半导体行业观察

2025-03-31

半导体行业观察

2025-03-31

半导体行业观察

2025-03-31

半导体行业观察

2025-03-31

半导体行业观察

2025-03-31

证券之星资讯

2025-03-31

证券之星资讯

2025-03-31

首页 股票 财经 基金 导航