来源:半导体行业观察
2025-07-06 10:56:02
(原标题:开源项目推动下,CUDA将兼容非Nvidia GPU?)
公众号记得加星标⭐️,第一时间看推送不会错过。
来源:内容编译自techspot。
CUDA 与 AMD 和 Intel GPU 的兼容性不再是梦想。
Nvidia 于 2006 年推出 CUDA,作为专有 API 和软件层,最终成为释放 GPU 巨大并行计算能力的关键。CUDA 在人工智能、科学计算和高性能模拟等领域发挥着重要作用。但 CUDA 代码的运行在很大程度上仍然受限于 Nvidia 硬件。现在,一个开源项目正在努力打破这一障碍。
通过使 CUDA 应用程序能够在 AMD、英特尔和其他公司的第三方 GPU 上运行,这一努力可以大大扩展硬件选择,减少供应商锁定,并使强大的 GPU 计算比以往更容易获得。
Zluda 团队最近发布了最新的季度更新,确认该项目仍致力于在非 Nvidia 图形加速器上全面实现 CUDA 兼容性。Zluda 的目标是在 AMD、Intel 和其他 GPU 架构上提供 CUDA 的直接替代方案,让用户和开发者能够以“接近原生”的性能运行未经修改的基于 CUDA 的应用程序。
Zluda 最令人欣喜的变化是其团队规模扩大了一倍。目前有两名全职开发人员在负责该项目。新加入的开发人员名为“Violet”,她已经为该工具在GitHub上的官方开源仓库做出了突出贡献。
其他重要更新包括对 ROCm/HIP GPU 运行时的改进,现在该运行时应该能够在 Linux 和 Windows 上可靠运行。CUDA 和 ROCm 等 GPU 运行时旨在在运行时编译 GPU 代码,从而确保为旧硬件开发的代码通常可以在较新的 GPU 架构上编译和运行,并且问题最少。
Zluda 现在在非 Nvidia GPU 上执行未修改的 CUDA 二进制文件的性能也显著提升。之前,该工具要么忽略某些指令修饰符,要么无法以完全精度执行它们。现在,改进后的代码可以处理一些最棘手的情况,例如 cvt 指令,并达到位精度。
全面支持 CUDA 应用程序的关键一步是通过详细的日志记录来追踪代码与 API 的交互方式。Zluda 在这方面也得到了改进。它现在可以捕获之前被忽略的交互,甚至可以处理中间的 API 调用。
开发人员在支持 llm.c方面也取得了重大进展。llm.c 是一个纯 CUDA 测试实现(用 C 语言编写),适用于 GPT-2 和 GPT-3 等语言模型。Zluda 目前已在 llm.c 中实现了 44 个函数中的 16 个,团队希望很快就能全面运行该测试。
最后,Zluda 在对 32 位 PhysX 代码的潜在支持方面略有进步。Nvidia 在基于 Blackwell 架构的 GeForce 50 系列 GPU 上同时放弃了对该中间件的硬件和软件支持,这给老游戏的粉丝们带来了本质上可以说是糟糕或低劣的体验。
上个季度,Zluda 收到了与 32 位 PhysX 支持相关的小更新。最初的重点是高效收集 CUDA 日志以识别潜在错误,这些错误最终也可能影响 64 位 PhysX 代码。然而,开发人员提醒称,完整的 32 位 PhysX 支持可能需要第三方开发人员的大量贡献。
https://www.techspot.com/news/108557-open-source-project-making-strides-bringing-cuda-non.html
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4086期内容,欢迎关注。
加星标⭐️第一时间看推送,小号防走丢
求推荐
半导体行业观察
2025-07-06
半导体行业观察
2025-07-06
半导体行业观察
2025-07-06
半导体行业观察
2025-07-06
半导体行业观察
2025-07-06
半导体行业观察
2025-07-06
证券之星资讯
2025-07-04
证券之星资讯
2025-07-04
证券之星资讯
2025-07-04