英国新创公司Spectral Compute近日推出了名为“SCALE”的GPGPU编程工具包,成功实现了NVIDIA CUDA软件在AMD GPU上的无缝运行,有望打破NVIDIA在GPU计算领域的垄断地位。
CUDA是NVIDIA 2007年推出的并行计算平台和编程模型,广泛应用于高性能计算和深度学习等领域。
由于其与NVIDIA GPU硬件的深度绑定,CUDA生态的丰富性使得其他厂商难以竞争。
Spectral Compute的SCALE工具包通过兼容CUDA的工具链,使得开发者能够在AMD GPU上原生运行CUDA程序,无需依赖NVIDIA的程序集。
Spectral Compute CEO表示,GPU应有一个开放原始码的环境,类似于现代CPU,并且各种平台之间应存在互连性。
SCALE工具包的开发历时七年,旨在消除市场中的排他性限制,促进硬件平台之间的互操作性。
目前,SCALE已经在多个应用程序中进行了测试,包括Blender、Llama-cpp、XGboost、FAISS、GOMC、STDGPU、Hashcat和NVIDIA Thrust,可应用AMD的RDNA 3和RDNA 2构架。
此外,高通、谷歌和Intel等大厂也计划联手打造全新的AI软件平台,提供CUDA的替代方案,进一步挑战NVIDIA的市场地位。
另外,NVIDIA宣布将全面转向开源GPU内核模块,并且表示最终开源内核模块会取代闭源的驱动程序。
在2022年5月的时候,随着R515 驱动程序的发布,NVIDIA以开源方式发布了一套Linux GPU内核模块,具有GPL和MIT双重许可。
如今随着R560驱动程序版本的即将发布,NVIDIA正式宣布全面过渡到开源GPU内核模块,到 R560 版驱动程序发布时,所有GPU驱动程序都将使用开源内核。
开源GPU内核模块经过两年的发展,已经实现了与闭源驱动程序同等甚至更优的性能,并增加了许多新功能,如异构内存管理(HMM)、机密计算以及与Grace平台的一致内存架构支持。
不过需要注意的是,并非所有GPU都兼容开源GPU内核模块,NVIDIA表示,对于Grace Hopper或Blackwell旗舰平台,将仅支持开源GPU内核模块,这些平台不再支持专有驱动程序。
对于Turing、Ampere、Ada Lovelace或Hopper架构的较新GPU,NVIDIA推荐切换到开源GPU内核模块;而对于Maxwell、Pascal或Volta架构的旧版GPU,由于不兼容,用户仍需继续使用专有驱动程序。
这对于Linux用户和开发者来说自然是利好,开源驱动程序将使开发者能够更深入地理解内核事件调度与工作负载的交互,从而更快速地进行根本原因调试。
此外,企业软件开发人员也可以将驱动程序无缝集成到为其项目配置的定制Linux内核中。