随着AI技术的飞速发展,尤其是生成式AI和大型语言模型(LLM)的兴起,推理AI芯片市场需求急剧增长。据Omdia数据,该市场预计将从2023年的60亿美元增长到2030年的1430亿美元。
近日,据台湾工商时报报道,英伟达(Nvidia)已正式成立ASIC(应用特定集成电路)部门,并计划在中国台湾招募上千名芯片设计、软件开发及AI研发人员。这一举措标志着英伟达在AI领域的布局迈出了重要一步,同时也引发了业界对于AI训练用ASIC还是GPU的广泛讨论。
事实上,市场对ASIC算力芯片的看好已经体现在上市公司的财报和股价上。得益于公司旗下AI XPU类芯片和以太网产品组合的需求支撑,博通2024财年第四季AI芯片相关业务收入同比实现增长220%至122亿美元。博通股价也节节高涨,总市值突破万亿美元。
摩根斯坦利在其报告中列出了几家在ASIC领域具有潜力的台股与美股企业,堪称“ASIC概念股”。包括博通、台企世芯和日本企业Socionext等。同时,摩根斯坦利也认为,Cadence、台积电及其供应链伙伴日月光、京元电子,将从ASIC设计和制造的快速增长中获益。
GPU Vs. ASIC
在AI训练领域,GPU一直占据主导地位。GPU最大的优势在于通用性强,并且具有高度并行化的架构,能够高效处理多种类型的计算任务,包括图形渲染、深度学习以及其他科学计算。此外GPU的生态系统也更成熟,CUDA等编程环境的存在让开发者可以轻松地利用GPU的强大性能进行各种复杂运算,同时也有丰富的库函数支持,降低了开发难度。
这种灵活性和成熟生态,使得GPU成为许多科研机构和初创企业的首选。然而,随着AI技术的不断进步和应用场景的日益丰富,ASIC作为另一种算力芯片解决方案,开始受到越来越多科技巨头的青睐。
ASIC芯片是为特定任务(如AI推理)而定制设计的,因此具有更高的能效比和更低的延迟。与GPU相比,ASIC在特定任务上的性能和效率上表现更加出色,可以在某些特定任务上提供更高的能效比和更低的成本。例如,Google的TPU就是专门为加速TensorFlow框架下的机器学习算法而设计的ASIC。
此外,随着云计算和大数据技术的不断发展,Google、Microsoft、Meta、Amazon等云服务商和大型科技公司纷纷开始自研ASIC芯片,除了为了降低对GPU的依赖并提升整体性能外,还能够获得差异化的竞争优势。
例如,苹果在2024年7月发表的iPhone AI预览版中表示,其AI模型是在Google的TPU(张量处理器)上训练的;Amazon的Trainium芯片在进行推理任务时,成本约比英伟达的H100 GPU低30%至40%;Google也持续优化其TPU系列芯片,最新的TPU v6在能源效率上比前一代提升了67%……
这些动作表明,非英伟达的训练方案同样有效,且正在成为AI训练领域的一个重要趋势。
然而,ASIC芯片也存在一些局限性。由于其定制性较高,开发周期较长且成本较高。此外,ASIC芯片的灵活性相对较低,一旦市场需求发生变化,ASIC可能无法像GPU那样快速适应新的算法或应用。因此,在选择AI训练芯片时,往往需要根据具体应用场景和需求进行权衡。
英伟达要强化定制芯片能力?
英伟达作为AI半导体市场的领导者,除了通过推出更先进的产品线(如GB300系列)继续巩固其在GPU市场的主导地位外,进军ASIC领域也是合理的,“双面下注”能够确保在这AI市场永远占据一席之地。
报道称,ASIC部门的成立,是英伟达为了应对AI市场快速变化而做出的重要决策。通过加强定制芯片组能力,英伟达旨在提供更高效、更专业的AI解决方案。
早在2024年10月,英伟达CEO黄仁勋在由硅谷创投Brad Gerstner所主持的Podcast节目「Bg2 Pod」中在接受采访时谈到ASIC的优缺点,同时以英伟达的策略来看,影响不大的理由:“如果你非常清楚自己要使用芯片做什么,并且未来不会改变,你可以去建立一个ASIC。”但是,他也强调了ASIC的限制,认为ASIC缺乏弹性。“一个完美的ASIC在某些工作上表现出色,但在其他方面却很糟糕。一旦AI的工作内容改变,它就会变得毫无用处,这就像是打造一块固定功能的软件。”
“AI模型变化非常快,GPU之所以有效,正是因为它能够适应这些变化。它是一种通用的设备,可以执行矩阵计算,并且可以写入程序代码。”黄仁勋强调,GPU可从一种AI应用转换到另一种,从一种研究转换到另一种,这种能力非常宝贵。
不过事实上,英伟达已经在多个场合表达了对ASIC的兴趣和支持。早在去年六月,黄仁勋就曾透露公司将开始涉足ASIC芯片设计,并承诺至少聘用1000名工程师,包括具有前段设计验证、IP整合、实体层设计等人才,在中国台湾建立大型AI研发中心,甚至考虑设立第二个人工智能超算中心。
黄仁勋曾表示,尽管CSP(云端服务提供商)客户将成为英伟达的竞争对手,但同时,所有CSP仍将通过ASIC服务成为英伟达的客户。英伟达的三大优势—使其在AI芯片市场中保持领先地位:“第一,虽然 Nvidia 的 AI 芯片并不便宜,但其价值就像一部智能手机取代了相机、音乐播放器等设备,将所有功能整合在一个设备中,整体上非常划算;第二,Nvidia 的 CUDA 拥有广泛而丰富的生态系统;第三,客户投资自研芯片,这大大增加了芯片的成本。”
友商和分析师怎么看
对此,中国台湾ASIC设计公司爱芯微总经理沈祥林表示,博通是ASIC市场的领导者,该领域的竞争门槛不断提高,对设计、资金和整体运营的要求都非常高。
沈认为,英伟达进军 ASIC 市场是一个坏主意,会与现有产品发生冲突。他以联发科为例,该公司的 ASIC 业务表现平平,尽管客户要求很高,但 ASIC 业务的毛利率并不高。沈表示,爱芯科技并不担心来自竞争对手的挑战。
总而言之,ASIC崛起确实对GPU造成了一定的压力,然而业内专家均认为并非零和游戏,短期内应该还是两者一起壮大AI产业。正如摩根斯坦利认为,ASIC的崛起并不代表GPU的衰落,相反地,这两种技术将在很长一段时间内共存,为AI产业内不同的需求提供最佳解决方案。他们也持续看好英伟达将持续主导AI芯片市场,尤其是在大规模语言模型训练方面,其GPU解决方案仍然是最佳选择。
《电子工程专辑》也将持续关注英伟达与博通的进一步发展。