(本文编译自Semiconductor Engineering)
《Semiconductor Engineering》邀请一众嘉宾就一些前沿技术(包括数据中心中的生成式AI、AR/VR和连接设备的安全架构等)产生的影响进行了讨论。这些嘉宾包括埃森哲业务战略经理Michael Kurniawan、瑞萨电子资深董事兼业务加速和生态系统主管Kaushal Vora、Expedera营销副总裁Paul Karazuba,以及Arm技术策略师Chowdary Yanamadala。
SE:人工智能未来将如何影响芯片设计?会不会只有大型芯片制造商和系统公司获得优势,还是它将影响整个生态系统?
Karazuba:从设计的角度来看,人工智能有助于芯片普及化。如果人工智能能够在无需大型设计团队、工具等传统成本的情况下推动或促进芯片设计的发展,那么就有更多的机会实现普及化。然而,人工智能并不能解决掩模成本、测试成本、认证成本或晶圆成本。因此,人工智能确实为更多人进入芯片设计领域提供了一条途径,但由于其他所有相关成本,它并不能为小型公司与大型公司创造平等的竞争环境。
Vora:我同意。我从大型EDA公司那里经常听到的一件事是,AI确实有助于解决劳动力短缺的问题。人工智能正在取代许多传统的劳动密集型工作,可以通过嵌入在EDA工具中的机器学习和人工智能轻松完成这些工作。我们还在EDA工具中看到了协作式工作,这将显著提高生产率,随着时间的推移,人们会对这种方式感到更加自在。人工智能也不是要解决所有问题。它不会改变行业中的大公司与小公司之间的动态关系,但它也打破了很多壁垒,使芯片设计和EDA工具更容易实现。目前,大约有200家初创公司试图在硅谷制造基于人工智能的SoC芯片,其中很多都归功于人工智能,它使芯片设计工具之类的资源更容易获得。
人工智能影响系统设计的另一方面,如果回顾计算起步的早期阶段,这些通常是基于流水线式的冯·诺依曼架构。它们被设计用于加速线性代码行的工作负载,通常被称为软件1.0。我们现在看到的多是多线程和多核类型的架构,这些架构需要加速和处理越来越大的工作负载。从根本上说,从芯片架构的角度来看,我们正在进入软件2.0的时代,其中机器学习与传统软件相互交织。这也让架构中的异构性变得非常重要。硬件中的特定元素被设计用于加速特定类型的工作负载。有些元素擅长加速机器学习类型的工作负载,包括指数函数、非线性函数和可以并行运行的流水线架构。我们正在进入这个有趣的异构计算时代,这将为硬件和软件堆栈带来许多变化。
Kurniawan:随着人工智能越来越多地融入设计工具中,小型公司也可以获得这些工具,从而加快他们的芯片设计周期并降低成本,但这只是整个设计成本中的一小部分,还需要人才、资本支出、运行测试晶圆等需求,这些成本不会完全消失,可能会减少一些,但仍需要处理其它的事情。在芯片制造中,有一个“传承”因素,意味着从一款芯片设计的工作中获得的经验越多,对下一款芯片的迭代就越有帮助。设计领域的大公司不会一夜之间成为领导者。他们必须在很长一段时间内积累设计技能和能力。他们通过开创性的产品和巨额投资获得领导地位。我很期待芯片设计界将如何发生革命性的变化,但它仍有很长的路要走。
Yanamadala:总体上我同意人工智能在芯片设计中的存在感越来越强,但在芯片设计过程中部署人工智能时还是必须谨慎行事。这种预防措施是必要的,以防止专有信息泄露到公共领域,并解决因无意中使用未经批准的LLM或生成式人工智能工具而产生的潜在IP污染问题。除了这些问题,很明显,芯片IP创造者、芯片制造商和EDA公司已成功将人工智能集成到设计流程方法和工具中。很明显,无论是由人工智能赋能的代码生成应用程序还是自动化特定设计功能,人工智能的作用都将随着时间的推移继续扩大。然而,负责任地使用人工智能也非常重要,需要谨慎行事,还需认识到基于人工智能的工具和方法,尽管能够减少芯片设计某些领域的人力投入,但它也并不是简单的按钮式解决方案。
SE:人工智能在很多领域都发挥着作用,如云计算中的AI训练、边缘推理,以及用于开发芯片的AI等,但应用于这些领域的AI有什么关联性吗?
Vora:人们对于人工智能的看法不一,但实际上它是一门工程学科,是解决问题的一种方法。过去我们使用传统方法来解决问题,现在我们研究的问题都需要反复琢磨,查看数据,然后尝试利用这些数据来预测将来会发生事情的好坏。人工智能是通过将机器学习和智能应用于系统设计的某些方面来解决问题的一种方式。人工智能已被应用于半导体制造的各个方面,和半导体相关所有东西,以及使用半导体制造的所有产品。人们使用人工智能解决问题以及变得非常普遍,但我们还处于生态系统的早期阶段。
Karazuba:在企业界的许多领域,人们对人工智能到底是什么缺乏基本的了解。现在看起来似乎每家公司都是人工智能公司。如果你浏览LinkedIn,每个公司都是人工智能赋能的公司。但是,如果你问他们到底涉及人工智能的哪些方面,可能不会获得明确的答案。人工智能是一个很好的流行语。人工智能对制造业、芯片设计和云计算推理的意义有很大的不同。如果以云推理和边缘推理为例,它们非常不同。模型的性能和期望的也不同。对于一个非常大的行业来说,这是一个非常小的术语。随着时间的推移,当人们开始真正了解它的作用时,可能会有更好的词语来描述人工智能是什么。但是,人工智能的未来绝对是光明的,人工智能的价值也是真实的。我们目前也只是对人工智能管中窥豹而已。
Kurniawan:大多数人认为,人工智能是指数据中心中某个高性能、价值1万美元的芯片,运行模型并给出预测或建议。但是,人工智能也集成在了边缘设备中。它们运行在需要超高效的处理器上,执行诸如面部识别和语音识别之类的任务。设备本身使用硬币大小的电池运行。因此,目前也有这种类型的人工智能,尽管目前它并不处于最前沿,但正在迅速增长。物联网市场正在变得非常庞大,人们越来越意识到边缘人工智能将是大多数计算发生的地方。
Karazuba:作为边缘人工智能推理IP的制造商,对于我们在芯片行业中所接触到的绝大多数客户而言,在本地具备人工智能推理能力是他们在未来的设计中必须具备的。性能水平取决于市场、预算、预期用例,以及上市时间等。不管市场是否需要,具有专门的人工智能处理能力几乎是目前每个高端设计所必备的。可能95%的目前正在设计中的中端SoC和ASIC都内置了专用的人工智能处理能力。未来,每个边缘设备都可能内置某种人工智能推理能力,但这也显然需要在非常节能的情况下实现。
SE:不过,在芯片级别,这带来了各种各样的有趣挑战。人工智能芯片基本上是为了一直运行而设计的,这与我们过去所看到的不同,即处理器能开启也会关闭。人工智能背后的整个想法是尽可能快地在各种MAC元素或加速器上处理这些算法,这可能会缩短这些设备的寿命。此外,还存在人们甚至没有想到的安全问题,因为这些人工智能系统基本上会随着时间的推移进行变形以适应和优化自己。此外,还有新的软件的不断出现,以及大量的更新。然后还有生成式人工智能,这在一年前甚至还没有引起大多数人的注意。还有很多不确定因素,我们的行业从未对这么多不确定性做出过良好的反应,所有这些因素将如何发挥作用?
Karazuba:我做芯片和IP已经有25年了,但我从未见过像人工智能发展如此迅速的事物。我们中有些人一年前就知道ChatGPT了,但很少有人知道它能做什么。我想没有人能会预料到它能产生如此大的影响。人工智能模型发生了巨大变化。在六个月的时间里,我们接触到的网络的大小和复杂性都发生了根本性的变化。我不认同现在的芯片架构师或负责芯片规格的人还在市场上寻找可以使用6到10年的产品。6个月后的需求将与今天的截然不同,这往往会迫使人工智能处理采用‘暴力’手段,即在设计中加入尽可能多的不同MAC元素,以尽可能快的速度运行,并希望能够在6个月或6年内处理即将到来的数学问题。这对很多人来说将是艰难的。
Yanamadala:虽然目前训练占用了部署的大量计算资源,但推理使用的计算资源也显著增长,特别是在边缘设备上。这包括生成式人工智能中令人兴奋的发展趋势,其中应用程序将越来越多地依赖设备内的处理。这种转变需要功能多样的计算解决方案——更小的外形尺寸和高效的电源使用,以满足资源受限环境的需求。总体而言,将人工智能工作负载从云迁移到边缘凸显了对平衡性能的迫切需求,其中高效计算和功耗至关重要。
为了充分发挥人工智能的潜力,我们的行业必须解决三大主要挑战——计算、内存和功耗。计算的可用性和效率对任何人工智能应用程序都至关重要,这可以确保访问正确类型和大小的计算资源来执行人工智能工作负载。许多人工智能应用程序涉及处理大量的数据,这导致了在工作负载执行期间数据移动方面的挑战。要有效处理这种数据移动,需要解决计算与内存之间的接近度等问题。此外,功耗效率对于扩展人工智能来说也是一个巨大的挑战。解决功耗效率挑战与解决计算效率和计算与内存接近度的挑战密切相关。因此,在认识到人工智能所具备的快速性和变革性的同时,我乐观地认为,作为一个行业,我们将抓住它所带来的巨大机遇,尽管随之而来的是一系列可能性和挑战。毫无疑问,这也将是一个需要不断学习和调整的过程。
Vora:事物变化所需的时间比以前少的多。你会看到很多问世的芯片,它们的设计明显过于复杂,以应对未知因素,因为很多用例还都不成熟。模型在不断变化,它不像软件那样可以在几个月内进行更改。这是任何技术代际转变的特征,其中硬件元素将开始变得更加昂贵。随着生态系统的成熟,情况将趋于稳定。这对于许多设计师来说是一个具有挑战性的时期,但对于这个领域的人来说也很有趣。
Karazuba:我们在人工智能领域特别看到的一个趋势是协处理器的概念。一个应用处理器或ASIC上可能有一个更大的通用NPU,但OEM还将开发一块单独的芯片,即协处理器,它针对特定网络进行了调整和优化。然后,在发布后的几个月内,他们可能会专门围绕这些网络设计神经处理,以获得最佳的PPA和最佳的用户体验。这在预期寿命相对较短的消费设备(如智能手机)中非常适用。在预期寿命较长的市场(如汽车),这种做法可能相对粗暴。
Vora:在极端边缘,存在着内存和计算资源非常受限的计算节点。这可能是一堆传感器——模拟/混合信号传感器或数字传感器——它们收集数据并对其进行处理。问题在于用例的多样性,以及生态系统中的碎片化现象非常严重,以至于很难制造芯片或找到能够推动人工智能普及的杀手级应用。当您在定义该行业中的产品时,您会查看诸如CNN之类的算法,它们在视觉领域中仍然非常重要。或者,您看信号处理和先进数学类型的机器学习,它们对于传感器和多传感器系统来说也非常重要且关联度很高。这些都已经相当成熟。模型已经存在20或30年了。Transformer目前也很热,但随着事情的发展、成熟和接近用户端,技术将变得更加稳定。挑战在于用例和应用的多样性。这就是为什么即使在通用微控制器和微处理器类型的产品中,您也将开始看到更多专门为加速机器学习模型而设计的专用神经处理单元和DSP。由于Transformer和ChatGPT的高度消费者化,当前的生成式人工智能备受瞩目。但如果我们想要扩展生成式人工智能,这是不可持续的。它需要向边缘发展,它需要变得更加实用。
Kurniawan:行业迫切需要定制硬件,这需要与生态系统合作伙伴——尤其是软件开发人员的密切合作。你可能会需要了解软件将如何发展,这将决定如何设计硬件,反之亦然。这种灵活性基于我们之前已经完成的一些工作,我们看到芯片制造商试图预测如何满足目前正在探索的不同用例。这转化为硬件架构,这些架构需要足够灵活且可重新配置,以用于用例一、二和三,或未来任何相似的用例。这也是我们看到对FPGA的需求增长良好的部分原因。
SE:在过去,当我们看到新技术爆发时,它只在一个领域出现。现在,所有这些不同的部分都在以不同的速度加速,对吧?因此,我们可能有一个愿景,即所有这些部分都将协同工作,但并非所有部分都将是最新的,其中一些部分将发生变化。特别是先机节点和先进封装所提供的灵活性增加了大量裕量,这会影响性能和功耗。我们如何解决这个问题?
Kurniawan:这确实是一个复杂的等式。灵活性是一种方法,但更大的问题是,你如何管理其他参数?
SE:那接下来会发生什么?我们正将计算从盒子中取出并放到了各个角落。这将带来怎样的影响?
Karazuba:这对于市场上那些愿意冒险的人来说是一个巨大的机会。半导体行业自诞生以来就是一部冒险史。但这个行业中的公司已经变得非常庞大,而规模的扩大通常会带来一定的风险规避。对于那些不仅带来新技术,而且带来新的商业方法、供应链、芯片设计,以及帮助人们将产品推向市场的人来说,这是一个机会。IP模式通常是为了创建一个IP并将其卖给其他人。过去,通常无需为每个客户都创建略有不同的IP,但现在市场上很多人已经开始这么做。不确定性带来了变化,而变化带来了愿意加倍努力利用变化的人。传统玩家不会消失,但人工智能未来如何发展和如Chiplet等新技术如何发挥作用,都将在未来5-10年对整个半导体市场产生深远影响。如果量子计算如一些人预测的那样出现,那么5年后的对话可能也会非常不同。
Vora:就边缘人工智能而言,半导体行业有负责开发软件堆栈和工具,以使客户在人工智能方面取得成功。这不仅仅是创建复杂的芯片、添加花哨的功能并将其提供给客户。在大多数情况下,这实际上是如何使用芯片的问题。你如何为这块芯片编译代码?你是否有良好的生态系统和正确的堆栈来有更好地使用这块芯片?这就是复杂性所在。这不仅仅是半导体设计。如果观察目前在半导体领域取得巨大成功的一些大公司,他们获得成功的原因不仅仅是制造了非常酷的芯片,而且他们还拥有出色的生态系统和软件堆栈,可以真正地为他们的客户赋能。我读过一份麦肯锡的报告,其中表示,借助人工智能,半导体行业有机会从垂直堆栈中提取高达50%的价值。如果将其与PC时代或智能手机时代发生的事情进行比较,半导体行业只剩下10%或15%的价值。其它的都归软件公司所有。现在半导体公司掌握了绝对的主动权,问题是他们如何充分利用这一机会,并开发出能使硬件实际发挥作用的软件。
Kurniawan:边缘人工智能和物联网是庞大且不断增长的市场,Gartner和Yole的报告都显示了强劲增长的数字。物联网现在的问题是,它就像一个装满美味饼干的饼干罐,但有太多的手想伸进去。这就是我认为该领域出现碎片化的原因。有几个集成协作平台,其中一些公司开始将不同的硬件参与者、软件参与者、安全等整合在一起,并使他们能够嵌入自己的产品,以查看其产品与技术堆栈中其他组件的兼容性或适用性。这样做事希望能更早地解决问题,以便所有人通过平台的自然发展达到一个统一标准。因此,他们创建了一条高速路径,可以在低风险的情况下测试他们的产品,并查看它如何与技术堆栈中的其他组件相配合。如果该平台获得成功,将使其中的参与者能够更快且以较低的成本将产品推向市场。
END