人类为大规模AI负荷做好准备了吗？-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 扫一扫

扫码查看更多文章

功耗是一个真正的问题，功率密度也是如此。为了解决新出现的任务和用例，需要建立更大、更密集的人工智能平台。在许多情况下，以所需速率和馈电要求实现电连接时，需要组件彼此靠得很近，这将导致功率密度问题，进而限制了人们在集群中添加更多人工智能组件和进一步扩展的能力。

ChatGPT激发了全球对人工智能的丰富想象力。这个聊天机器人可以写文章、作曲、甚至还可以用不同的语言与人类交谈。如果人们读过任何ChatGPT的诗歌，就会发现，虽然它还没有通过图灵测试，但无论是与数月前、还是与专家对人工智能的预期相比，也都是一个巨大的飞跃。在刚刚发布的前5天里，ChatGPT的注册用户就超过了一百万人，这一数据打破了技术应用的历史记录。

这股风潮也强化了如下论点：即人工智能将对人类的生活方式产生巨大影响。一些人预测，到2030年，人工智能通过对制造业、零售业、医疗保健、金融系统、安全和其他日常流程进行精细优化调整，将对全球GDP做出重大贡献。

但这一突然的成功背后，也凸显了人工智能当前最紧迫的问题：即如今的计算基础设施并非为处理人工智能工作负荷而建造的。在过去5年里，人工智能网络的规模每年增长近10倍。到2027年，数据中心中有五分之一的以太网交换机端口将专门用于人工智能、机器学习和加速计算。

于是，大规模人工智能即便在技术和经济上并非不可能，但现实中也变得不切实际。即便是对环境来说，也是很可怕的。因为训练一个像GPT-3这样的模型，就用了1750亿个节点，耗能高达1287兆瓦时，这么大的能耗足以供大约120个美国家庭使用整整一年。如果将该模型性能提高10倍的话(未来肯定会达到)，其算力和能源需求还将增加1万倍。

为了摆脱这种螺旋式上升的资源需求，就需要从头开始重新思考计算架构。对于所有即将到来的变化，虽然不可能全部预测到，但我认为下面这些变化即将到来：

计算平台会被完全分解

系统中的每个单元——CPU、GPU、DPU、内存、存储、网络等等，都必须能够按照自己的步调进行升级和改进，以使创新能够跟上算法需求和容量/吞吐量需求。这也意味着将消除它们之间的相互依赖。

内存就是一个明显的例子。在过去的几年里，内存已经成为扩展性能的瓶颈。虽然对更多带宽和容量的需求一直在不断增加，但现在几乎不可能再扩展主机的内存接口。

正在走向商业化的CXL技术，可以绕过传统的PCIe接口，而通过CXL连接将更多的内存连接到处理器。CXL还允许不同的处理器和设备共享外加的内存池。数据中心还能够从老的服务器上回收内存，用于创建CXL池，以优化其总体拥有成本。这样做最起码能够实现：更好的资源利用率、更高的峰值性能、以及更好的投资回报率。存储和网络已经在一定程度上被分解，但未来人们将会看到数据中心的完全模块化，不同的功能和/或组件将会分布在各个设备中，并具有动态变化的关系。

光将成为传输媒介

不过，上述分解产生了延迟、潜在的带宽瓶颈也遏制了性能。为了充分发挥分解的潜力，需要一种能够最大限度地减少这些缺点的传输媒介。

如上所述，功耗是一个真正的问题，功率密度也是如此。为了解决新出现的任务和用例，需要建立更大、更密集的人工智能平台。在许多情况下，以所需速率和馈电要求实现电连接时，需要组件彼此靠得很近，这将导致功率密度问题，进而限制了人们在集群中添加更多人工智能组件和进一步扩展的能力。

光是唯一能够有效解决这些问题的传输媒介。光已经将机架连接在一起。在下一阶段，光将被用来连接机架内的设备，甚至用于系统节点内部。诸如人们熟悉的CXL等协议，也都将转移到光域。

有一个例子可以说明人工智能平台的规模。比如一个目前速度为25Tbps的以太网交换机。为了简单起见，先不考虑冗余、根和拓扑架构，这个交换机可以容纳大约500台服务器，相互间用典型的50Gbit/s的速率连接。然而，该交换机可以容纳多少个采用以3.6Tb/s(实际发布的总速率为900GB/s)速率连接集群中对等GPU的高端GPU呢？答案是仅为七个！

因此，对更高带宽的需求显然是存在的。虽然铜缆交换机仍将是一个繁荣的市场，并将继续发展，但光交换机将开始吸引高端交换任务。

专注于数据中心内部以及数据中心之间光通信的PAM4和相干DSP已经开始兴起，使光行业走上了一条更可预测的进步之路：光不再像其早期那样，仅仅是小作坊式的业务。即将推出的1.6T(200G/lambda)光模块在增加带宽的同时，还能减少元件数量，降低成本和功耗，具体取决于配置和工作负荷。

目前光技术何时以及如何被集成进芯片中，仍然是一个争论不休的话题。由于一系列原因，包括稳步提高的性能、广泛的生态系统、客户选择等，可插拔的光学模块，在未来几年仍将是通用工作负荷的标准。然而，共封装(co-packaged)光学解决方案，在人工智能集群内可能会很快得到部署。虽然共封装光学器件的可靠性和性能仍需得到进一步证明，但通过共封装光学器件，可能实现带宽、效率、以及功率密度的提升，将推动研究的快速发展，并反过来导致其性能的突破。

人工智能训练将实现本地化

训练一个什么都知道、并不断变得更智能的单一模型，在规模上是值得怀疑的。

一个较好的方法是在云端训练一个具有通用能力的"通用"模型，然后再根据覆盖地区的具体情况、用途、目标受众等，重新进行边缘训练。接着可以考虑将所有的优化模型相互连接起来，创建一个知道一切的超级模型，就像由许多网站组成互联网一样。潜在地，对用户来说，这些都必须是透明的。

举一个人类自身的例子：孩子从第一天起就学会了说话，并具备与其他人互动的能力。这是进化训练人类操作系统的一部分。然后，根据当时当地的周围环境，这个孩子利用相关的语言、知识、行为等，对这一继承训练的能力进行“精细优化”，从而实现自我进步和成长。这种人类学习脚本，同样也适用于人工机器学习。

随着时间的推移，能耗和计算周期将下降，而消费者满意度也将上升，系统将输出更好和相关度更高的响应。

最后我们一定会成功。尽管其中的许多挑战令人生畏，但毕竟它们都还没有超出人们的想象力范围。上述所描述的这一切都不需要特别的资源。随着人工智能创新不断渗透进所有其他形式的计算中，技术努力所得到的回报将会越来越丰富。

接下来，所需要的只是一系列的试错过程，以及用新的范式替换一些旧的范式。通过不断扩展升级，就能成功应对人工智能的挑战。

(参考原文：Are we ready for large-scale AI workloads?）

责编：Jimmy.zhang

阅读全文，请先

人工智能存储技术处理器/DSP

您可能感兴趣

英伟达推出AI超级电脑Jetson Orin Nano Super，价格仅249美元

新款开发板售价仅为249美元，而上一代40 TOPS开发板售价为499美元，价格仅为上一代的一半。这使得Jetson Orin Nano Super成为“世界上最经济实惠的生成式AI计算机”，特别适合商业AI开发者、爱好者和学生使用。

AWS计划追加100亿美元投资，在美国俄亥俄州扩建数据中心

近年来，AWS还积极投资于人工智能（AI）、机器学习（ML）、大数据分析和边缘计算等前沿技术，以保持其在这些领域的竞争优势。

【ICCAD2024】EDA新势力：芯行纪以AI重塑数字实现新未来

通过机器学习技术，EDA工具可以获取更精确的模型来预测设计中存在的问题，如布线拥塞、信号干扰、热效应等，从而为用户提供更准确快速的指导，避免后期返工。

美国计划推出“守门人”新规：简化AI芯片出口审批的同时，管制AI芯片出口

这一新规则可能会引起美国在世界各地的合作伙伴和盟友的重大担忧，以及一些国家的不满，担心美国会充当单方面仲裁者，决定谁可以获得对AI至关重要的先进芯片。

谷歌指控微软与OpenAI涉嫌垄断，要求FTC终止独家云服务协议

谷歌认为，这种独家协议可能会限制市场竞争，导致其他公司无法自由地使用OpenAI的技术，从而增加了用户面临额外成本的风险，比如数据迁移和员工培训等。

马斯克刷新世界首富记录：身家超过4000亿美元，未来看涨万亿美元

有鉴于电动汽车、自动驾驶和人工智能业务等未来增长潜力，以及在马斯克在当选总统特朗普政府中的“特殊地位”，多家分析机构认为，马斯克的财富未来还将进一步增长。

“一碰交互，共触未来”ITMA峰会盛大开启近场交互新生态

目前，智能终端NFC功能的使用频率越来越高，面对新场景新需求，ITMA多家成员单位一起联合推动iTAP（智能无感接近式协议）标准化项目，预计25年上半年发布1.0标准，通过功能测试、兼容性测试，确保新技术产业应用。

中科院微电子所在忆阻神经-模糊硬件及应用探索方面取得新进展

中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案，首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……

直角照明轻触开关为复杂电子应用提供定制性和多功能性

C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置，为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。

投身国产浪潮向上而行，英韧科技再获“中国芯”认可

94岁巴菲特公布后事安排！1500亿美元遗产，只留0.5%给子女？

投资界传奇人物沃伦·巴菲特，一位94岁的亿万富翁，最近公开了他的遗嘱。其中透露了一个惊人的决定：他计划将自己99.5%的巨额财富捐赠给慈善机构，而只将0.5%留给自己的子女。这引起了大众对于巴菲特家庭

拜登拟对成熟制程芯片启动301调查

来源：观察者网12月18日消息，自12月2日美国发布新一轮对华芯片出口禁令以来，不断有知情人士向外媒透露拜登政府在卸任前将采取的下一步动作。美国《纽约时报》12月16日报道称，根据知情人士以及该报查阅

LGDisplay引入AI处理OLED质量异常效率提升90%，每年节约超2000亿韩元

来源：IT之家12 月 18 日消息，LG Display 韩国当地时间今日宣布，已将自行开发的“AI 生产系统”投入到 OLED 生产线的日常运行之中，该系统可提升 LG Display 的 OLE

华为Pura80细节曝光：麒麟9020跑分能上130万分

对于华为来说，今年的重磅机型都已经发完了，而明年的机型已经在研发中，Pura 80就是期待很高的一款。有博主爆料称，华为Pura 80将会用上了豪威OV50K传感器，同时电池容量达到5600毫安时。至

iPhone17系列迎六年来首次设计大换代：回归铝合金背板

有博主基于曝光的信息绘制了iPhone 17系列渲染图，对比iPhone 16系列，17系列最大变化是采用横置相机模组，背部DECO为条形跑道设计，神似谷歌Pixel 9系列，这是iPhone六年来的

又输了！《黑神话：悟空》年度最佳PS5游戏败给《宇宙机器人》

2024年度PlayStation游戏奖今日公布，《宇宙机器人》获得年度最佳PS5游戏，《使命召唤：黑色行动6》获得年度最佳PS4游戏。在这次评选中，《宇宙机器人》获得多个奖项，包括最佳艺术指导奖、最

撒贝宁走进维信诺，探寻“非凡中国屏”诞生背后的科技传奇之旅

万物互联的时代浪潮中，以OLED为代表的新型显示技术，已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者，凭借自主创新，实现了我国OLED技术的自立自强，成为中国新型显示产

AI日报丨超级AI独角兽来了！拿下100亿美元融资，估值升至620亿美元

“ 洞悉AI，未来触手可及。”整理 | 美股研究社在这个快速变化的时代，人工智能技术正以前所未有的速度发展，带来了广泛的机会。《AI日报》致力于挖掘和分析最新的AI概念股公司和市场趋势，为您提供深度的

JNTC宣布在印度开发和量产车载盖板玻璃

12月18 日，据报道，JNTC与印度Welspun BAPL就车载盖板玻璃的开发及量产签订了投资引进业务合作备忘录（MOU）。资料显示，JNTC是韩国的一家盖板玻璃厂商。Welspun的总部位于印度

巨头疲软行业内卷，极越为谁而“亡”？

在上海嘉定叶城路1688号的极越办公楼里，最显眼的位置上，写着一句话：“中国智能汽车史上，必将拥有每个极越人的名字。”本以为这句话是公司的企业愿景，未曾想这原来是命运的嘲弄。毕竟，极越用一种极其荒唐的

文章评论

最新
热门

换一换

EE直播

更多>

人类为大规模AI负荷做好准备了吗？

计算平台会被完全分解

光将成为传输媒介

人工智能训练将实现本地化

杂志声明