Positron AI的创始人兼首席执行官Thomas Sohmers在AI Hardware Summit 2024上讨论了全球AI推理部署的经济和环境影响,他提出了三个关键议题:1)我们是否处于AI泡沫中,2)理解即将到来的经济动荡,3)未来的发展路径。
AI经济学:与2000年代初的光纤网络建设不同,当时的建设是为了未来的需求,而今天销售的GPU是为了满足现实需求。AI的经济价值不是短暂的,也不是为了达到某个预测的容量终点。
AI从根本上改变了全球经济结构的基础。这将消耗前所未有的资本,并测试土地/环境的极限。
生产要素:土地 - 新数据中心是新财富创造的体现,它们正在建设中,但扩张有限(电力/水资源)。资本:预计到2030年,AI基础设施支出将达到每年2000亿美元,与2024年美元计价的曼哈顿计划320亿美元和1956-1992年州际公路系统6000亿美元相比。劳动力:企业很快就能根据需求启动10万个专家员工。第四次工业革命将使劳动力变得指数级增长或实际上无限。
2030年数据中心预计的电力使用量:与今天的144吉瓦相比,将有1.35亿等效家庭和1350万个H100等效部署。这将产生预计8.1亿公吨的二氧化碳,而今天是5100万吨。
Llama 3.1 405B可以取代今天的初级工程师,8个H100上每秒30个token,相当于每年30000美元的Llama员工。
Positron:成立于2023年4月,拥有1200万美元的种子资金,专注于改变应用AI的底层经济学,专注于使推理对更多人负担得起。他们今天正在运送生产硬件。
Positron内存:Positron强调了他们在Llama上实现95%的高内存带宽利用率,而NVIDIA H100系统的理论内存带宽利用率约为30%。
Positron的Atlas服务器使用HBM和DDR,在10KW的占地面积上提供6倍的应用AI,成本仅为NVIDIA DGX H100的一半。
内容来源:AI Hardware Summit 2024
高端微信群介绍 | |
创业投资群 | AI、IOT、芯片创始人、投资人、分析师、券商 |
闪存群 | 覆盖5000多位全球华人闪存、存储芯片精英 |
云计算群 | 全闪存、软件定义存储SDS、超融合等公有云和私有云讨论 |
AI芯片群 | 讨论AI芯片和GPU、FPGA、CPU异构计算 |
5G群 | 物联网、5G芯片讨论 |
第三代半导体群 | 氮化镓、碳化硅等化合物半导体讨论 |
存储芯片群 | DRAM、NAND、3D XPoint等各类存储介质和主控讨论 |
汽车电子群 | MCU、电源、传感器等汽车电子讨论 |
光电器件群 | 光通信、激光器、ToF、AR、VCSEL等光电器件讨论 |
渠道群 | 存储和芯片产品报价、行情、渠道、供应链 |
< 长按识别二维码添加好友 >
加入上述群聊
带你走进万物存储、万物智能、
万物互联信息革命新时代