7月19日,据科技媒体The Information报道, 开发ChatGPT的OpenAI公司已接触博通(Broadcom)在内的多家芯片设计商,共同探讨研发全新的AI芯片。报道指,合作细节仍有待敲定,若芯片得以开发,最早预计2026年投入生产。
有网友在社交媒体X评论上述消息称,OpenAI要和英伟达一较高下。还有评论看好博通股价上涨。
背景与动机
OpenAI开发的ChatGPT、GPT-4、DALL-E3等人工智能模型,其训练依赖于昂贵的图形处理单元(GPU)。为了克服这一问题,该公司正在探索自主制造人工智能芯片的想法。这一战略不仅有助于减少对英伟达(Nvidia)的依赖,也是OpenAI首席执行官萨姆·奥特曼(Sam Altman)提升全球半导体基础设施愿景的一部分。
今年2月,他制定了雄心勃勃的 AI 芯片计划,目标筹集 7 万亿美元,改造全球半导体产业,推动通用人工智能(AGI)发展。
7万亿美元相当于全球GDP的10%,几乎是去年整个半导体市场总收入的14倍,以2月当时的股价估算市值计算,这笔资金基本可以买下半导体生态的全部江山,拿下英伟达、AMD、台积电、博通、ASML、三星、英特尔、高通、Arm等公司,剩余的钱打包个Meta还能再带回家3000亿美元。
台积电的CEO魏哲家上月在一场新闻发布会上被问及新工厂的前景时就表示,奥特曼“太激进了,我难以置信。”尽管这一计划被认为过于激进,但最新消息显示,OpenAI正在逐步推进。
据知情人士透露,OpenAI一直在招聘谷歌张量处理单元(TPU)部门的前成员,并与包括博通在内的芯片设计企业洽谈开发这款新型AI芯片的事宜。虽然英伟达是企业在AI支出方面的最大受惠者,但博通正迅速切入这块市场,已经向数据中心营运业者销售一系列零组件,而业者们正在扩张设施来迎合提供AI服务的潮流。
英伟达CEO黄仁勋亲自向OpenAI交付首批DGX H200芯片时,OpenAI总裁Greg Brockman发布了一条推文
博通不但与谷歌合作制造TPU,还已与OpenAI芯片团队进行了交谈。此外,博通的台湾竞争对手,如AIchip Technologies,也向OpenAI推销此类服务。
“7万亿美元计划”的一部分
OpenAI芯片团队由谷歌TPU前工程高级总监Richard Ho领导。该团队正在考虑各种芯片封装和内存组件,以最大限度地提高芯片的性能。此外,OpenAI还希望借助谷歌TPU前员工开发Tensor处理器的经验和技术,开发出自家的AI服务器芯片。
奥特曼此前表示,“7 万亿美元”计划的实现不准确,但 AI 确需大量投资,AI 领域确实需要全球性的大规模资金与能源投资,以构建 AI 芯片及围绕其的基础设施堆栈,并最终向世界提供大量服务,让所有人从中获得巨大价值。
这项计划的一个关键部分,就是建立新的数据中心来容纳芯片。奥特曼打算与外部投资者成立一家或多家公司,以支付房地产、电力、数据中心以及将在其中安置的专用AI芯片服务器的费用,OpenAI承诺租用这些服务器。
此外,媒体提到,台积电的高级经理透露,奥特曼与台积电高管的交流从去年开始持续到了今年,双方讨论了台积电是否可以提高产能,生产更多的英伟达芯片或奥特曼提议的新型AI芯片。台积电的高管告诉奥特曼,如果他或OpenAI能够承诺下大量的新芯片订单,台积电愿意扩大芯片产量。
OpenAI也打价格战,新推GPT-4o mini
7月19日,OpenAI还发布了GPT-4o mini,加入大模型价格战。在ChatGPT中,免费用户、Plus用户和团队用户即日起可访问GPT-4o mini,取代GPT-3.5。从下周开始,企业用户也可以访问。
OpenAI称,GPT-4o mini是OpenAI最智能和最实惠的小模型,它在MMLU(大规模多任务语言理解数据集)中的得分为82%,每百万token的输入价格为15美分,每百万token的输出价格是60美分,比GPT-3.5 Turbo便宜60%以上,处理非英语文本也具有成本效益。
“在过去的几年里,我们见证了人工智能的显著进步,同时也见证了成本的大幅降低。”OpenAI表示,自2022年推出的功能较差的型号text-davinci-003以来,GPT-4o mini每token的成本下降了99%,“我们致力于在提高模型性能的同时继续降低成本。”
据悉,由于低延迟和低成本,GPT-4o mini可调用多个API,将完整的代码库或会话历史等大量上下文传递给模型,实现快速实时的文本响应交互。GPT-4o mini在API中支持文本和视觉,未来还将支持文本、图像、视频和音频的输入和输出。
GPT-4o mini上下文窗口达128K token,每个请求支持多达16K的输出token,知识更新到2023年10月;在文本智能和多模态推理的学术基准上超过了GPT-3.5 Turbo和其他小模型,支持与GPT-4o相同的语言范围。
GPT-4o mini在MMLU(大规模多任务语言理解数据集)中的得分为82%,而谷歌Gemini Flash得分77.9%,人工智能初创公司Anthropic的Claude Haiku得分73.8% 。
GPT-4o mini在数学推理和编码任务方面优于以前市场上的小模型,在数学推理的MGSM测试中,GPT-4o mini得分87.0%,Gemini Flash得分75.5%,Claude Haiku得分71.7%。
在MMMU(多模态推理评估)中,GPT-4o mini得分59.4%,Gemini Flash得分56.1%,Claude Haiku得分50.2%。
OpenAI表示,GPT-4o mini与GPT-4o一样具有相同的内置安全缓解措施,来自社会心理学和错误信息等领域超70名外部专家对GPT-4o进行了测试,以识别潜在风险并得到了解决。这些专家评估的见解有助于提高GPT-4o和GPT-4o mini的安全性。此外,GPT-4o mini是首个使用指令层次方法的模型,有助于提高模型抵抗越狱、提示注入和系统提示提取的能力,有助于让模型响应更可靠,在大规模应用程序中使用更安全。
对OpenAI来说只是迈出第一步
受合作消息影响,博通周四收涨2.91%,今年迄今的涨幅已达约48%。博通首席执行官陈福阳已表示,公司的AI销售在2024年度将超过110亿美元。
市场对OpenAI的这一举措反应积极,认为这不仅有助于减少对英伟达的依赖,也可能为OpenAI在未来与英伟达的定价谈判中提供更多筹码。
尽管开发一款能够与英伟达相媲美的新型服务器芯片的可能性很小,而且需要数年时间才能实现,但OpenAI的努力反映了其对来自谷歌、Meta等资金雄厚的科技公司的竞争的担忧。奥特曼早就说过,要击败他们并实现“超级智能”的梦想,OpenAI需要的计算能力将是现在的很多倍。
OpenAI的这一战略举措,不仅是对现有AI芯片市场的一次挑战,更是对未来AI技术发展的一次重要布局。通过与博通等企业的合作,OpenAI有望在AI芯片领域取得突破,推动全球AI技术的进步。