在人工智能时代,AI芯片是发展的核心。然而,在元宇宙下重注的Meta似乎没有那么上心,直到ChatGPT风暴的来临,才让扎克伯格感觉不能再置身事外。
图源:Meta官网
4月26日,有消息人士透露,目前Meta内部已开始计划开发一款新型芯片,类似GPU,既能训练AI模型,又能进行推理。该项目将于2025年左右完成。
然而,在经历高管变动、员工流失、资金不足、路线选错的当下,Meta又转身投入AI芯片的开发,又有多大胜算呢?
竟然用CPU训练AI!
大家都知道,AI需要大量的计算能力来处理大量的数据,例如深度学习中的卷积神经网络(CNN)需要对大量的图像数据进行处理。而在这个过程中,GPU(图形处理器)具有大量的核心和高速内存,擅长并行计算,比CPU(中央处理器)更适合执行这些任务。
不过,有消息人士透露,此前Meta发展AI业务时,一直没有接受使用GPU。甚至2022年,Meta仍然主要使用CPU队列运行人工智能工作负载。很难想象,在AI深度学习时代,Meta这样的科技巨头却仍然在坚持使用CPU。
实际上,CPU是计算机、数据中心的主力芯片,但在AI应用上并非其强项。当然,Meta也曾尝试过自研AI芯片,且在内部设计的定制芯片上进行推理。而且,Meta发现,GPU在运行不同类型的模型上,远比Meta的芯片更灵活,而且速度更快、效率更高。
不过,Meta向元宇宙过度的投入,也影响了其AI芯片研发计划,最终以失败告终。
值得一提的是,GPU确实很昂贵,且高性能GPU基本被英伟达独家垄断,同时在相关配套软件上也具有统治地位。最近,英伟达在2022年最新发布的旗舰AI芯片H100在美国电商平台eBay上的售价已经超过4万美元!
实际上,Meta在AI芯片研发进展已经影响到了自身大规模创新,也成为Meta在AI进程上落后对手的关键原因之一。在这一点上,Meta高层也承认了这一点。
Meta基础设施负责人Santosh Janardhan也曾表示,无论是开发AI的工具,还是工作流程,Meta都已经远远落后于其他对手,“Meta需要从根本上改变物理基础设施设计、软件系统和提供稳定平台的方法。”
当然,即使没有GPU,AI开发也可以通过算法优化、硬件加速技术、混合算法和加速工具集成等方法取得成功,而Meta此前也应该是抱着这个想法,迟迟不用GPU。不过,GPU在AI技术竞争自然还是最有选择。
在2022年定制AI芯片失败之后,Meta同年向英伟达订购了数十亿美元的GPU,但此时与微软、谷歌等科技巨头在AI技术竞争上已经拉开了差距。
2022年,Meta重组了Meta的AI部门,对AI基础设施领导层进行了一次大换血,导致十多位高管离开。同时,Meta也发现,重新适应GPU,也面临着很多挑战,比如GPU的散热和功耗的问题。
然而,受困于此前战略决策失误,Meta最终还是被ChatGPT的突然出现,认清了现实。
ChatGPT“风暴”来临
如果要说2022年底以来AI领域最重磅的事件,ChatGPT必然当之无愧。
ChatGPT在自然语言处理中有着广泛的应用,正加速生成式AI(AIGC)的发展,被认为将掀起搜索引擎的新一轮变革。ChatGPT在刚推出仅60天的时间里,就累积了高达1亿的月度活跃用户,成为历史上增长最快的消费应用程序。
与此同时,随着AIGC特别是ChatGPT突然到来,大模型AI训练让GPU的重要性凸显,甚至业界也掀起了高性能GPU的争夺战,以及GPU技术性能的竞争,比如英伟达GPU和谷歌的TPU(定制GPU)。
图源:华为
Meta自然也不能熟视无睹,假装看不见。实际上,Meta在AIGC领域也一直在做相关的研究工作。
2月25日,Meta推出了一个新的大模型系列——LLaMA(Large Language Model Meta AI),参数量从70亿到650亿不等。这些模型的性能非常优异:具有130亿参数的LLaMA模型「在大多数基准上」可以胜过GPT-3(参数量达1750亿),而且可以在单块V100 GPU上运行;而最大的650亿参数的LLaMA模型可以媲美谷歌的Chinchilla-70B和PaLM-540B。
Meta CEO 马克·扎克伯格(Mark Zuckerberg)最近也透露,公司正在组建产品研发团队,专门开发 AI 机器人相关功能。这些功能将在 WhatsApp、Messenger 和 Instagram 等平台上线。
2023年,Meta也将打造AI技术团队,专注于AI自动生成技术,开发多款AI机器人,应用于WhatsApp、Messenger和Instagram等Meta旗下平台,帮助用户查找和生成文本、图像以及视频等多媒体内容,提升各大平台的使用体验。不过扎克伯格也说道,在实现真正的未来体验之前,Meta“还有很多基础性工作要做”。
的确,Meta仍需解决人员“大换血”,以及过度投入元宇宙所带来的反噬效应。在今年2月初的一次财报电话会议上,扎克伯格提到,“我们坚持效率至上,并继续精简公司人员。在削减表现不佳的项目后,我们可以更有效率地完成重要项目。”他甚至表示,2023 年将是“效率年”,“公司将实施‘扁平化’管理,去除部分中层管理人员。此外经理和董事也必须做出贡献,否则就要被辞退。”
当然,内部问题自然要解决,但ChatGPT所带来AIGC“风暴”也要重视。这也就有了Meta也在内部开发AI芯片的计划。
值得一提的是,知情人士透露,微软芯片高管Jean Boufarhat即将加盟Meta。Jean Boufarhat是微软硅工程公司副总裁,在加入Meta之后,他将会取代Ofer shachham在Meta的职位。而shachham的后续职位目前尚不能确定。据悉, Boufarhat 将负责为Meta 硬件设备开发定制芯片。
亡羊补牢,为时未晚?
那么,Meta重新回到AI技术的竞争赛道,是“亡羊补牢,为时未晚”?
目前,Meta 正为旗下社交应用开发“人工智能角色”,会有希望成为生成式人工智能领域的“领导者”吗?
当然,Meta拥有优秀的技术实力、庞大的数据和算力资源以及强大的资金支持,但要成为生成式人工智能领域的领导者,不仅面临着微软、谷歌等强大的竞争对手,还需解决曾经过度偏向元宇宙战略策略遗留下的问题。
不过,元宇宙真的是Meta的战略失误吗?自然不是!
尽管很多人都认为Meta可能在元宇宙决策上存在一些失误,但个人认为当前Meta在元宇宙领域将在AIGC的加持下更具发展前景。
图源:Meta官网
或许正如扎克伯格说的那样,人类正处于互联网下一章的开端。而ChatGPT的出现,对元宇宙是一个很好的技术补充,也将加速推动元宇宙落地。因为元宇宙此前比较难解决的技术是人机对话。在ChatGPT出现之后,元宇宙就能得到AIGC大力技术支持,还能支持内容自动生成。因此,甚至可以说,AIGC技术的不断落地应用,将为元宇宙描绘更加美好的未来。
今年1月,Meta推出新一代全球最快AI超级计算机。这台名为“人工智能研究超级集群”(RSC)的人工智能超级计算机是Meta近两年来的研究成果,有望成为全球最大、运行速度最快的人工智能超算。这台AI超级计算机可以帮助研究人员构建更好的AI模型以及开发新的增强现实工具,也将为Meta元宇宙平台发展提供助力。
4月6日,Meta又发布通用图像分割模型Segment-AnythingModel(SAM)和图像注释数据集Segment-Anything1-Billion(SA-1B)。
据悉,SAM模型可根据文本指令等方式,实现零样本下对任意图像行分割,其灵活性在图像分割领域尚属首创。SAM的发布被称为计算机视觉领域的“GPT-3时刻”,或将加速图像分割视频领域的研究。
此外,Meta还开源了包含1100万张图像和11亿个掩码的训练数据集SA-1B,该数据集可用于研究目的,并且在开放许可Apache2.0下可用。
东方证券认为,SAM有望赋能众多垂直领域,比如自动驾驶、工业视觉、医疗、数据标注等,释放AI强大潜力。目前,Meta公司内部已开始使用SAM,对其网站的图片、审核、Facebook和Instagram用户推荐内容等进行标记,同时,其官网也展示了SAM在VR/AR、智慧农业等领域的颠覆性应用。
Meta也预计,通过快速工程等技术实现的可组合系统设计将比专门为一组固定任务训练的系统能够实现更广泛的应用,并且SAM可以成为AR/VR、内容创建、科学领域和更通用AI系统等领域的强大组件。甚至有人认为,SAM模型将帮助Meta进一步推进Project Aria智能眼镜项目。
因此,Meta重新回到AI竞争赛道,更赋予其曾下重注的元宇宙更多的可能,至少从目前的一些信息可以预见到。