7月23日消息,马斯克在社交媒体X上宣布,旗下AI初创公司xAI已开始在位于田纳西州的所谓孟菲斯超级集群(training cluster)上进行训练,号称这是“全球最强大的AI训练集群”。它拥有10万台液冷H100 GPU,在一个单一的RDMA架构上运行,这是迄今为止世界上最强大的AI训练集群。
据悉,该集群利用了单个RDMA结构(远程直接内存访问),意味着所有GPU可以高效地共享和传输数据,从而极大地提高了计算效率。此外,H100 GPU本身具备第四代Tensor Cores和Transformer Engine,支持FP8精度,能够显著提升大型语言模型的训练速度和推断速度。例如,H100可以在大型语言模型上实现高达9倍的训练加速和30倍的推理速度。
H100 GPU还通过第二代Multi-Instance GPU (MIG)、内置NVIDIA保密计算和NVLink交换系统来确保所有工作负载的安全加速,从企业到超算。这些技术细节使得该集群不仅在性能上领先,同时也在安全性方面提供了保障。
目前,xAI公司的主要竞争对手包括OpenAI、Google DeepMind和微软等公司。这些公司在人工智能领域各有其优势和劣势。
其中,OpenAI是人工智能领域的先驱之一,拥有强大的研究基础和开发能力,并得到了微软等大型科技公司的支持,资金雄厚,技术先进。此外,OpenAI在创建自研的AI聊天机器人方面也与xAI展开竞争。
Google DeepMind则以其在深度学习和强化学习领域的卓越成就而闻名,其研究成果广泛应用于多个领域,包括游戏、医疗和自动驾驶等。
微软作为全球领先的科技公司之一,在云计算、大数据和人工智能等领域都有深厚的积累,并且通过收购GitHub等平台进一步加强了其在AI领域的影响力。
值得一提的是,大摩调查显示,68%的投资者认为AI是特斯拉未来一年股价的主要驱动力,仅有33%的投资者倾向于电动车。
马斯克此前在特斯拉2024股东大会上也表示,将专注于自动驾驶和人形机器人等领域,希望开启特斯拉下一个“时代”。特斯拉计划在纽约超级工厂投资5亿美元,构建Dojo超级计算机集群,并对Autopilot团队累计投入超100亿美元,用以训练计算、庞大数据管道和海量视频存储。
马斯克也透露,xAI的目标是到2024年12月训练出“按每项指标衡量都是全球最强大的AI”。