蚂蚁集团Ling团队于Arxiv平台上发表一篇技术成果论文,以在有限的资源和预算约束下高效训练LLM,Ling团队通过架构优化、训练策略革新及分布式计算框架升级,实现了在国产低性能GPU设备上的高效训练......

近年来,大型语言模型(LLMs)如OpenAI、Gemini、Claude、Qwen、DeepSeek-AI的快速发展在学术界和工业界引发了关于通用人工智能(AGI)的热烈讨论。尽管密集型模型取得了显著进展,但混合专家(MoE)模型,如DeepSeek系列、Qwen系列和MiniMax-01系列,在某些特定任务上的表现甚至超越了传统的密集型模型。

然而,MoE模型的训练通常依赖于高性能计算资源(例如H100和H800 AI加速器),其高昂的成本限制了在资源受限环境中的广泛应用。

近日,蚂蚁集团Ling团队于Arxiv平台上发表一篇技术成果论文《每一个FLOP都至关重要:无需高级GPU即可扩展3000亿参数混合专家LING大模型》,以在有限的资源和预算约束下高效训练LLM。Ling团队通过架构优化、训练策略革新及分布式计算框架升级,实现了在国产低性能AI加速器上的高效训练。

这一开源模型已发布于https://huggingface.co/inclusionAI。

论文摘要显示,“在这份技术报告中,我们解决了训练大规模混合专家(MoE)模型的挑战,重点关注如何克服此类系统中普遍存在的成本效率低下和资源限制问题。为此,我们提出了两种不同规模的MoE大语言模型(LLM)——Ling-Lite和Ling-Plus(中文名“百灵”,拼音Bailing)。Ling-Lite包含168亿参数(激活参数27.5亿),而Ling-Plus拥有2900亿参数(激活参数288亿)。两个模型均表现出与行业领先基准相媲美的性能。本报告提供了可操作的见解,以提升资源受限环境下AI开发的效率和可及性,推动更具扩展性和可持续性的技术发展。具体而言,为降低MoE模型的训练成本,我们提出了以下创新方法:

  • 模型架构与训练流程优化;
  • 训练异常处理改进;
  • 模型评估效率提升。

此外,通过知识图谱生成的高质量数据,我们的模型在工具使用能力上优于其他模型。实验表明,3000亿参数的MoE LLM可在低性能设备上有效训练,性能与同规模密集模型/MoE模型相当。与高性能设备相比,预训练阶段使用低规格硬件系统可节省约20%的计算成本。”

Ling系列模型在英语和中文的语言理解上达到行业领先水平,在复杂数学问题求解和代码生成任务中表现突出,支持工具使用并具备高安全性设计,适用于金融、医疗等高敏感场景。

文档还包括了一个关于安全性的评估,比较了Ling-Plus模型与其他几个模型的安全性能。结果显示Ling-Plus在拒绝错误输出的同时保持了良好的实用性,得分高于一些竞争对手。

蚂蚁集团此次突破的核心在于通过国产芯片与算法优化的协同创新,不仅实现了与英伟达芯片相当的训练效果,还大幅降低了算力成本。

以Ling-Plus模型为例,若使用高性能硬件(如英伟达H800)训练1万亿token,成本约为635万元;而采用低规格国产芯片系统,成本降至508万元,节省近20%。

消息指出,虽然蚂蚁集团未完全放弃使用英伟达芯片,但新模型已开始转向以中国半导体及部分Advanced Micro Devices(AMD)处理器为主。对此,蚂蚁集团尚未正式回应。

Bloomberg Intelligence分析师表示,蚂蚁集团这项研究突显中国AI技术发展速度之快,也反映国产科技已具备自我供应的潜力,逐步摆脱对美国先进芯片的依赖。

2025年3月,蚂蚁集团首次公开回应投资布局调整,将资金从成熟项目转向大模型、AI算力、具身智能等前沿领域。蚂蚁集团通过减持奥比中光(套现5.56亿元)与永安行(套现2.19亿元)两家上市公司,累计回收资金超7.75亿元,这是基于“AI First”战略的主动调整。

文献链接:https://arxiv.org/pdf/2503.05139

责编:Amy.wu
您可能感兴趣
不仅如此,特朗普政府据报正在制定更严格的芯片限制措施,意图扩大拜登政府的政策,加强对中国的技术限制。
特斯拉等头部企业的入局,极大地加速了人形机器人产业化的进程,使其从概念走向现实。用马斯克的话来说,人形机器人将比汽车市场更大。
在相同外形规格下,美光HBM3E 12H 36GB比HBM3E 8H 24GB提供了更高的存储容量,高出50%,且功耗降低了20%。
微软位于上海张江的人工智能与物联网实验室已经关闭,这个实验室是微软全球设立的七家实验室之一,于2019年5月在上海张江人工智能岛正式启用......
 《实施〈中华人民共和国反外国制裁法〉的规定》已经2025年3月21日国务院第55次常务会议通过,现予公布,自公布之日起施行。
基辛格是一位在科技行业享有盛誉的领导者,拥有超过40年的丰富经验,同时他也是一位虔诚的基督徒……
进口替代和资本加持是我国芯片设计业在过去最大的拉动力和推动力,许多芯片设计企业靠拼资本力挺的产业化能力(典型特征是群起以价换量)来实现了自己的快速发展,但是这两个动力在今天都遇到了一些问题。
针对溶剂型三防漆的不足,汉高推出了一款新型UV固化无溶剂型三防漆:Loctite Stycast CC 8555,不含挥发性有机化合物(VOC)的单组分配方,可在户外电动汽车充电站等极端环境中为大功率电子设备提供坚固的PCB和组件保护。
面对复杂多变的市场环境,硬科技企业能够破浪前行、韧性增长的“武功秘籍”之一,正是供应链的支撑,堪称“供应链强则企业强”。
作为中国半导体薄膜沉积设备领域的领军企业,拓荆科技将在展会首日于E6馆6413展位举办“拓芯章·见未来”新品发布会,重磅亮相多款覆盖先进制程节点的半导体核心设备。
2.2.2瑞萨RA系列MCU命名方法与选型2.2.2.1瑞萨MCU的命名方法整体命名:点击可查看大图对初学者来说,要理解RA产品家族产品型号中的不同数字和字母并不容易。我们首先以RA系列MCU中的其中
AI司机 发自 副驾寺智能车参考 | 公众号 AI4Auto喝咖啡,看News,各种出差体验最新的车,见各种有意思的人获取最酷的认知。这大概就是智能车参考编辑部的日常,现在这样的工作和生活方式,正式向
课程介绍 本系列课程注重于模拟芯片设计流程中的电路原理图设计、仿真及优化方法、版图设计、寄生参数提取及后仿真优化等的实际操作,在电路设计过程中学习模拟IC设计和验证方法,将理论与实践相结合,深入认识电
在半导体制造流程中,有一种极其重要的设备,这就是等离子体电源,它是半导体制造中不可或缺的核心设备,广泛应用于刻蚀、薄膜沉积、离子注入和清洗等关键工艺。其性能直接影响半导体制造的质量、效率和先进性。随着
杰西卡 发自 副驾寺智能车参考 | 公众号 AI4Auto每辆Robotaxi日均完成15单,这是小马智行给出的最新成绩。什么概念?拿小马智行“老家”广州市来说,去年上半年官方给出的数据是,广州市网约
大家好,我是小枣君。为了方便大家了解ICT行业全年的展会信息,我们和往年一样,对2025年的信息通信相关展会做了一个整理,希望对大家有所帮助。整理结果如下:(点击可看大图)部分重要的展会,因为时间还没
随着智能汽车向域集中式架构加速演进,车载GPU、AI加速芯片及异构计算单元的PCIe 4.0高速互联需求激增,光纤通信技术在汽车领域的应用潜能正在被挖掘。一方面,整车座舱娱乐系统、高阶智能驾驶、V2X
近日,特斯拉中国官网调整了辅助驾驶系统的命名,“Autopilot 自动辅助驾驶套件”改名为“辅助驾驶套件”,其中的“FSD 智能辅助驾驶”改名为了“智能辅助驾驶”。据新浪科技报道,针对特斯拉FSD驾
据外媒报道,小米汽车正积极拓展其在欧洲的业务,计划在欧洲建立一个新的研发中心,并已招聘多名来自宝马的高级管理人员。这些新员工包括在宝马集团有15年工作经验的Rudolf Dittrich,以及在宝马和
点击上方“IPC亚洲”关注我们!2025年3月26日,由IPC国际电子工业联接协会与上海市浦东新区质量技术协会联合主办的2025 IPC中国电子装联大师赛在上海浦东隆重开幕。大赛汇聚来自全国18个省市