广告

阿里达摩院AI大模型M6再创世界纪录:512颗GPU、10万亿模型

2021-11-08 23:47:26 阅读:
阿里巴巴达摩院传来又一个新攻破,多模态大模型M66创下一个世界纪录,其参数已从万亿跃迁至10万亿,规模远超谷歌、微软此前发布的万亿级模型,成为全球最大的AI预训练模型。
广告

阿里巴巴达摩院传来又一个新攻破,多模态大模型M66创下一个世界纪录,其参数已从万亿跃迁至10万亿,规模远超谷歌、微软此前发布的万亿级模型,成为全球最大的AI预训练模型。

作为通用性AI大模型,M6拥有多模态、多任务能力,尤其擅长设计、写作、问答,在电商、制造业、文学艺术、科学研究等领域有广泛应用前景。

与传统AI相比,大模型拥有成百上千倍“神经元”数量,认知和创造能力也更胜一筹,被普遍认为是未来的“基础模型”。

但是,大模型的算力成本相当高昂,比如训练1750亿参数语言大模型GPT-3所需能耗,能让一辆汽车在地月之间往返一趟。

今年5月,通过专家并行策略及优化技术,达摩院M6团队将万亿模型能耗降低超过80%,效率提升近11倍。

10月,M6再次突破业界极限,使用512颗GPU,在10天内就训练出了具有可用水平的10万亿模型,相比去年发布的大模型GPT-3,M6实现了同等参数规模,能耗却只有1%。

另一方面,AI大模型扩展到千亿及以上参数的超大规模时,很难放在一台机器上,为此达摩院在阿里云PAI自研Whale框架上搭建了MoE模型,并通过更细粒度的CPU offload技术,最终实现将10万亿参数放进512张GPU:

自研Whale框架:

自研Whale分布式深度学习训练框架,针对数据并行、模型并行、流水并行、混合并行等多种并行模型进行了统一架构设计,让用户在仅仅添加几行API调用的情况下就可以实现丰富的分布式并行策略。

MoE专家并行策略:

在Whale架构中实现Mixture-of-Experts(MoE)专家并行策略,在扩展模型容量、提升模型效果的基础上,不显著增加运算FLOPs(每秒所执行的浮点运算次数),从而实现高效训练大规模模型的目的。

CPU offload创新技术:

在自研的分布式框架Whale中通过更细粒度的CPU offload,解决了有限资源放下极限规模的难题,并通过灵活地选择offload的模型层,进一步地提高GPU利用率。

此外,针对训练效率问题,M6团队设计了Pseudo-to-Real(共享解除)机制,即利用训练好的共享参数模型初始化大模型,让收敛效率进一步提升7倍,解决大模型训练速度慢的问题。

对比不使用该机制,预训练达到同样loss用时仅需6%;和此前万亿模型相比,训练样本量仅需40%。

作为国内首个商业化落地的多模态大模型,M6已在超40个场景中应用,日调用量上亿。

今年,大模型首次支持双11,应用包括但不限于:

- M6在犀牛智造为品牌设计的服饰已在淘宝上线;

- 凭借流畅的写作能力,M6正为天猫虚拟主播创作剧本;

- 依靠多模态理解能力,M6正在增进淘宝、支付宝等平台的搜索及内容认知精度。

未来,M6将积极探索与科学应用的结合,通过AI for science让大模型的潜力充分发挥,并加强M6与国产芯片的软硬一体化研究。

目前,达摩院联合阿里云已推出M6服务化平台,为大模型训练及应用提供完备工具,首次让大模型实现“开箱即用”,算法人员及普通用户均可方便地使用平台。

责编:editorAlice

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
  • 数据:预计年内中国5G手机出货量达1.4亿台,智能手机均价中国涨幅最 在全球调研机构Counterpoint Research发布的最新报告中, 除了拉美,北美、欧洲、中国、中东和非洲等主要市场的智能手机销售均价,在二季度均有所上扬。仅从这份报告来看,中国市场的手机涨幅最高,达到了13%;同时,中国成为5G手机的最大贡献者,7月份有79%的手机出货量来自于中国市场,创下历史新高。
  • 小米为什么决定造车?雷军谈进军智能电动汽车“弯道超车”优势 小米此次造车是想完成自己的生态链体系,有可能这100亿美元,是投资一家车企业,作为自己米家生态圈的一家公司,帮助小米生产汽车。小米也成为了国产手机厂商第一个宣布造车的企业,属于年轻人的第一辆车终于要来了吗?
  • CPU新榜王:AMD锐龙R5-5600X跑分秒杀英特尔酷睿i5-10600K和i7-107 锐龙5600X性能如此优秀吗?发售定价5600x都比10700散片贵,后期根据市场行情肯定会有所调整,现在的10700K的散片价格,肯定也不是英特尔发售日的定价呀。而且AMD的3600对标9600,3700x对标9700k,10600和5600在各自产品定位上是同一个档次的CPU,放在一起比较是必然的,价格都会有调整的。
  • 三星Galaxy A42 5G新机完整规格曝光,搭载骁龙750G SoC 三星官方已经详细介绍了完整的Galaxy A42规格。三星Galaxy A42采用6.6英寸HD+Super AMOLED Infinity-U显示屏,拥有窄边框。虽然该公司还没有透露处理器型号,但根据核心配置和时钟速度,可以猜出是骁龙750G SoC,因为这与Geekbench的列表一致。
  • 2021年全球最具创新技术公司排行榜(TOP25名单)-华为第1名 作为最具创意的排名指标,华为以 9739 项专利连续两年包揽专利申请数量第1,成为全球最大的科技创新者之一,华为的专利主要集中在 VR、AR、5G、物联网和边缘计算等领域。而三星则申请了9499 项,排第3至第5位的分别为京东方、高通和LG电子,至于Apple以2925项申请排十一位,落后于3038项申请的Microsoft一位,Google则排二十二位。
  • 长安华为宁德时代三方合造AB高端品牌汽车5月发布 ab汽车是什么意思?有多少人了解到底是一个什么品牌汽车?长安、华为以及宁德时代联手打造的高端品牌,将在5月揭开神秘面纱。
  • 北汽极狐ARCFOX新车配置华为三激光雷达装车方案 ,识别300度视角 华为作为高科技行业的引领者,确实有很多已颠覆了大众的认知! 以华为的综合实力来说,一旦发力,国内其他激光雷达厂商根本没有生存的空间,谈何领先者更领先?华为现在入局一点都不早,毕竟技术上需要时间积累 !
  • 小米11官宣发布时间已定,比小米10续航进步、价格要贵? 最近网上到处都是小米11的消息。米粉们也比较关注新手机产品。有媒体报道称,小米11将是全球首款Snapdragon 888。雷军在微博上说:小米11,高端旗舰的突破,12月28日发布。 有多少想象力,就有多少超乎想象的神奇, 2011,相信美,轻装上阵!
  • 芯片短缺,苹果公司预警:iPhone、iPad和Mac需求影响Q3业绩 苹果公司刚刚公布了2021年第二季度创纪录的收益,苹果公司方面也给出预警说,供应短缺影响了Mac和iPad产品线。在苹果公司的财报电话会议上,首席执行官蒂姆-库克向分析师解释说,苹果公司在第二季度没有看到供应紧张,但第三季度将发生变化;苹果首席财务官 Luca Maestri 证实芯片短缺的影响。
  • UTG盖板优势取代CPI,折叠屏升级形成差异化竞争 虽然折叠屏手机进展已经比较成熟,在综合重量,厚度,成本,以及APP适配之后,整体还需要一段时间发展,才能让更多普通消费者选择,那么折叠屏会是未来手机工艺技术升级的最终发展形态吗?
  • Omdia :2024年生成式AI软件市场将增长124% 许多拥有大型语言模型(LLM)的供应商的收入运行率表明,2024 年的收入增长将达到三位数……
  • IDC首测8款最热门移动端大模型,3款获好评 本次报告的测评涵盖了市面上最热门的八个Chatbot App:kimi智能助手、豆包、海螺AI、天工、通义、文心一言、讯飞星火以及智谱清言(按照公司拼音首字母顺序排列)。
  • Imagination GPU为边缘智能提供高效率的加速 在“2024奕斯伟计算开发者伙伴大会”上,来自Imagination英国总部的专家发表了主题为《用RISC-V CPU + PowerVR GPU迎接边缘生成式AI的到来》的演讲。
  • 面向AI的下一代以太网技术 随着AI应用的广泛普及和数据流量的迅猛增长,传统以太网技术在延迟、带宽、拥塞控制和高性能可扩展方面天然局限,导致其难以应对AI网络的复杂需求。
  • 智能手机疲软,但超薄柔性玻璃出货量势头正猛 可折叠盖板玻璃必须符合以下所有标准:透明、可折叠、坚固、平整和轻薄,这些基本要素缺一不可。
  • 全球折叠屏手机快速增长,中国品牌压制三星 • 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
  • AI网络物理层底座: 大算力芯片先进封装技术 AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
  • 智能手表OLED面板超 60%中国制造 智能手表在新冠肺炎疫情后获得了越发广泛的关注,其功能包括语音、健康检查、运动和活动追踪、GPS、通信和个人数据监控。全球智能手表显示面板的出货量已从2022年的2.59亿片增长到2023年的3.51亿片。到 2024年,Omdia预测智能手表显示面板的出货量将达到3.59亿片,其中TFT LCD占63%,OLED占37%。
  • 无处不在的Arm软硬件生态赋能开发者AI创新 随着计算变得愈发复杂,计算效率的重要性更胜以往。
  • 荣耀拿下欧洲横折手机榜第一 既然可以保留几乎相同的旧款手机,或者以更低的价格购买旧款手机,为什么要购买最新款的智能手机呢?但变化已经到来,智能手机品牌厂商正带着其最前沿的创新技术重返欧洲市场……
广告
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了