广告

寒武纪云端AI芯片思元370详解:实测性能比主流GPU优越、支持LPDDR5内存

2021-11-04 09:36:05 阅读:
独角兽寒武纪在AI造芯路上已经成功实现了技术产业化输出与应用,在云端AI加速卡先推出思元100和思元270芯片系列,11月3日最新消息,寒武纪正式发布第三代云端AI芯片思元370。
广告

独角兽寒武纪在AI造芯路上已经成功实现了技术产业化输出与应用,在云端AI加速卡先推出思元100和思元270芯片系列,11月3日最新消息,寒武纪正式发布第三代云端AI芯片思元370。

据介绍,思元370基于7nm工艺打造,也是寒武纪首款采用chiplet(芯粒)技术的AI芯片。思元370集成了390亿个晶体管,最大算力高达256TOPS(INT8),是寒武纪第二代产品思元270算力的2倍。

同时,寒武纪全新升级了CambriconNeuware软件栈,新增推理加速引擎MagicMind,实现训推一体,显著提升了开发部署的效率,降低用户的学习成本、开发成本和运营成本。

广告

新一代智能处理器架构MLUarch03

官方表示,凭借寒武纪最新智能芯片架构MLUarch03,相较于峰值算力的提升,思元370实测性能表现更为优秀。寒武纪智能处理器架构MLUarch03,拥有新一代张量运算单元,内置Supercharger模块大幅提升各类卷积效率;采用全新的多算子硬件融合技术,在软件融合的基础上大幅减少算子执行时间;片上通讯带宽是上一代MLUarch02的2倍、片上共享缓存容量最高是MLUarch02的2.75倍;推出全新MLUv03指令集,更完备,更高效且向前兼容。

 

 

▲ Supercharger和多算子硬件融合技术

思元 370 实测性能和实测能效超市场主流 GPU 产品

* 测试环境:

MLU370-S4:NF5468M6/2x Intel Xeon Gold 6330 CPU @ 2.0GHz/MagicMind v0.6

MLU370-X4:NF5468M6/2x Intel Xeon Gold 6330 CPU @ 2.0GHz/MagicMind v0.6

GPU 数据:ResNet-50 来自于相关产品官网,Transformer、VGG16、YOLOv3 均取自实测最大吞吐性能。

两款基于思元370的加速卡正式亮相:高密度、半高半长、功耗75W的MLU370-S4智能加速卡和高性能、全高全长、功耗150W的MLU370-X4智能加速卡。与上一代产品相比,370系列加速卡在性能、能效方面都有更为卓越的表现。例如,对标准ResNet-50v1进行软件定制优化后,MLU370-X4加速卡性能高达30204fps,MLU370-S4加速卡(半高半长)实测性能为同尺寸主流GPU的2倍。LU370-X4加速卡(全高全长)实测性能与同尺寸主流GPU相当,能效则大幅领先。

值得一提的是,思元370也是国内第一颗支持LPDDR5内存的云端AI芯片,内存带宽是上一代产品的3倍,访存能效达GDDR6的1.5倍。

思元 370 视频编码质量显著提升

 *测试环境:

  MLU270-S4:SYS-4029GP-TRT/2x Intel(R) Xeon(R) Gold 6140 CPU @ 2.30GHz

  MLU370-S4:NF5280M5/2x Intel Xeon Gold 5218R CPU @ 2.1GHz

  视频内容:BQTerrace_1920x1080_60.yuv

解码方面,思元370升级了视频图像编解码单元,可提供更高效的视频处理能力和更优的编码质量,支持更复杂、更繁重、低延时要求的计算机视觉任务。思元370支持132路1080p视频解码或10路8K视频解码。

编码上,全新编码器通过灵活的码率优化(RDO)控制、多参考帧、二次编码等特性组合,在相同图像质量(全高清视频PSNR)的情况下比上一代产品节省42%带宽,有效降低带宽成本。

责编:editorAlice

  • 中国成为最大腕戴设备市场,引领全球增长 腕戴设备市场包含智能手表和手环产品。其中,智能手表市场在2024年前三季度全球出货量1.1亿台,同比下降3.8%;而中国智能手表市场出货量3,286万台,同比增长……
  • 截止2030年,全球蜂窝物联网连接收入将超过 260 亿美元 • 2023 年,全球蜂窝物联网连接数激增 24%,超过 33 亿,到 2030 年将突破 62 亿。 • 尽管中国在 2023 年以 23 亿的连接数规模占据全球蜂窝物联网连接总数的 70%,但其在全球连接收入中的份额仅为 36%。 • 到 2030 年,联网汽车、智能表计和智能零售这三大应用预计将合计占蜂窝物联网应用总市场份额的 60% 以上。 • 到 2030 年,5G 连接将在全球范围内超过 NB-IoT 连接,占物联网连接总收入的近 50%。
  • 为什么翻新机的价格在上涨? • 目前,iPhone在翻新市场中是最热门的商品,并将长期主导着翻新机的平均销售价格。 • 全球翻新机市场持续向高端化发展,其平均销售价格(ASP)现已超过新手机。 • 新兴市场是增长的最大驱动力,消费者对高端旗舰产品有着迫切需求。 • 由于市场固化和供应链的一些问题限制推高中国、东南亚和非洲等大市场的价格。 • 2024年,这些翻新机平均销售价格将首次超过新手机。
  • 2024三季度全球扫地机器人市场出货增长持续,卷势不减 从全球厂商竞争来看,三季度凭借多个新品发布,石头科技市场份额提升至16.4%,连续两季度排名全球第一……
  • AMOLED行业核心模具,精密金属掩膜版国产技术攻克核心瓶颈 AMOLED行业的关键模具FMM及Invar在市场中属于极其细分而品质又要求极高的赛道,传统企业打法在这两个产品上都难以适用。唯有对上下游有深度了解,并能够将产业链技术链条打通,才能够将近似于黑箱中的FMM及其原材料Invar长期受限的困局打破。
  • IDC:2024前三季度中国安全硬件市场规模同比下降2.9% IDC定义下的网络安全硬件市场分别由统一威胁管理 (UTM)、基于UTM平台的防火墙 (UTM Firewall) 、安全内容管理(SCM)、入侵检测与防御 (IDP)、虚拟专用网(VPN)和传统防火墙 (Traditional Firewall) 构成。
  • 预计1Q25 NAND Flash价格将出现超10%下滑 2025年第一季NAND Flash供货商将面临库存持续上升,订单需求下降等挑战,平均合约价恐季减10%至15%。
  • 山东大学团队在高精度存算芯片领域取得新进展 本研究通过设计闪存存算一体架构,有效提升了计算效率和精度,为解决复杂计算任务提供了重要技术支撑。
  • 加速资源整合将是本田与日产合并后的首要任务 日本两大全球汽车集团本田与日产于2024年12月23日宣布启动合并谈判,目标在2025年6月达成协议,三菱汽车也有望加入。若三家车厂顺利合并,当务之急将是整合各自的资源以节省开支,利用规模化生产降低成本,以及加快电动车相关计划......
  • 2024过去了,细数中国工业经济这一年 这一年的成绩单足够亮眼,但来之不易。
广告
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了