国产GPU再进一步!

技术大院 2022-11-04 14:42
你关心的就是我们关注的

摩尔线程 2022 秋季发布会于 2022 年 11 月 3 日在北京中关村国家自主创新示范区成功举办。发布会上,摩尔线程推出全新多功能 GPU 芯片“春晓”、基于 MUSA 架构打造的业内首款国潮显卡 MTT S80 和面向服务器应用的 MTT S3000,以及元计算一体机 MCCX。这是时隔 7 个月后,摩尔线程多功能 GPU 产品迭代创新实现的又一次跨越。

发布多功能 GPU 芯片“春晓”,
AI 计算加速度比“苏堤”芯片提升 4 倍

此次发布会上,摩尔线程正式发布第二颗多功能 GPU 芯片“春晓”,集成 220 亿个晶体管,内置 MUSA 架构通用计算核心以及张量计算核心,可以支持 FP32、FP16 和 INT8 等计算精度。相较于之前发布的“苏堤”芯片,“春晓”内置的四大计算引擎全面升级,带来了显著的性能提升:图形渲染能力方面平均提升 3 倍;编码能力提升 4 倍,解码能力提升 2 倍;;AI 计算加速平均提升 4 倍,物理仿真计算性能提升 2.5 倍。同时,引入了新技术支持窄带高清,节约带宽 30% 以上。


全新发布的摩尔线程 MTT S80 基于“春晓”GPU 芯片打造,也是首款面向游戏玩家打造的国潮显卡。其拥有的 4096 个可编程 MUSA 核心,在 1.8GHz 的主频下,能够提供 14.4TFLOPS 的单精度浮点算力。同时 MTT S80 还是业内首款配备 PCIe Gen5 接口的显卡产品,配合 16GB GDDR6 大容量高速显存,再辅以 8K 超高清与 1080P 360Hz 高刷新率显示输出能力,能为游戏玩家带来极致游戏视觉和操作体验。

不只是硬件,摩尔线程还围绕 MUSA 发布了系列 GPU 软件栈与应用工具,包括 MUSA 开发者套件、云原生 sGPU 技术及元宇宙平台 MTVERSE 等,旨在构建从底层芯片到上层开发和应用的整体解决方案,实现摩尔线程多功能 GPU 软硬件一体化创新模式的全面升维。

其中,面向服务器的多功能 GPU 产品 MTT S3000 基于 MUSA 架构打造,能够支持 DirectX、OpenGL、OpenGL ES、Vulkan、OpenCL 等主流图形和计算接口,兼容 CUDA,可为 AI 推理和训练、云游戏、云渲染、视频云、数字孪生、数字内容创作等场景提供通用智能算力支持,旨在为数据中心、智算中心和元计算中心的建设构建坚实算力基础,助力元宇宙多元应用创新和落地。

算力升级,助力元计算加速

MTT S3000 搭载了摩尔线程全新的第二颗多功能 GPU 芯片“春晓”,包含了 4096 个 MUSA 流处理核心及 128 个专用张量计算核心,晶体管规模达到 220 亿,运行频率为 1.9GHz,显存位宽 256bit;搭配 32GB GDDR6 显存;支持 FP32、FP16、INT8 等多种计算精度,其中 FP32 算力可达 15.2TFLOPS。

MTT S3000 率先采用了 PCIe 5.0 接口,是目前 GPU 行业中首款支持 PCIe 5.0 标准的产品。PCIe 5.0 所提供的高带宽不仅能提升 GPU 与 CPU 的通讯效率,更能在“多卡”部署时提供更大的核间通讯带宽,提升 GPU 集群的整体运算效率和性能。

MTT S3000 内置 MUSA 智能多媒体引擎 2.0 和硬件虚拟化功能,能够从多个维度增强显卡的应用范围和用户的应用体验。同时,MTT S3000 还提供了两组 DP 1.4a 显示输出接口,由此增加的显示输出能力将进一步拓展 MTT S3000 的业务适应性。


训推一体,为 AI 计算铺平道路

从数据中心向智算中心和元计算中心演进是行业算力需求发展的主流趋势,人工智能和元宇宙应用负载对 GPU 算力的强烈需求是推动这一演进趋势的关键力量。专为提升智能算力而设计的摩尔线程 MTT S3000,在与之配套的 MUSA 软硬件计算平台的加持下,AI 应用性能相比 “苏堤”可实现平均 4 倍提升。

  • MTT S3000 及其配套软硬件产品,实现从算法模型到应用部署的全流程覆盖,能够为 AI 用户提供友好丰富的一揽子解决方案。在算法层面,摩尔线程不仅可以支持用户的自定义算法模型,同时也提供丰富的预训练模型库,赋能广大 AI 开发者,提升开发效率;在应用解决方案层面,摩尔线程可提供数字人、数字客服、内容生成等行业解决方案,服务金融保险、教育、医疗等相关的行业用户。
  • 在深度学习训练方面,MTT S3000 兼具易用性、扩展性和兼容性等多维优势。基于 MUSA 软件栈,MTT S3000 可实现现有算法的全面支持;能够支持包含单机单卡、单机多卡、多机多卡在内的多种训练模式。不仅如此,MTT S3000 还兼容 PyTorch、TensorFlow、百度飞桨(PaddlePaddle)、计图(Jittor)等多种主流深度学习框架,并实现了对 Transformer、CNN、RNN 等数十类 AI 模型的优化。
  • 在深度学习推理方面,MTT S3000 支持视觉、语音、自然语音理解及多模态等多个领域主流 AI 模型。摩尔线程还对 MUSA 软件栈持续进行深度性能优化,并推出自研 AI 推理引擎 TensorX,利用任务并发、自适应算法寻优、访存优化、算子优化等技术,大幅提升推理性能。MTT S3000 可满足生物医疗、金融保险等特别强调高精度推理的行业需求,并提供极致性能。
  • 同时,借助摩尔线程开发的 CUDA ON MUSA 兼容方案,用户可以将 CUDA 上开发的代码无缝迁移到 MTT S3000。
    MUSA 不只是架构,而是一个生态

GPU 是一项系统性工程,涉及硬件架构、驱动开发、软件生态、销售应用等,研发壁垒高,产业链长。当前的 GPU 生态,历经几十年的更迭,变得庞大且复杂。一颗 GPU 要完成从研发到市场的商业化应用,既离不开软硬件方面的持续投入,也离不开生态的有力支持。

今年 3 月,摩尔线程正式发布第一颗多功能 GPU 芯片“苏堤”,目前已获得众多市场和生态的认可。基于“苏堤”芯片,摩尔线程联合 OEM 合作伙伴成功推出了多款个人电脑、工作站和数据中心服务器产品,应用在日常办公、数字孪生、人工智能训练和推理等业务场景;同时,携手云服务厂商为不同行业用户提供 GPU 云计算能力,为摩尔线程 GPU 在众多行业的应用落地铺平了道路。

摩尔线程创始人兼 CEO 张建中在现场表达了对所有合作伙伴和用户的感谢,并进一步表示:“GPU 创业是一个长期事业,充满了挑战,我们深知生态的重要性。摩尔线程多功能 GPU 基于先进 MUSA 架构,持续构建完备的软件栈及应用生态,旨在为开放生态系统创造友好的支持和体验。我们只有与生态伙伴、行业用户凝聚在一起,才能将摩尔线程的算力真正发挥出来,为元宇宙和数字经济提供核心动力。”


-----END-----

看更多精彩内容

推荐阅读

汽车电子

  • 今年,一线投资团队在看什么?

  • 2022 汽车芯片行业研究报告

  • 自动驾驶的必经之路

  • 自动驾驶中视觉处理技术革命

  • 中国车规级芯片企业版图

  • 2022,新能源造车新格局理

「AI 」

  • AI 计算的下半场

  • 处理器的第三极

  • 畸形的深度学习,把自己逼进死胡同

  • 科学家纷纷回归学术界,AI拉开下半场大幕

「芯片」

  • 半导体行业大地震

  • 新时代下,论美帝国主义亡我之心

  • 2022 年中国大陆集成电路设计

  • AI 芯片创业进入决赛圈

  • 国产GPU创业潮:难言奇迹

  • AI大算力时代:存算一体迎来爆发时刻?

技术大院 传播知识、开阔视野.技术大杂院,睁眼看世界,有种,有趣,有料。
评论
  • 戴上XR眼镜去“追龙”是种什么体验?2024年11月30日,由上海自然博物馆(上海科技馆分馆)与三湘印象联合出品、三湘印象旗下观印象艺术发展有限公司(下简称“观印象”)承制的《又见恐龙》XR嘉年华在上海自然博物馆重磅开幕。该体验项目将于12月1日正式对公众开放,持续至2025年3月30日。双向奔赴,恐龙IP撞上元宇宙不久前,上海市经济和信息化委员会等部门联合印发了《上海市超高清视听产业发展行动方案》,特别提到“支持博物馆、主题乐园等场所推动超高清视听技术应用,丰富线下文旅消费体验”。作为上海自然
    电子与消费 2024-11-30 22:03 86浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 70浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 98浏览
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 51浏览
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 66浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 37浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 83浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 102浏览
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 41浏览
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 65浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦