国内算力：昇腾一马当先，各家竞相发展

智能计算芯世界 2024-04-06 08:20 1296浏览 0评论 0点赞

汽车照明系统的“智慧大脑”，竟然是它？》 玄铁处理器集智能、安全、端云一体芯片架构

昇腾已经在华为云和28 个城市的智能算力中心大规模部署，根据财联社报道，2022 年昇腾占据国内智算中心约 79%的市场份额。

本文来自“国产AI算力行业报告：浪潮汹涌，势不可挡（2024）”，相比于 GPT-3.5 是一个千亿参数模型，GPT-4 是拥有万亿规模参数，国内大模型厂商如果想追赶，需要各个维度要求都上一个台阶。

下载链接：

国产AI算力行业报告：浪潮汹涌，势不可挡（2024）

AI系列之HBM：AI硬件核心，需求爆发增长

2024中国“百模大战”竞争格局分析报告(2024）

2024年中国虚拟现实（VR）行业研究报告

AI算力研究：英伟达B200再创算力奇迹，液冷、光模块持续革新

英伟达官宣新一代Blackwell架构，华为算力GPU需求破百万片

《人工智能技术行业应用图谱合集》

1、中国电信业人工智能行业应用发展图谱(2024) 2、中国汽车业人工智能行业应用发展图谱（2024）

GPU深度报告：英伟达GB200 NVL72全互联技术，铜缆方案或将成为未来趋势？

机器人专题研究：产业发展概览（2024）

工业大模型应用报告v2.6（2024）

《海外垂直类AI报告专题（合集）》

复盘与展望：国产大模型的进击（2024）

英伟达发布新一代GPU架构，NVLink连接技术迭代升级

大模型语言模型：从理论到实践

技术展望2024：AI拐点，重塑人类潜力

网络大模型十大问题白皮书（2024）

大视研究：中国人工智能（AI）2024各行业应用研究报告

1. 昇腾计算产业链

华为主打 AI 芯片产品有 310 和 910B。310 偏推理，当前主打产品为 910B，拥有FP32 和 FP16 两种精度算力，可以满足大模型训练需求。910B 单卡和单台服务器性能对标 A800/A100。

昇腾计算产业是基于昇腾 AI 芯片和基础软件构建的全栈 AI 计算基础设施、行业应用及服务，能为客户提供 AI 全家桶服务。主要包括昇腾 AI 芯片、系列硬件、CANN、AI 计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链。

硬件系统：基于华为达芬奇内核的昇腾系列 AI 芯片; 基于昇腾 AI 芯片的系列硬件产品，比如嵌入式模组、板卡、小站、服务器、集群等。

软件系统：异构计算架构 CANN 以及对应的调试调优工具、开发工具链 MindStudio 和各种运维管理工具等。Al 计算框架包括开源的 MindSpore,以及各种业界流行的框架。昇思 MindSpore AI 计算架构位居 AI 框架第一梯队。昇腾应用使能 MindX，可以支持上层的 ModelArts 和 HiAl 等应用使能服务。

行业应用是面向千行百业的场景应用软件和服务，如互联网推荐、自然语言处理、语音识别、机器人等各种场景

华为云盘古大模型 3.0 基于鲲鹏和昇腾为基础的 AI 算力云平台，以及异构计算架构 CANN、全场景 AI 框架昇思 MindSpore，AI 开发生产线 ModelArts 等，为客户提供100 亿参数、380 亿参数、710 亿参数和 1000 亿参数的系列化基础大模型。

盘古大模型致力于深耕行业，打造金融、政务、制造、矿山、气象、铁路等领域行业大模型和能力集，将行业知识 know-how 与大模型能力相结合，重塑千行百业，成为各组织、企业、个人的专家助手。

1.1. 昇腾服务器

华为昇腾整机合作伙伴与鲲鹏整机合作伙伴几乎一致，产线共用，从华为直接获取AI 服务器或者芯片板卡制造成服务器。

1.2. 昇腾一体机

AI 训推一体机是指将大模型等软件和普通 AI 服务器整合在一起对外销售的整机。主要为 AI 能力自建能力较弱，想要借助 AI 软硬件一体化解决方案构建AI 能力的客户。主要为 ISV，从华为整机厂拿到昇腾整机，然后装上 AI 模型和相关软件直接销售给终端使用客户。

2. 海光信息

DCU 已经实现批量出货，迎来第二增长曲线。海光 DCU 以 GPGPU 架构为基础，兼容通用的“类 CUDA”环境，主要应用于计算密集型和人工智能领域。深算二号已经于 Q3 发布，实现了在大数据、人工智能、商业计算等领域的商用，深算二号具有全精度浮点数据和各种常见整型数据计算能力，性能相对于深算一号性能提升 100%。

海光 DCU 产品性能可达到国际上同类型主流高端处理器的水平。深算一号采用先进的 7nm FinFET 工艺，能够充分挖掘应用的并发性，发挥其大规模并行计算的能力，快速开发高能效的应用程序。选取公司深算一号和国际领先 GPU 生产商 NVIDIA 公司高端 GPU 产品（型号为 A100）及 AMD 公司高端 GPU 产品（型号为 MI100）进行对比，可以发现典型应用场景下深算一号的性能指标可达到国际同类型高端产品的同期水平。

生态兼容性好。海光 DCU 协处理器全面兼容 AMD 的 ROCm GPU 计算生态，由于 ROCm 和 CUDA 在生态、编程环境等方面具有高度的相似性，CUDA 用户可以以较低代价快速迁移至 ROCm 平台，因此 ROCm 也被称为“类 CUDA”。因此，海光DCU 协处理器能够较好地适配、适应国际主流商业计算软件和人工智能软件。

海光 DCU 相比海外性价比较高，总体在国内领先。从性能、生态综合来看，海光DCU 处于国内领先水平，是国产 AI 加速处理器中少数大量销售，且支持全部精度的产品。

3. 寒武纪

寒武纪成立于 2016 年，专注于人工智能芯片产品的研发与技术创新，致力于打造人工智能领域的核心处理器芯片。寒武纪主要产品线包括云端产品线、边缘产品线、IP授权及软件。

寒武纪思元（MLU）系列云端智能加速卡与百川智能旗下的大模型 Baichuan2-53B、Baichuan2-13B、Baichuan2-7B 等已完成全面适配，寒武纪思元（MLU）系列产品性能均达到国际主流产品的水平。

2024 年 1 月 22 日，寒武纪与智象未来 (HiDream.ai) 在北京签订战略合作协议。寒武纪思元（MLU）系列云端智能加速卡与智象未来自研的“智象多模态大模型”已完成适配，在产品性能和图像质量方面均达到了国际主流产品的水平。

4. 景嘉微

2024 年 3 月 12 日，公司面向 AI 训练、AI 推理、科学计算等应用领域的景宏系列高性能智算模块及整机产品“景宏系列”研发成功，并将尽快面向市场推广。

景宏系列是公司推出的面向 AI 训练、AI 推理、科学计算等应用领域的高性能智算模块及整机产品，支持 INT8、FP16、FP32、FP64 等混合精度运算，支持全新的多卡互联技术进行算力扩展，适配国内外主流 CPU、操作系统及服务器厂商，能够支持当前主流的计算生态、深度学习框架和算法模型库，大幅缩短用户适配验证周期。

下载链接：

服务器行业深度报告：AI和“东数西算”双轮驱动，服务器再起航

AI时代的3D内容生产工具

复盘与未来推演（AI应用）：追本溯源之后，我们相信什么？

深度研究：量子计算：人工智能与新质生产力的“未来引擎”

多模态，AI大模型新一轮革命

2024前沿人工智能安全的最佳实践

人工智能大模型工业应用准确性测评

2024 AI智算产业趋势展望分析报告

边缘智能：铺平人工智能的“最后一公里”

泛半导体产业黑灯工厂发展研究洞察白皮书

PCIe标准的演进和测试要求

《英伟达GTC 2024技术汇总》

1、英伟达GTC 2024主题演讲：见证AI的变革时刻 2、展望GTC变革，共享AI盛宴 3、英伟达GTC专题：新一代GPU、具身智能和AI应用

英伟达GTC专题：新一代GPU、具身智能和AI应用（精华）

2024年策略：AI鼎新，与时偕行

人工智能生成图像的危害分析与网络真实性保护（2024）

家庭大脑白皮书（2024）：大模型时代智慧家庭应用新范式

《半导体行业深度报告合集（2024）》

《人形机器人专题》

《70+篇半导体行业“研究框架”合集》

500+份重磅ChatGPT专业报告

《人工智能AI大模型技术合集》

《56份GPU技术及白皮书汇总》

本号资料全部上传至知识星球，更多内容请登录智能计算芯知识（知识星球）星球下载全部资料。

免责申明：本号聚焦相关技术分享，内容观点不代表本号立场，可追溯内容均注明来源，发布文章若存在版权等问题，请留言联系删除，谢谢。

温馨提示：

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享，点击“阅读原文”获取更多原创技术干货。

登录阅读全文



免责声明：该内容由专栏作者授权发布或作者转载，目的在于传递更多信息，并不代表本网赞同其观点，本站亦不保证或承诺内容真实性等。若内容或图片侵犯您的权益，请及时联系本站删除。侵权投诉联系： nick.zong@aspencore.com！

智能计算芯世界聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.

进入专栏

智能计算芯世界聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.

文章：1677篇粉丝：208人

关注  私信

国内算力：昇腾一马当先，各家竞相发展

最近文章

热门文章

推荐

最新资讯