海光CPU和GPGPU技术特点及市场分析

智能计算芯世界 2022-10-10 00:00 7271浏览 0评论 0点赞

汽车照明的秘密武器，竟然是…… 3D IC设计卡在哪儿？5场研讨会揭秘3DIC全攻略

全球集成电路市场空间广阔。根据中商产业研究院披露的 WSTS 统计结果，2021 年全球集成电路市场规模达到 4630 亿美元，同比增长 28.18%，除了 2019年全球集成电路市场受到贸易摩擦的不利影响而规模有所下滑以外，其余年份均是上升状态，目前随着 5G 通信、物联网、云计算、人工智能等下游市场的行业景气度的提升，集成电路市场规模将持续提升，WSTS 预计 2022 年，市场规模可以达到 4990 亿美元，同比增长率达到 7.78%。

中国集成电路设计市场规模增长较快。2021 年是中国“十四五”开局之年，国内集成电路产业继续保持快速、平稳增长态势。中国半导体行业协会披露数据显示，2021 年中国集成电路产业首次突破万亿元，规模达到 10458.3 亿元，同比增长 18.20%；其中，设计业销售额为 4519 亿元，同比增长 19.60%，占比为 43.21%；制造业销售额为 3176.3 亿元，同比增长 24.1%，占比为 30.37%；封装测试业销售额 2763 亿元，同比增长 10.1%，占比为 26.42%。

海光成立以来一直采用Fabless 经营模式，将晶圆制造、晶圆封装测试等非核心环节交给其他代工厂加工完成，公司主要负责高端处理器的核心研发、设计、销售等流程，目前公司的产品包括海光通用处理器（CPU）和海光协处理器（DCU），CPU 兼容 x86 指令集，DCU 兼容“类 CUDA”（CUDA 是一种由 NVIDIA 公司推出的、使 GPU 能够解决复杂的计算问题的通用并行计算架构，包含了 CUDA 指令集架构以及 GPU内部的并行计算引擎，“类 CUDA”是指在生态、编程环境等方面与 CUDA 具有高度的相似性的生态环境）环境。

海光CPU产品主要分为海光 7000系列、海光 5000 系列和海光 3000 系列。7000 系列最多集成 32 个处理器核心，最大支持 8 个内存通道和 128 个 PCIe 接口，主要应用于高端服务器应用领域；5000 系列最多集成处理器核心数相较 7000 系列减半，最大支持内存通道数和PCIe 接口数相较 7000 系列也减半，主要面向中低端服务器需求；3000 系列最多集成处理器核心数相较 5000 系列减半，最大支持内存通道数和 PCIe 接口数相较 5000 系列也减半，主要面向入门级计算领域。

海光二号成为商用核心。目前，公司 CPU 产品中的海光一号和海光二号两代产品已经实现了量产和商业化应用，海光三号已经于 2022 年上半年发布，海光四号处于研发阶段，产品研发进展较为顺利。公司目前在售的海光 CPU 产品主要为海光 7200、海光 5200 和海光 3200 等海光二号系列产品。

x86 架构优势显著。按照采用的指令集，CPU 可以分为复杂指令集（CISC）和精简指令集（RISC）两大类。复杂指令集架构与精简指令集架构是基于两种不同的指令集思路进行设计，这两种架构有着各自不同的特点：复杂指令集指令丰富、寻址方式灵活，以微程序控制器为核心，指令长度可变，功能强大，复杂程序执行效率高；精简指令集指令结构简单、易于设计，具有较高的执行能效比。其中，x86 架构是复杂指令集的代表，而 ARM 架构、MIPS 架构和 Alpha架构等是精简指令集的代表。按照指令集的不同，其应用领域也有一定差异，x86 主要应用于服务器、工作站和个人计算机领域。

依托于 x86 架构，技术优势显著。海光 CPU 主要面向复杂逻辑计算、多任务调度等通用处理器应用场景需求，兼容国际主流 x86 处理器架构和技术路线，具有先进的工艺制程、优异的系统架构、丰富的软硬件生态等优势。此外，海光 CPU 支持国密算法，扩充了安全算法指令，集成了安全算法专用加速电路，支持可信计算，大幅度地提升了高端处理器的安全性，可以在数据处理过程中为用户提供更高效的安全保障。

CPU 产品规格结构复杂。海光 CPU 根据不同的产品规格定义，需要在一块基板上封装 1 至 4 颗裸片。裸片的内部结构非常复杂，主要功能模块包括处理器核心（Core）、片上网络、各类接口控制器等；除硬件电路外，裸片中还集成了复杂的程序代码（“微码系统”）。

AMD 技术支持提升公司 CPU 产品性能。公司通过与 AMD 的技术合作，掌握了 x86 处理器设计核心技术，成功进入到 x86 处理器设计领域，目前已经研制出符合市场需求、兼具优异性能的国产 x86 架构高端处理器产品。公司 CPU产品的具体优势体现在如下三个方面：

1.优异的产品性能。海光 CPU 使用先进的处理器微结构和缓存层次结构，改进了分支预测算法，使得每个时钟周期执行的指令数得到显著提高；依托先进的 SoC 架构和片上网络，海光 CPU 集成了更多处理器核心；采用先进的工艺制程和物理设计方法，实现了处理器高主频设计。

2.良好的系统兼容性。海光 CPU 可以兼容国内外主流操作系统、数据库、中间件等基础软件及广泛的行业应用软件。

3.较高的系统安全性。海光 CPU 通过扩充安全算法指令、集成安全算法专用加速电路等方式，有效提升了数据安全性和计算环境的安全性，原生支持可信计算。

海光 CPU 产品性能领先。指令集会对处理器的应用领域以及技术规格产生较大影响，技术规格包括核心数、超线程、主频、内存类型等。一般情况下，处理器核心数越多，其主频的提升就越困难；处理器 I/O 性能也是处理器的重要性能指标，内存通道数、主频等会对此指标产生一定影响。目前市场上除了海光 CPU 之外，国外主流的 CPU 厂商主要有 Intel、AMD；国内 CPU 厂商主要有海思、龙芯、兆芯、飞腾、申威，其中 Intel、AMD、海光和兆芯采用 x86 指令集，另外四家采用 ARM、LoongArch、SW_64 等指令集，进而产品技术规格之间存在一定差异。同 x86 指令集的产品之间，海光的 CPU 产品价格相对较低，具有价格优势。

GPGPU 技术优势显著。目前伴随 GPU 下游需求的复杂化，GPU 逐渐分化成两条分支，一条是传统意义的 GPU，延续专门用于图形图像处理用途，内置了视频编解码加速引擎、2D 加速引擎、3D 加速引擎、图像渲染等专用运算模块；另一分支是 GPGPU，作为运算协处理器，具有高效并行性、高密集运算、超长流水线等技术优势，并可以针对不同场景的需要，增加专用向量、张量、矩阵运算指令，提升浮点运算的精度和性能，整体提升 GPU 的技术性能。

海光 DCU 属于 GPGPU 的一种。海光 DCU 协处理器借助 GPGPU 架构，能够较好地适配国际主流软硬件系统，可以提供高性能、高能效比的算力，满足高复杂度和高吞吐量的数据处理任务的需求。海光 DCU 的主要功能模块包括计算单元（CU）、片上网络、高速缓存、各类接口控制器，其裸片组成架构较 CPU 简单，但是对计算单元的要求较高。

海光 DCU 具有算力大等技术优势。海光 DCU 具有强大的计算能力、高速并行数据处理能力和良好的软件生态环境等优势。

1.强大的计算能力。海光 DCU 基于大规模并行计算微结构进行设计，不但具备强大的双精度浮点计算能力，同时在单精度、半精度、整型计算方面表现同样优异，是一款计算性能强大、能效比较高的通用协处理器。

2.高速并行数据处理能力。海光 DCU 集成片上高带宽内存芯片，可以在大规模数据计算过程中提供优异的数据处理能力，使海光 DCU 可以适用于广泛的应用场景。

3.良好的软件生态环境。海光 DCU 采用 GPGPU 架构，兼容“类 CUDA”环境，解决了产品推广过程中的软件生态兼容性问题。公司通过参与开源软件项目，加快了公司产品的推广速度，并实现与 GPGPU 主流开发平台的兼容。

海光 DCU 主要产品为海光 8000 系列。目前海光 DCU产品主要为 8000 系列，其中深算一号（即 8100 系列）已经实现量产和商业化，海光 8100 采用先进的FinFET 工艺，具有大规模并行计算的能力，可以快速开发高能效的应用程序，典型应用场景下性能指标可以达到国际同类型高端产品的同期水平。

海光 DCU 产品研发迭代进展顺利。市场竞争格局稳定，海光 DCU 技术水平较高。运算协处理器存在多条技术路线，包括 GPGPU、ASIC、FPGA 等，其中 GPGPU 的代表企业包括 NVIDIA 和 AMD。选取公司深算一号和国际领先 GPU 生产商 NVIDIA 的 A100 以及 AMD 的 MI100 进行技术规格对比，可以发现在典型应用场景下，公司深算一号指标达到国际上同类型高端产品的水平，在技术水平接近的情况下，公司产品价格具有一定优势。

GPGPU 产品应用领域广泛，人工智能是较为重要的应用场景。商业计算和大数据处理领域是 GPGPU 的重要应用领域，具体包括 CAE 仿真、物理化学、石油勘探、生命科学、气象环境等具体方向。目前人工智能 90%以上市场份额使用 GPGPU 架构的协处理器，主要应用于智能工厂、无人驾驶、智慧城市等领域。

作为 GPGPU 的主要应用领域，大数据和商业计算对计算能力的需求增长较快，其市场规模也呈整体上升趋势。据公司招股说明书中引用 Cisco 统计数据显示，全球数据中心负载任务量将从 2016 年的241.50 万个增长到 2021 年的 566.70 万个；在整体规模增长的同时，云数据中心、超级数据中心的建设速度也不断加快，Cisco 预计到 2021 年，计算能力更强的超级数据中心将达到 628 座，2016-2021 年的 CAGR 将达到 13.19%。

GPU 和新架构的 AI 芯片促进了人工智能的落地。亿欧智库认为，人工智能与芯片的发展分为三个阶段：第一阶段由于芯片算力不足，神经网络算法未能落地；第二阶段芯片算力提升，但仍无法满足神经网络算法需求；第三阶段，GPU 和新架构的 AI 芯片促进了人工智能的落地。

下载链接：

国产高端处理器，实现CPU+DCU齐赋能

海光：国产处理器产业领军者

主流CPU处理器合集

如何看待ARM架构芯片在服务器端发展前景

服务器系列报告合集

基于IPU的云基础设施：数字业务的支点

中国移动DPU技术白皮书（2022）

国产高端处理器，实现CPU+DCU齐赋能

海光：国产处理器产业领军者

HarmonyOS 2 安全技术白皮书

2022中国智造观察报告

人工智能治理与可持续发展实践白皮书（2022）

通信行业算力革命：泛在、绿色与生态（2022）

算网一体网络架构及技术体系展望白皮书(2022)

可信密态计算白皮书（2022）

全球开源生态研究报告（2022年）

首届中国Graph100图计算性能榜单

AIPerf：大规模人工智能算力基准测试程序

高性能计算：行业发展趋势分析

1、被忽视的国之重器：高性能计算那些事儿

2、高性能计算：不断取得新进展，国产替代未来可期

芯片半导体技术

存储半导体行业分析汇总

面向非易失内存的MPI-IO接口优化

国产FPGA研究框架

ASIC技术专题分析

《深入介绍FPGA》

《FPGA入门教程》

《异构计算芯片（ASIC/FPGA等）技术合集（1）》

《异构计算芯片（ASIC/FPGA等）技术合集（2）》

《CXL技术合集（2022）（1）》

《CXL技术合集（2022）（2）》

本号资料全部上传至知识星球，更多内容请登录智能计算芯知识（知识星球）星球下载全部资料。

免责申明：本号聚焦相关技术分享，内容观点不代表本号立场，可追溯内容均注明来源，发布文章若存在版权等问题，请留言联系删除，谢谢。

电子书<服务器基础知识全解(终极版)>更新完毕。

获取方式：点击“阅读原文”即可查看182页 PPT可编辑版本和PDF阅读版本详情。

温馨提示：

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享，点击“阅读原文”获取更多原创技术干货。

登录阅读全文



免责声明：该内容由专栏作者授权发布或作者转载，目的在于传递更多信息，并不代表本网赞同其观点，本站亦不保证或承诺内容真实性等。若内容或图片侵犯您的权益，请及时联系本站删除。侵权投诉联系： nick.zong@aspencore.com！

智能计算芯世界聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.

进入专栏

智能计算芯世界聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.

文章：1683篇粉丝：209人

关注  私信

海光CPU和GPGPU技术特点及市场分析

最近文章

热门文章

推荐

最新资讯