海光CPU和GPGPU技术特点及市场分析

智能计算芯世界 2022-10-10 00:00


全球集成电路市场空间广阔。根据中商产业研究院披露的 WSTS 统计结果,2021 年全球集成电路市场规模达到 4630 亿美元,同比增长 28.18%,除了 2019年全球集成电路市场受到贸易摩擦的不利影响而规模有所下滑以外,其余年份均是上升状态,目前随着 5G 通信、物联网、云计算、人工智能等下游市场的行业景气度的提升,集成电路市场规模将持续提升,WSTS 预计 2022 年,市场规模可以达到 4990 亿美元,同比增长率达到 7.78%。

中国集成电路设计市场规模增长较快。2021 年是中国“十四五”开局之年,国内集成电路产业继续保持快速、平稳增长态势。中国半导体行业协会披露数据显示,2021 年中国集成电路产业首次突破万亿元,规模达到 10458.3 亿元,同比增长 18.20%;其中,设计业销售额为 4519 亿元,同比增长 19.60%,占比为 43.21%;制造业销售额为 3176.3 亿元,同比增长 24.1%,占比为 30.37%;封装测试业销售额 2763 亿元,同比增长 10.1%,占比为 26.42%。
海光成立以来一直采用Fabless 经营模式,将晶圆制造、晶圆封装测试等非核心环节交给其他代工厂加工完成,公司主要负责高端处理器的核心研发、设计、销售等流程,目前公司的产品包括海光通用处理器(CPU)和海光协处理器(DCU),CPU 兼容 x86 指令集,DCU 兼容“类 CUDA”(CUDA 是一种由 NVIDIA 公司推出的、使 GPU 能够解决复杂的计算问题的通用并行计算架构,包含了 CUDA 指令集架构以及 GPU内部的并行计算引擎,“类 CUDA”是指在生态、编程环境等方面与 CUDA 具有高度的相似性的生态环境)环境。

海光CPU产品主要分为海光 7000系列、海光 5000 系列和海光 3000 系列。7000 系列最多集成 32 个处理器核心,最大支持 8 个内存通道和 128 个 PCIe 接口,主要应用于高端服务器应用领域;5000 系列最多集成处理器核心数相较 7000 系列减半,最大支持内存通道数和PCIe 接口数相较 7000 系列也减半,主要面向中低端服务器需求;3000 系列最多集成处理器核心数相较 5000 系列减半,最大支持内存通道数和 PCIe 接口数相较 5000 系列也减半,主要面向入门级计算领域。

海光二号成为商用核心。目前,公司 CPU 产品中的海光一号和海光二号两代产品已经实现了量产和商业化应用,海光三号已经于 2022 年上半年发布,海光四号处于研发阶段,产品研发进展较为顺利。公司目前在售的海光 CPU 产品主要为海光 7200、海光 5200 和海光 3200 等海光二号系列产品。

x86 架构优势显著。按照采用的指令集,CPU 可以分为复杂指令集(CISC)和精简指令集(RISC)两大类。复杂指令集架构与精简指令集架构是基于两种不同的指令集思路进行设计,这两种架构有着各自不同的特点:复杂指令集指令丰富、寻址方式灵活,以微程序控制器为核心,指令长度可变,功能强大,复杂程序执行效率高;精简指令集指令结构简单、易于设计,具有较高的执行能效比。其中,x86 架构是复杂指令集的代表,而 ARM 架构、MIPS 架构和 Alpha架构等是精简指令集的代表。按照指令集的不同,其应用领域也有一定差异,x86 主要应用于服务器、工作站和个人计算机领域。

依托于 x86 架构,技术优势显著。海光 CPU 主要面向复杂逻辑计算、多任务调度等通用处理器应用场景需求,兼容国际主流 x86 处理器架构和技术路线,具有先进的工艺制程、优异的系统架构、丰富的软硬件生态等优势。此外,海光 CPU 支持国密算法,扩充了安全算法指令,集成了安全算法专用加速电路,支持可信计算,大幅度地提升了高端处理器的安全性,可以在数据处理过程中为用户提供更高效的安全保障。
CPU 产品规格结构复杂。海光 CPU 根据不同的产品规格定义,需要在一块基板上封装 1 至 4 颗裸片。裸片的内部结构非常复杂,主要功能模块包括处理器核心(Core)、片上网络、各类接口控制器等;除硬件电路外,裸片中还集成了复杂的程序代码(“微码系统”)。

AMD 技术支持提升公司 CPU 产品性能。公司通过与 AMD 的技术合作,掌握了 x86 处理器设计核心技术,成功进入到 x86 处理器设计领域,目前已经研制出符合市场需求、兼具优异性能的国产 x86 架构高端处理器产品。公司 CPU产品的具体优势体现在如下三个方面:
1.优异的产品性能。海光 CPU 使用先进的处理器微结构和缓存层次结构,改进了分支预测算法,使得每个时钟周期执行的指令数得到显著提高;依托先进的 SoC 架构和片上网络,海光 CPU 集成了更多处理器核心;采用先进的工艺制程和物理设计方法,实现了处理器高主频设计。
2.良好的系统兼容性。海光 CPU 可以兼容国内外主流操作系统、数据库、中间件等基础软件及广泛的行业应用软件。
3.较高的系统安全性。海光 CPU 通过扩充安全算法指令、集成安全算法专用加速电路等方式,有效提升了数据安全性和计算环境的安全性,原生支持可信计算。
海光 CPU 产品性能领先。指令集会对处理器的应用领域以及技术规格产生较大影响,技术规格包括核心数、超线程、主频、内存类型等。一般情况下,处理器核心数越多,其主频的提升就越困难;处理器 I/O 性能也是处理器的重要性能指标,内存通道数、主频等会对此指标产生一定影响。目前市场上除了海光 CPU 之外,国外主流的 CPU 厂商主要有 Intel、AMD;国内 CPU 厂商主要有海思、龙芯、兆芯、飞腾、申威,其中 Intel、AMD、海光和兆芯采用 x86 指令集,另外四家采用 ARM、LoongArch、SW_64 等指令集,进而产品技术规格之间存在一定差异。同 x86 指令集的产品之间,海光的 CPU 产品价格相对较低,具有价格优势。

GPGPU 技术优势显著。目前伴随 GPU 下游需求的复杂化,GPU 逐渐分化成两条分支,一条是传统意义的 GPU,延续专门用于图形图像处理用途,内置了视频编解码加速引擎、2D 加速引擎、3D 加速引擎、图像渲染等专用运算模块;另一分支是 GPGPU,作为运算协处理器,具有高效并行性、高密集运算、超长流水线等技术优势,并可以针对不同场景的需要,增加专用向量、张量、矩阵运算指令,提升浮点运算的精度和性能,整体提升 GPU 的技术性能。

海光 DCU 属于 GPGPU 的一种。海光 DCU 协处理器借助 GPGPU 架构,能够较好地适配国际主流软硬件系统,可以提供高性能、高能效比的算力,满足高复杂度和高吞吐量的数据处理任务的需求。海光 DCU 的主要功能模块包括计算单元(CU)、片上网络、高速缓存、各类接口控制器,其裸片组成架构较 CPU 简单,但是对计算单元的要求较高。

海光 DCU 具有算力大等技术优势。海光 DCU 具有强大的计算能力、高速并行数据处理能力和良好的软件生态环境等优势。
1.强大的计算能力。海光 DCU 基于大规模并行计算微结构进行设计,不但具备强大的双精度浮点计算能力,同时在单精度、半精度、整型计算方面表现同样优异,是一款计算性能强大、能效比较高的通用协处理器。
2.高速并行数据处理能力。海光 DCU 集成片上高带宽内存芯片,可以在大规模数据计算过程中提供优异的数据处理能力,使海光 DCU 可以适用于广泛的应用场景。
3.良好的软件生态环境。海光 DCU 采用 GPGPU 架构,兼容“类 CUDA”环境,解决了产品推广过程中的软件生态兼容性问题。公司通过参与开源软件项目,加快了公司产品的推广速度,并实现与 GPGPU 主流开发平台的兼容。
海光 DCU 主要产品为海光 8000 系列。目前海光 DCU产品主要为 8000 系列,其中深算一号(即 8100 系列)已经实现量产和商业化,海光 8100 采用先进的FinFET 工艺,具有大规模并行计算的能力,可以快速开发高能效的应用程序,典型应用场景下性能指标可以达到国际同类型高端产品的同期水平。

海光 DCU 产品研发迭代进展顺利。市场竞争格局稳定,海光 DCU 技术水平较高。运算协处理器存在多条技术路线,包括 GPGPU、ASIC、FPGA 等,其中 GPGPU 的代表企业包括 NVIDIA 和 AMD。选取公司深算一号和国际领先 GPU 生产商 NVIDIA 的 A100 以及 AMD 的 MI100 进行技术规格对比,可以发现在典型应用场景下,公司深算一号指标达到国际上同类型高端产品的水平,在技术水平接近的情况下,公司产品价格具有一定优势。

GPGPU 产品应用领域广泛,人工智能是较为重要的应用场景。商业计算和大数据处理领域是 GPGPU 的重要应用领域,具体包括 CAE 仿真、物理化学、石油勘探、生命科学、气象环境等具体方向。目前人工智能 90%以上市场份额使用 GPGPU 架构的协处理器,主要应用于智能工厂、无人驾驶、智慧城市等领域。

作为 GPGPU 的主要应用领域,大数据和商业计算对计算能力的需求增长较快,其市场规模也呈整体上升趋势。据公司招股说明书中引用 Cisco 统计数据显示,全球数据中心负载任务量将从 2016 年的241.50 万个增长到 2021 年的 566.70 万个;在整体规模增长的同时,云数据中心、超级数据中心的建设速度也不断加快,Cisco 预计到 2021 年,计算能力更强的超级数据中心将达到 628 座,2016-2021 年的 CAGR 将达到 13.19%。
GPU 和新架构的 AI 芯片促进了人工智能的落地。亿欧智库认为,人工智能与芯片的发展分为三个阶段:第一阶段由于芯片算力不足,神经网络算法未能落地;第二阶段芯片算力提升,但仍无法满足神经网络算法需求;第三阶段,GPU 和新架构的 AI 芯片促进了人工智能的落地。
下载链接:
国产高端处理器,实现CPU+DCU齐赋能
海光:国产处理器产业领军者
主流CPU处理器合集
如何看待ARM架构芯片在服务器端发展前景

服务器系列报告合集

基于IPU的云基础设施:数字业务的支点

中国移动DPU技术白皮书(2022)

国产高端处理器,实现CPU+DCU齐赋能

海光:国产处理器产业领军者

HarmonyOS 2 安全技术白皮书

2022中国智造观察报告

人工智能治理与可持续发展实践白皮书(2022)

通信行业算力革命:泛在、绿色与生态(2022)

算网一体网络架构及技术体系展望白皮书(2022)

可信密态计算白皮书(2022)

全球开源生态研究报告(2022年)

首届中国Graph100图计算性能榜单
AIPerf:大规模人工智能算力基准测试程序
高性能计算:行业发展趋势分析
1、被忽视的国之重器:高性能计算那些事儿 
2、高性能计算:不断取得新进展,国产替代未来可期
芯片半导体技术
存储半导体行业分析汇总
面向非易失内存的MPI-IO接口优化
国产FPGA研究框架

ASIC技术专题分析

《深入介绍FPGA》

《FPGA入门教程》

《异构计算芯片(ASIC/FPGA等)技术合集(1)》

《异构计算芯片(ASIC/FPGA等)技术合集(2)》

《CXL技术合集(2022)(1)》

《CXL技术合集(2022)(2)》 


本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。



免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



电子书<服务器基础知识全解(终极版)>更新完毕。

获取方式:点击“阅读原文”即可查看182页 PPT可编辑版本和PDF阅读版本详情。



温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。


智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 122浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 158浏览
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 92浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 58浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 116浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 141浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 70浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 61浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 164浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 202浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 223浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 106浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦