海光CPU和GPGPU技术特点及市场分析

智能计算芯世界 2022-10-10 00:00


全球集成电路市场空间广阔。根据中商产业研究院披露的 WSTS 统计结果,2021 年全球集成电路市场规模达到 4630 亿美元,同比增长 28.18%,除了 2019年全球集成电路市场受到贸易摩擦的不利影响而规模有所下滑以外,其余年份均是上升状态,目前随着 5G 通信、物联网、云计算、人工智能等下游市场的行业景气度的提升,集成电路市场规模将持续提升,WSTS 预计 2022 年,市场规模可以达到 4990 亿美元,同比增长率达到 7.78%。

中国集成电路设计市场规模增长较快。2021 年是中国“十四五”开局之年,国内集成电路产业继续保持快速、平稳增长态势。中国半导体行业协会披露数据显示,2021 年中国集成电路产业首次突破万亿元,规模达到 10458.3 亿元,同比增长 18.20%;其中,设计业销售额为 4519 亿元,同比增长 19.60%,占比为 43.21%;制造业销售额为 3176.3 亿元,同比增长 24.1%,占比为 30.37%;封装测试业销售额 2763 亿元,同比增长 10.1%,占比为 26.42%。
海光成立以来一直采用Fabless 经营模式,将晶圆制造、晶圆封装测试等非核心环节交给其他代工厂加工完成,公司主要负责高端处理器的核心研发、设计、销售等流程,目前公司的产品包括海光通用处理器(CPU)和海光协处理器(DCU),CPU 兼容 x86 指令集,DCU 兼容“类 CUDA”(CUDA 是一种由 NVIDIA 公司推出的、使 GPU 能够解决复杂的计算问题的通用并行计算架构,包含了 CUDA 指令集架构以及 GPU内部的并行计算引擎,“类 CUDA”是指在生态、编程环境等方面与 CUDA 具有高度的相似性的生态环境)环境。

海光CPU产品主要分为海光 7000系列、海光 5000 系列和海光 3000 系列。7000 系列最多集成 32 个处理器核心,最大支持 8 个内存通道和 128 个 PCIe 接口,主要应用于高端服务器应用领域;5000 系列最多集成处理器核心数相较 7000 系列减半,最大支持内存通道数和PCIe 接口数相较 7000 系列也减半,主要面向中低端服务器需求;3000 系列最多集成处理器核心数相较 5000 系列减半,最大支持内存通道数和 PCIe 接口数相较 5000 系列也减半,主要面向入门级计算领域。

海光二号成为商用核心。目前,公司 CPU 产品中的海光一号和海光二号两代产品已经实现了量产和商业化应用,海光三号已经于 2022 年上半年发布,海光四号处于研发阶段,产品研发进展较为顺利。公司目前在售的海光 CPU 产品主要为海光 7200、海光 5200 和海光 3200 等海光二号系列产品。

x86 架构优势显著。按照采用的指令集,CPU 可以分为复杂指令集(CISC)和精简指令集(RISC)两大类。复杂指令集架构与精简指令集架构是基于两种不同的指令集思路进行设计,这两种架构有着各自不同的特点:复杂指令集指令丰富、寻址方式灵活,以微程序控制器为核心,指令长度可变,功能强大,复杂程序执行效率高;精简指令集指令结构简单、易于设计,具有较高的执行能效比。其中,x86 架构是复杂指令集的代表,而 ARM 架构、MIPS 架构和 Alpha架构等是精简指令集的代表。按照指令集的不同,其应用领域也有一定差异,x86 主要应用于服务器、工作站和个人计算机领域。

依托于 x86 架构,技术优势显著。海光 CPU 主要面向复杂逻辑计算、多任务调度等通用处理器应用场景需求,兼容国际主流 x86 处理器架构和技术路线,具有先进的工艺制程、优异的系统架构、丰富的软硬件生态等优势。此外,海光 CPU 支持国密算法,扩充了安全算法指令,集成了安全算法专用加速电路,支持可信计算,大幅度地提升了高端处理器的安全性,可以在数据处理过程中为用户提供更高效的安全保障。
CPU 产品规格结构复杂。海光 CPU 根据不同的产品规格定义,需要在一块基板上封装 1 至 4 颗裸片。裸片的内部结构非常复杂,主要功能模块包括处理器核心(Core)、片上网络、各类接口控制器等;除硬件电路外,裸片中还集成了复杂的程序代码(“微码系统”)。

AMD 技术支持提升公司 CPU 产品性能。公司通过与 AMD 的技术合作,掌握了 x86 处理器设计核心技术,成功进入到 x86 处理器设计领域,目前已经研制出符合市场需求、兼具优异性能的国产 x86 架构高端处理器产品。公司 CPU产品的具体优势体现在如下三个方面:
1.优异的产品性能。海光 CPU 使用先进的处理器微结构和缓存层次结构,改进了分支预测算法,使得每个时钟周期执行的指令数得到显著提高;依托先进的 SoC 架构和片上网络,海光 CPU 集成了更多处理器核心;采用先进的工艺制程和物理设计方法,实现了处理器高主频设计。
2.良好的系统兼容性。海光 CPU 可以兼容国内外主流操作系统、数据库、中间件等基础软件及广泛的行业应用软件。
3.较高的系统安全性。海光 CPU 通过扩充安全算法指令、集成安全算法专用加速电路等方式,有效提升了数据安全性和计算环境的安全性,原生支持可信计算。
海光 CPU 产品性能领先。指令集会对处理器的应用领域以及技术规格产生较大影响,技术规格包括核心数、超线程、主频、内存类型等。一般情况下,处理器核心数越多,其主频的提升就越困难;处理器 I/O 性能也是处理器的重要性能指标,内存通道数、主频等会对此指标产生一定影响。目前市场上除了海光 CPU 之外,国外主流的 CPU 厂商主要有 Intel、AMD;国内 CPU 厂商主要有海思、龙芯、兆芯、飞腾、申威,其中 Intel、AMD、海光和兆芯采用 x86 指令集,另外四家采用 ARM、LoongArch、SW_64 等指令集,进而产品技术规格之间存在一定差异。同 x86 指令集的产品之间,海光的 CPU 产品价格相对较低,具有价格优势。

GPGPU 技术优势显著。目前伴随 GPU 下游需求的复杂化,GPU 逐渐分化成两条分支,一条是传统意义的 GPU,延续专门用于图形图像处理用途,内置了视频编解码加速引擎、2D 加速引擎、3D 加速引擎、图像渲染等专用运算模块;另一分支是 GPGPU,作为运算协处理器,具有高效并行性、高密集运算、超长流水线等技术优势,并可以针对不同场景的需要,增加专用向量、张量、矩阵运算指令,提升浮点运算的精度和性能,整体提升 GPU 的技术性能。

海光 DCU 属于 GPGPU 的一种。海光 DCU 协处理器借助 GPGPU 架构,能够较好地适配国际主流软硬件系统,可以提供高性能、高能效比的算力,满足高复杂度和高吞吐量的数据处理任务的需求。海光 DCU 的主要功能模块包括计算单元(CU)、片上网络、高速缓存、各类接口控制器,其裸片组成架构较 CPU 简单,但是对计算单元的要求较高。

海光 DCU 具有算力大等技术优势。海光 DCU 具有强大的计算能力、高速并行数据处理能力和良好的软件生态环境等优势。
1.强大的计算能力。海光 DCU 基于大规模并行计算微结构进行设计,不但具备强大的双精度浮点计算能力,同时在单精度、半精度、整型计算方面表现同样优异,是一款计算性能强大、能效比较高的通用协处理器。
2.高速并行数据处理能力。海光 DCU 集成片上高带宽内存芯片,可以在大规模数据计算过程中提供优异的数据处理能力,使海光 DCU 可以适用于广泛的应用场景。
3.良好的软件生态环境。海光 DCU 采用 GPGPU 架构,兼容“类 CUDA”环境,解决了产品推广过程中的软件生态兼容性问题。公司通过参与开源软件项目,加快了公司产品的推广速度,并实现与 GPGPU 主流开发平台的兼容。
海光 DCU 主要产品为海光 8000 系列。目前海光 DCU产品主要为 8000 系列,其中深算一号(即 8100 系列)已经实现量产和商业化,海光 8100 采用先进的FinFET 工艺,具有大规模并行计算的能力,可以快速开发高能效的应用程序,典型应用场景下性能指标可以达到国际同类型高端产品的同期水平。

海光 DCU 产品研发迭代进展顺利。市场竞争格局稳定,海光 DCU 技术水平较高。运算协处理器存在多条技术路线,包括 GPGPU、ASIC、FPGA 等,其中 GPGPU 的代表企业包括 NVIDIA 和 AMD。选取公司深算一号和国际领先 GPU 生产商 NVIDIA 的 A100 以及 AMD 的 MI100 进行技术规格对比,可以发现在典型应用场景下,公司深算一号指标达到国际上同类型高端产品的水平,在技术水平接近的情况下,公司产品价格具有一定优势。

GPGPU 产品应用领域广泛,人工智能是较为重要的应用场景。商业计算和大数据处理领域是 GPGPU 的重要应用领域,具体包括 CAE 仿真、物理化学、石油勘探、生命科学、气象环境等具体方向。目前人工智能 90%以上市场份额使用 GPGPU 架构的协处理器,主要应用于智能工厂、无人驾驶、智慧城市等领域。

作为 GPGPU 的主要应用领域,大数据和商业计算对计算能力的需求增长较快,其市场规模也呈整体上升趋势。据公司招股说明书中引用 Cisco 统计数据显示,全球数据中心负载任务量将从 2016 年的241.50 万个增长到 2021 年的 566.70 万个;在整体规模增长的同时,云数据中心、超级数据中心的建设速度也不断加快,Cisco 预计到 2021 年,计算能力更强的超级数据中心将达到 628 座,2016-2021 年的 CAGR 将达到 13.19%。
GPU 和新架构的 AI 芯片促进了人工智能的落地。亿欧智库认为,人工智能与芯片的发展分为三个阶段:第一阶段由于芯片算力不足,神经网络算法未能落地;第二阶段芯片算力提升,但仍无法满足神经网络算法需求;第三阶段,GPU 和新架构的 AI 芯片促进了人工智能的落地。
下载链接:
国产高端处理器,实现CPU+DCU齐赋能
海光:国产处理器产业领军者
主流CPU处理器合集
如何看待ARM架构芯片在服务器端发展前景

服务器系列报告合集

基于IPU的云基础设施:数字业务的支点

中国移动DPU技术白皮书(2022)

国产高端处理器,实现CPU+DCU齐赋能

海光:国产处理器产业领军者

HarmonyOS 2 安全技术白皮书

2022中国智造观察报告

人工智能治理与可持续发展实践白皮书(2022)

通信行业算力革命:泛在、绿色与生态(2022)

算网一体网络架构及技术体系展望白皮书(2022)

可信密态计算白皮书(2022)

全球开源生态研究报告(2022年)

首届中国Graph100图计算性能榜单
AIPerf:大规模人工智能算力基准测试程序
高性能计算:行业发展趋势分析
1、被忽视的国之重器:高性能计算那些事儿 
2、高性能计算:不断取得新进展,国产替代未来可期
芯片半导体技术
存储半导体行业分析汇总
面向非易失内存的MPI-IO接口优化
国产FPGA研究框架

ASIC技术专题分析

《深入介绍FPGA》

《FPGA入门教程》

《异构计算芯片(ASIC/FPGA等)技术合集(1)》

《异构计算芯片(ASIC/FPGA等)技术合集(2)》

《CXL技术合集(2022)(1)》

《CXL技术合集(2022)(2)》 


本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。



免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



电子书<服务器基础知识全解(终极版)>更新完毕。

获取方式:点击“阅读原文”即可查看182页 PPT可编辑版本和PDF阅读版本详情。



温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。


智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论 (0)
  • 贞光科技代理品牌紫光国芯的车规级LPDDR4内存正成为智能驾驶舱的核心选择。在汽车电子国产化浪潮中,其产品以宽温域稳定工作能力、优异电磁兼容性和超长使用寿命赢得市场认可。紫光国芯不仅确保供应链安全可控,还提供专业本地技术支持。面向未来,紫光国芯正研发LPDDR5车规级产品,将以更高带宽、更低功耗支持汽车智能化发展。随着智能网联汽车的迅猛发展,智能驾驶舱作为人机交互的核心载体,对处理器和存储器的性能与可靠性提出了更高要求。在汽车电子国产化浪潮中,贞光科技代理品牌紫光国芯的车规级LPDDR4内存凭借
    贞光科技 2025-04-28 16:52 341浏览
  • 文/Leon编辑/cc孙聪颖‍2023年,厨电行业在相对平稳的市场环境中迎来温和复苏,看似为行业增长积蓄势能。带着对市场向好的预期,2024 年初,老板电器副董事长兼总经理任富佳为企业定下双位数增长目标。然而现实与预期相悖,过去一年,这家老牌厨电企业不仅未能达成业绩目标,曾提出的“三年再造一个老板电器”愿景,也因市场下行压力面临落空风险。作为“企二代”管理者,任富佳在掌舵企业穿越市场周期的过程中,正面临着前所未有的挑战。4月29日,老板电器(002508.SZ)发布了2024年年度报告及2025
    华尔街科技眼 2025-04-30 12:40 316浏览
  • 一、gao效冷却与控温机制‌1、‌冷媒流动设计‌采用低压液氮(或液氦)通过毛细管路导入蒸发器,蒸汽喷射至样品腔实现快速冷却,冷却效率高(室温至80K约20分钟,至4.2K约30分钟)。通过控温仪动态调节蒸发器加热功率,结合温度传感器(如PT100铂电阻或Cernox磁场不敏感传感器),实现±0.01K的高精度温度稳定性。2、‌宽温区覆盖与扩展性‌标准温区为80K-325K,通过降压选件可将下限延伸至65K(液氮模式)或4K(液氦模式)。可选配475K高温模块,满足材料在ji端温度下的性能测试需求
    锦正茂科技 2025-04-30 13:08 458浏览
  • 随着电子元器件的快速发展,导致各种常见的贴片电阻元器件也越来越小,给我们分辨也就变得越来越难,下面就由smt贴片加工厂_安徽英特丽就来告诉大家如何分辨的SMT贴片元器件。先来看看贴片电感和贴片电容的区分:(1)看颜色(黑色)——一般黑色都是贴片电感。贴片电容只有勇于精密设备中的贴片钽电容才是黑色的,其他普通贴片电容基本都不是黑色的。(2)看型号标码——贴片电感以L开头,贴片电容以C开头。从外形是圆形初步判断应为电感,测量两端电阻为零点几欧,则为电感。(3)检测——贴片电感一般阻值小,更没有“充放
    贴片加工小安 2025-04-29 14:59 345浏览
  • 在全球制造业加速向数字化、智能化转型的浪潮中,健达智能作为固态照明市场的引领者和智能电子以及声学产品的创新先锋,健达智能敏锐捕捉到行业发展的新机遇与新挑战,传统制造模式已难以满足客户对品质追溯、定制化生产和全球化布局的需求。在此背景下, 健达智能科技股份有限公司(以下简称:健达智能)与盘古信息达成合作,正式启动IMS数字化智能制造工厂项目,标志着健达智能数字化转型升级迈入新阶段。此次项目旨在通过部署盘古信息IMS系统,助力健达实现生产全流程的智能化管控,打造照明行业数字化标杆。行业趋势与企业挑战
    盘古信息IMS 2025-04-30 10:13 56浏览
  • ‌一、高斯计的正确选择‌1、‌明确测量需求‌‌磁场类型‌:区分直流或交流磁场,选择对应仪器(如交流高斯计需支持交变磁场测量)。‌量程范围‌:根据被测磁场强度选择覆盖范围,例如地球磁场(0.3–0.5 G)或工业磁体(数百至数千高斯)。‌精度与分辨率‌:高精度场景(如科研)需选择误差低于1%的仪器,分辨率需匹配微小磁场变化检测需求。2、‌仪器类型选择‌‌手持式‌:便携性强,适合现场快速检测;‌台式‌:精度更高,适用于实验室或工业环境。‌探头类型‌:‌横向/轴向探头‌:根据磁场方向选择,轴向探头适合
    锦正茂科技 2025-05-06 11:36 128浏览
  • 在智能硬件设备趋向微型化的背景下,语音芯片方案厂商针对小体积设备开发了多款超小型语音芯片方案,其中WTV系列和WT2003H系列凭借其QFN封装设计、高性能与高集成度,成为微型设备语音方案的理想选择。以下从封装特性、功能优势及典型应用场景三个方面进行详细介绍。一、超小体积封装:QFN技术的核心优势WTV系列与WT2003H系列均提供QFN封装(如QFN32,尺寸为4×4mm),这种封装形式具有以下特点:体积紧凑:QFN封装通过减少引脚间距和优化内部结构,显著缩小芯片体积,适用于智能门铃、穿戴设备
    广州唯创电子 2025-04-30 09:02 341浏览
  • 文/郭楚妤编辑/cc孙聪颖‍越来越多的企业开始蚕食动力电池市场,行业“去宁王化”态势逐渐明显。随着这种趋势的加强,打开新的市场对于宁德时代而言至关重要。“我们不希望被定义为电池的制造者,而是希望把自己称作新能源产业的开拓者。”4月21日,在宁德时代举行的“超级科技日”发布会上,宁德时代掌门人曾毓群如是说。随着宁德时代核心新品骁遥双核电池的发布,其搭载的“电电增程”技术也走进业界视野。除此之外,经过近3年试水,宁德时代在换电业务上重资加码。曾毓群认为换电是一个重资产、高投入、长周期的产业,涉及的利
    华尔街科技眼 2025-04-28 21:55 213浏览
  •  一、‌核心降温原理‌1、‌液氮媒介作用‌液氮恒温器以液氮(沸点约77K/-196℃)为降温媒介,通过液氮蒸发吸收热量的特性实现快速降温。液氮在内部腔体蒸发时形成气-液界面,利用毛细管路将冷媒导入蒸发器,强化热交换效率。2、‌稳态气泡控温‌采用‌稳态气泡原理‌:调节锥形气塞与冷指间隙,控制气-液界面成核沸腾条件,使漏热稳定在设定值。通过控温仪调整加热功率,补偿漏热并维持温度平衡,实现80K-600K范围的快速变温。二、‌温度控制机制‌1、‌动态平衡调节‌控温仪内置模糊控制系统,通过温度
    锦正茂科技 2025-04-30 11:31 52浏览
  • 你是不是也有在公共场合被偷看手机或笔电的经验呢?科技时代下,不少现代人的各式机密数据都在手机、平板或是笔电等可携式的3C产品上处理,若是经常性地需要在公共场合使用,不管是工作上的机密文件,或是重要的个人信息等,民众都有防窃防盗意识,为了避免他人窥探内容,都会选择使用「防窥保护贴片」,以防止数据外泄。现今市面上「防窥保护贴」、「防窥片」、「屏幕防窥膜」等产品就是这种目的下产物 (以下简称防窥片)!防窥片功能与常见问题解析首先,防窥片最主要的功能就是用来防止他人窥视屏幕上的隐私信息,它是利用百叶窗的
    百佳泰测试实验室 2025-04-30 13:28 560浏览
  • 多功能电锅长什么样子,主视图如下图所示。侧视图如下图所示。型号JZ-18A,额定功率600W,额定电压220V,产自潮州市潮安区彩塘镇精致电子配件厂,铭牌如下图所示。有两颗螺丝固定底盖,找到合适的工具,拆开底盖如下图所示。可见和大部分市场的加热锅一样的工作原理,手绘原理图,根据原理图进一步理解和分析。F1为保险,250V/10A,185℃,CPGXLD 250V10A TF185℃ RY 是一款温度保险丝,额定电压是250V,额定电流是10A,动作温度是185℃。CPGXLD是温度保险丝电器元件
    liweicheng 2025-05-05 18:36 119浏览
  • 浪潮之上:智能时代的觉醒    近日参加了一场课题的答辩,这是医疗人工智能揭榜挂帅的国家项目的地区考场,参与者众多,围绕着医疗健康的主题,八仙过海各显神通,百花齐放。   中国大地正在发生着激动人心的场景:深圳前海深港人工智能算力中心高速运转的液冷服务器,武汉马路上自动驾驶出租车穿行的智慧道路,机器人参与北京的马拉松竞赛。从中央到地方,人工智能相关政策和消息如雨后春笋般不断出台,数字中国的建设图景正在智能浪潮中徐徐展开,战略布局如同围棋
    广州铁金刚 2025-04-30 15:24 300浏览
  • 想不到短短几年时间,华为就从“技术封锁”的持久战中突围,成功将“被卡脖子”困境扭转为科技主权的主动争夺战。众所周知,前几年技术霸权国家突然对华为发难,导致芯片供应链被强行掐断,海外市场阵地接连失守,恶意舆论如汹涌潮水,让其瞬间陷入了前所未有的困境。而最近财报显示,华为已经渡过危险期,甚至开始反击。2024年财报数据显示,华为实现全球销售收入8621亿元人民币,净利润626亿元人民币;经营活动现金流为884.17亿元,同比增长26.7%。对比来看,2024年营收同比增长22.42%,2023年为7
    用户1742991715177 2025-05-02 18:40 104浏览
  • 网约车,真的“饱和”了?近日,网约车市场的 “饱和” 话题再度引发热议。多地陆续发布网约车风险预警,提醒从业者谨慎入局,这背后究竟隐藏着怎样的市场现状呢?从数据来看,网约车市场的“过剩”现象已愈发明显。以东莞为例,截至2024年12月底,全市网约车数量超过5.77万辆,考取网约车驾驶员证的人数更是超过13.48万人。随着司机数量的不断攀升,订单量却未能同步增长,导致单车日均接单量和营收双双下降。2024年下半年,东莞网约出租车单车日均订单量约10.5单,而单车日均营收也不容乐
    用户1742991715177 2025-04-29 18:28 305浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦