HyperionResearch:数据密集型HPC产业趋势

智能计算芯世界 2022-03-27 00:00



本文内容参考自“Hyperion Research:数据密集型HPC产业趋势(中文版)”,白皮书重点分析了HPC新兴市场空间、数据密集型场景、技术趋势和HPC存储保持持续增长的原因。


下载链接:

Hyperion Research:数据密集型HPC产业趋势(中文版)

Lustre Admin培训材料合集(上)

Lustre Admin培训材料合集(下)

CCF HPC China 2021 论文集电子版

高性能计算前沿问题研究合集

2021 Intel HPC China论坛资料
2021 HPC China大会资料(上)
2021 HPC China大会资料(下)


近年来,市场增长受到新的因素推动,尤其是将 HPC 资源应用于领先的人工智能(AI)和其他高性能数据分析(HPDA)任务,包括这些资源不断被转移到企业数据中心以支持实时业务运营带来的数据分析需求。虽然 HPC 整体市场预计在未来五年(2019-2024 年)将以 6.8%的复合年增长率(CAGR)增长,但HPDA 的市场份额(包括支持 HPC 的人工智能)预计将以 5 年平均 17%的 CAGR 迅猛增长,而 AI 份额的 5 年 CAGR 则达到更高的 33%。


从传统 HPC 建模/仿真应用向新的 HPDA/AI/ML/DL 应用演进的主要特点是从计算密集型负载向数据密集型负载转变。这一转变凸显了存储架构在为研究人员、工程师和业务数据分析师提供最佳性能的 HPC 基础设施中发挥出的关键作用,帮助其最快获得研究和分析结果。从市场角度来看,存储约占整个 HPC 市场的 20%,预计到 2024 年本地 HPC 的存储收入为 80 亿美元


Hyperion Research 发现,随着数据密集型应用和负载的不断普及,对 HPC 生态系统的需求也不断地发生变化。HPDA/AI 的快速发展同样也推动着传统 HPC 建模/仿真应用的不断转型。HPDA/AI/ML/DL 技术产生越来越多的数据,给现有的 HPC 存储生态系统带来巨大压力,要解决和优化这两种类型的负载就需要高度关注HPC 存储基础设施。


市场整体趋势 

传统的 HPC 建模和仿真环境不断扩大并推动市场发展,更多的企业和政府用户正在寻求更快的周转时间,同时增加问题规模、建模保真度和迭代次数。为了满足最严苛的计算要求,高级计算愈加盛行,并且大多数新兴 AI 用例都受益于分析和仿真运行。表 1 总结了对本地自建广义 HPC 的整体市场预测,需要注意的是,存储是广义 HPC 市场中增长最快的领域,约占本地 HPC 市场支出的 20%。



在 HPC 市场中,HPDA/AI 细分市场的增长明显大于整个 HPC 市场的增长。具体而言,在 HPC 生态系统的存储领域中,HPDA 存储的复合年增长率为通用 HPC 市场的 2 倍,而 AI 存储的复合年增长率几乎为通用HPC 市场的 4 倍。表 2 总结了各个细分市场的预测增长。



注意 HPDA 存储收入是本地自建 HPC 存储收入的子集,基于 HPC 的 AI 存储收入是 HPDA 存储收入的子集。图 1 显示了 HPC、HPDA 和 AI(机器学习(ML)、深度学习(DL)及其他)等细分场景之间的关系,包括 2024 年相对 HPC 存储市场的分配预测。



影响整个 HPC 市场增长的因素有很多,其中有些因素对数据密集型 HPC 领域的影响尤其深远。HPDA/AI基础设施的应用与日俱增,与之相关的特别值得注意的项目包括:

  • 全球E级竞赛将推动多台价值6亿美元及以上的 E 级超级计算机发展,其中包括预期内的一台(日本理研的 Fugaku 系统)价值超过10亿美元的超级计算机和几台价值超过1亿美元的近E级超级计算机。全球E级竞赛正在为最高端的技术市场注入资金,并为传统建模/仿真和新HPPDA/AI/ML/DL 负载的 HPC 基础设施带来许多利益。
  • 来自传统 HPC应用的更高精度建模和仿真正在产生越来越多待分析和存储的数据。因此,用于存储升级和采购的支出带来了总体支出的增长。 
  • 机器学习和深度学习中,新硬件、算法、应用和场景的推出将继续激发人们对 HPC 的兴趣,它 们可以为最为严苛的训练、推理和决策支持任务提供快速强大的性能。
  • 有充分证据表明,HPC 与企业市场在不断融合,竞争正驱动越来越多的商业组织将其复杂的业务规划和运营要求与其数据和相关数据分析基础相结合,并将更多的业务运营推向实时/近实时环境。此外,为了共同解决传统建模和仿真中的数据密集型 AI/ML/DL 负载以及不断增长的其他大数据分析作业的问题,HPC 和企业计算也在进行融合。 
  • 数据密集型 HPC 负载将继续推动新的存储需求,未来的架构将支持同步和空间分布式计算和存储广泛存在于整个 HPC 基础设施中。同样,对于解决如图形分析这类对非模式内存访问有要求的关键负载,物理分布、全局共享的内存技术将变得更加重要。最后,对日益复杂的存储/内存层次的有效管理需要包含嵌入式智能来有效管理数据流,以确保可随时随地使用资源。

HPC 负载使用云资源的情况也在增加。大多数用户将云计算视为对传统 HPC 采购的补充,而不是替代。混合设置通常支持容器开发,这些容器帮助用户负载在本地自建和 HPC 云平台之间编排计算、网络和存储基础设施。企业 HPC 负载也正在向本地自建的私有云扩展。新一代 HPC 架构越来越类似云, HPC 工作流跨越多个容器,每个容器都动态配备适当的硬件和软件资源。最近,Hyperion Research 研究预测,到 2024 年,用户在云中运行 HPC 负载的支出将达到 88 亿美元,其中大约三分之一(29 亿美元)的支出用于云存储。注意,此项支出完全是指用户将在 HPC 云资源上的支出,不包括云服务提供商(CSP)在支持 HPC 云服务的基础设施上花费的支出。


对数据密集型HPC存储要求的展望:定义和挑战

HPDA 泛指利用 HPC 资源的数据密集型负载,包括大数据和 AI 负载。HPDA 问题的特点是数据量大、时效性强以及算法复杂,这对于工资单、电子邮件和一般会计等传统企业业务负载来说影响并不明显。AI 负 载是 HPDA 问题的一个重要子集,增长迅速,HPDA 问题寻求从数据本身而不是主要从仿真物理模型中提取价值。为了进一步阐明和定义 AI 负载,适用以下定义:


  • AI:广泛的通用术语,表示计算机能够做人类想做的事情(但无法以人类思考的方式思考)。AI 包括机器学习、深度学习和其他方法论。

  • ML:使用示例来训练计算机识别特定模式的过程,例如蓝睛模式或表示欺诈的数字模式。计算机无法学习超过其训练范围的东西,在识别过程中需要人工监督。计算机遵循给定的基本规则。ML 是 AI 的一个子集。

  • DL:一种先进的机器学习形式,它使用数字神经网络使计算机能够不受其训练内容限制并自行学习,无需额外的显式编程或人工监督。计算机自己制定规则。DL 是 ML 的子集。


某些垂直领域的应用比其他应用更倾向于采用和利用 HPDA(包括支持 HPC 的 AI 技术)。表 3 总结了这些垂直领域以及每个领域中的特定应用。



此外,AI 工作流通常包括三个阶段:收集、训练和推理。在收集阶段,数据被加载到模型中,通常是加载到大型矩阵中,数据集越大,模型就越准确。加载数据后,通过执行多次计算和比较(矩阵运算),根据参考数据集和预定标准进行数据分配和权重评估来开展训练。执行矩阵运算通常需要大量并行计算能力。训练完成后,可以执行推理(应用预定规则来确定新信息和结果)。


数据密集型HPC的挑战 

HPDA 和 AI 负载一直在推动 HPC 系统需求突破传统 HPC 系统架构负载的需求,跨越 HPC 系统架构的所有要素。尤其是对存储的需求已经让传统 HPC 存储解决方案达到性能极限,亟需进行多方面创新。


用于传统建模和仿真的传统 HPC 存储通常包括项目文件共享、Scratch 和归档的负载,AI 工作流程则带来一组不同的负载:数据收集和注入、数据准备、训练、推理和归档。有的拥有像传统 HPC 负载那样的存储属性,而有的则推动了新的或更严苛和极端的要求。


HPC 和 AI 负载通常表现出不同的 I/O 模型。传统的 HPC 负载通常基于顺序大 I/O 型,而 AI 负载需要顺序大和随机小 I/O 型的混合,用于 AI 数据集标记的元数据管理需要快速的随机小 I/O 型。应用场景还催生了各种耐用性和弹性解决方案需求。归档需要极具高性价比的解决方案,没有苛刻的性能要求。传统的临时应用需要高性能,能够将临时结果转移到持久存储以防止出现故障。AI 和 HPDA 解决方案需要混合存储需求满足高性能、瞬态存储和持久弹性存储的要求,包括大块顺序和小块随机 I/O模型的平衡混合。


最后,数据类型和访问方法推动了对不同类型存储系统的需求发展。结构化和非结构化数据采用不同的访问方式,如文件、块和对象协议。每种访问方式都需要独特的协议支持,通常,这些协议由多个独立的专用系统或一个系统内的不同单元提供,数据通常需要保存多个副本。表 4总结了负载、场景、I/O 模型和数据类型之间的关系。



数据密集型HPC存储方案的机遇 

与生活的方方面面一样,挑战往往伴随着巨大的机遇,HDPA/AI 负载的存储也不例外。通过适当关注每个 HPDA/AI 负载和场景提出的要求,存储系统架构师和供应商可以围绕整个 HPC 系统的性能和易用性优化来开展创新。针对 HPDA 负载和数据湖解决方案中经常出现的非结构化数据,我们可以在如下方面进行创新:


  • 支持不同 I/O 模型。提供具有单一文件系统的单一存储架构,可以同时支持大块顺序访问(TB/s)和小块随机访问(IOPS)的应用性能需求,将消除独立系统的费用并简化存储管理员所需的管理和支持。

  • 支持多协议访问。AI 工作流的不同阶段通常需要使用不同的协议为数据提供服务。可以使用 S3收集对象数据,而训练是通过 NFS 文件访问实现的,在整个 HPDA/AI 工作流中使用的其他协议还包括 MPI-IO、SMB 和 HDFS。与以前需要多份数据副本场景不同,单个系统支持多个接入协议和一份数据能够服务于多个应用,可以节省多系统和额外容量的费用。

  • 支持各种数据访问频率。热数据需要最高的带宽和 IOPS 以支持频繁且及时的访问,而冷数据的访问频率相对低,对性能的要求也不高。SSD 盘和 HDD 盘具备按需扩展容量和新技术的能力,可 以满足热冷数据分级的需求。一个能够随时随地提供合适类型数据的经济高效存储平台是广受HPC 社区欢迎的。 

  • 高密度高效设计。HPC 存储解决方案可保留大量数据,这些数据存储占地面积大,通常需要多 个设备机架以及关联功率和散热。使用合适的材料促进散热并注意可维护性,也将有助于提供经济高效的解决方案,从而优化 TCO。


未来展望 

在 HPDA等新用例推动下,以及随着传统企业 IT 数据中心不断采用 HPC 基础设施来支持基于HPC 的AI应用,HPC市场继续保持高速增长,其中存储领域的增长率最快。


存储供应商要想在数据密集型 HPC 市场取得成功,他们需要充分了解并满足 HPDA 负载对系统提出的超出传统 HPC 建模/仿真要求的需求。他们需要为普通 HPC 用户,乃至 HPC 要求极为苛刻的科学家,研究人员和业务分析师,以高效又经济实惠的方式,从多个角度(例如,I/O 模型、协议支持、存储介质类型)提供多方位支持。



下载链接:

Hyperion Research:数据密集型HPC产业趋势(中文版)

Lustre Admin培训材料合集(上)

Lustre Admin培训材料合集(下)

CCF HPC China 2021 论文集电子版

高性能计算前沿问题研究合集

2021 Intel HPC China论坛资料
2021 HPC China大会intel方案资料(上)
2021 HPC China大会intel方案资料(下)


本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。




免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



电子书<服务器基础知识全解(终极版)>更新完毕。

获取方式:点击“阅读原文”即可查看182页 PPT可编辑版本和PDF阅读版本详情。



温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。


智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论 (0)
  • 贞光科技代理品牌紫光国芯的车规级LPDDR4内存正成为智能驾驶舱的核心选择。在汽车电子国产化浪潮中,其产品以宽温域稳定工作能力、优异电磁兼容性和超长使用寿命赢得市场认可。紫光国芯不仅确保供应链安全可控,还提供专业本地技术支持。面向未来,紫光国芯正研发LPDDR5车规级产品,将以更高带宽、更低功耗支持汽车智能化发展。随着智能网联汽车的迅猛发展,智能驾驶舱作为人机交互的核心载体,对处理器和存储器的性能与可靠性提出了更高要求。在汽车电子国产化浪潮中,贞光科技代理品牌紫光国芯的车规级LPDDR4内存凭借
    贞光科技 2025-04-28 16:52 205浏览
  • 你是不是也有在公共场合被偷看手机或笔电的经验呢?科技时代下,不少现代人的各式机密数据都在手机、平板或是笔电等可携式的3C产品上处理,若是经常性地需要在公共场合使用,不管是工作上的机密文件,或是重要的个人信息等,民众都有防窃防盗意识,为了避免他人窥探内容,都会选择使用「防窥保护贴片」,以防止数据外泄。现今市面上「防窥保护贴」、「防窥片」、「屏幕防窥膜」等产品就是这种目的下产物 (以下简称防窥片)!防窥片功能与常见问题解析首先,防窥片最主要的功能就是用来防止他人窥视屏幕上的隐私信息,它是利用百叶窗的
    百佳泰测试实验室 2025-04-30 13:28 186浏览
  • 浪潮之上:智能时代的觉醒    近日参加了一场课题的答辩,这是医疗人工智能揭榜挂帅的国家项目的地区考场,参与者众多,围绕着医疗健康的主题,八仙过海各显神通,百花齐放。   中国大地正在发生着激动人心的场景:深圳前海深港人工智能算力中心高速运转的液冷服务器,武汉马路上自动驾驶出租车穿行的智慧道路,机器人参与北京的马拉松竞赛。从中央到地方,人工智能相关政策和消息如雨后春笋般不断出台,数字中国的建设图景正在智能浪潮中徐徐展开,战略布局如同围棋
    广州铁金刚 2025-04-30 15:24 141浏览
  • 一、gao效冷却与控温机制‌1、‌冷媒流动设计‌采用低压液氮(或液氦)通过毛细管路导入蒸发器,蒸汽喷射至样品腔实现快速冷却,冷却效率高(室温至80K约20分钟,至4.2K约30分钟)。通过控温仪动态调节蒸发器加热功率,结合温度传感器(如PT100铂电阻或Cernox磁场不敏感传感器),实现±0.01K的高精度温度稳定性。2、‌宽温区覆盖与扩展性‌标准温区为80K-325K,通过降压选件可将下限延伸至65K(液氮模式)或4K(液氦模式)。可选配475K高温模块,满足材料在ji端温度下的性能测试需求
    锦正茂科技 2025-04-30 13:08 147浏览
  • 文/郭楚妤编辑/cc孙聪颖‍越来越多的企业开始蚕食动力电池市场,行业“去宁王化”态势逐渐明显。随着这种趋势的加强,打开新的市场对于宁德时代而言至关重要。“我们不希望被定义为电池的制造者,而是希望把自己称作新能源产业的开拓者。”4月21日,在宁德时代举行的“超级科技日”发布会上,宁德时代掌门人曾毓群如是说。随着宁德时代核心新品骁遥双核电池的发布,其搭载的“电电增程”技术也走进业界视野。除此之外,经过近3年试水,宁德时代在换电业务上重资加码。曾毓群认为换电是一个重资产、高投入、长周期的产业,涉及的利
    华尔街科技眼 2025-04-28 21:55 121浏览
  • 文/Leon编辑/cc孙聪颖‍2023年,厨电行业在相对平稳的市场环境中迎来温和复苏,看似为行业增长积蓄势能。带着对市场向好的预期,2024 年初,老板电器副董事长兼总经理任富佳为企业定下双位数增长目标。然而现实与预期相悖,过去一年,这家老牌厨电企业不仅未能达成业绩目标,曾提出的“三年再造一个老板电器”愿景,也因市场下行压力面临落空风险。作为“企二代”管理者,任富佳在掌舵企业穿越市场周期的过程中,正面临着前所未有的挑战。4月29日,老板电器(002508.SZ)发布了2024年年度报告及2025
    华尔街科技眼 2025-04-30 12:40 150浏览
  • 随着电子元器件的快速发展,导致各种常见的贴片电阻元器件也越来越小,给我们分辨也就变得越来越难,下面就由smt贴片加工厂_安徽英特丽就来告诉大家如何分辨的SMT贴片元器件。先来看看贴片电感和贴片电容的区分:(1)看颜色(黑色)——一般黑色都是贴片电感。贴片电容只有勇于精密设备中的贴片钽电容才是黑色的,其他普通贴片电容基本都不是黑色的。(2)看型号标码——贴片电感以L开头,贴片电容以C开头。从外形是圆形初步判断应为电感,测量两端电阻为零点几欧,则为电感。(3)检测——贴片电感一般阻值小,更没有“充放
    贴片加工小安 2025-04-29 14:59 168浏览
  • 在智能硬件设备趋向微型化的背景下,语音芯片方案厂商针对小体积设备开发了多款超小型语音芯片方案,其中WTV系列和WT2003H系列凭借其QFN封装设计、高性能与高集成度,成为微型设备语音方案的理想选择。以下从封装特性、功能优势及典型应用场景三个方面进行详细介绍。一、超小体积封装:QFN技术的核心优势WTV系列与WT2003H系列均提供QFN封装(如QFN32,尺寸为4×4mm),这种封装形式具有以下特点:体积紧凑:QFN封装通过减少引脚间距和优化内部结构,显著缩小芯片体积,适用于智能门铃、穿戴设备
    广州唯创电子 2025-04-30 09:02 172浏览
  • 在CAN总线分析软件领域,当CANoe不再是唯一选择时,虹科PCAN-Explorer 6软件成为了一个有竞争力的解决方案。在现代工业控制和汽车领域,CAN总线分析软件的重要性不言而喻。随着技术的进步和市场需求的多样化,单一的解决方案已无法满足所有用户的需求。正是在这样的背景下,虹科PCAN-Explorer 6软件以其独特的模块化设计和灵活的功能扩展,为CAN总线分析领域带来了新的选择和可能性。本文将深入探讨虹科PCAN-Explorer 6软件如何以其创新的模块化插件策略,提供定制化的功能选
    虹科汽车智能互联 2025-04-28 16:00 158浏览
  • 网约车,真的“饱和”了?近日,网约车市场的 “饱和” 话题再度引发热议。多地陆续发布网约车风险预警,提醒从业者谨慎入局,这背后究竟隐藏着怎样的市场现状呢?从数据来看,网约车市场的“过剩”现象已愈发明显。以东莞为例,截至2024年12月底,全市网约车数量超过5.77万辆,考取网约车驾驶员证的人数更是超过13.48万人。随着司机数量的不断攀升,订单量却未能同步增长,导致单车日均接单量和营收双双下降。2024年下半年,东莞网约出租车单车日均订单量约10.5单,而单车日均营收也不容乐
    用户1742991715177 2025-04-29 18:28 170浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦