新冠和癌症都能解决?看E级超算时代,HPC会带来多少可能?

智能计算芯世界 2021-10-28 08:00



道、术、势三合一带来的天时+地利+人和,就是英特尔持续发力高性能计算创新的底气所在。


作者 | 包永刚

编辑 | 李帅飞

长久以来,高性能计算(HPC)给人的印象总是神秘且高深。这是因为它主要是学术界用来推进基础科学发现和探索的手段,比如上到宏观的宇宙大爆炸模拟、下到微观的量子物理和分子动力学研究,这种级别的话题一抛出来,就会有“生人勿近”的感觉。

然而,新冠肺炎对我们的突然袭击,让很多人重新认识了高性能计算:它非但不“高冷”,对热点事件的反应还出人意料的快——不论是中国还是全球,领先的基因与药物研发机构,在高性能计算的支持下,少则数小时,多则几天就破解了新冠病毒的结构,并立即开始疫苗的研制。

可以说,正是高性能计算在算力上的爆发式增长,让过去以“年”来计算时长、且需要无数次实验来纠错的病毒和疫苗研究过程发生了翻天覆地的变化,这种变化还不能只用一个“快”字来概括,而是“快”与“精准”兼顾。

“高性能计算是改变世界和丰富地球上每个人生活背后的创新,”在日前于珠海举办的2021 CCF全国高性能计算学术年会(CCF HPC China 2021)上,英特尔公司副总裁Trish Damkroger就在其主题演讲中这样总结道:“每天都有新的用户憧憬使用高性能计算系统的新方法来应对越来越多的高性能计算和AI的挑战。例如制造企业利用高性能计算系统来设计性能更好的运动装备,铁路公司使用托管的天气预报服务来避免脱轨,药剂师使用机器学习来查明药物中的有害成分。” 

Trish的话,对于整个高性能计算行业而言已不仅仅是思想上的共鸣,而是正演进为重塑这一技术及行业的共振。亲历了这场中国顶级高性能计算行业峰会,并站在E级 (Exascale,百亿亿级)计算时代门前的业内同仁,不论是来自最终用户、产品技术提供商还是研究机构,可能都在思考:高性能计算还会在哪些行业、哪些领域和场景引发创新的裂变反应?它达成E级算力并与AI和大数据实现了更为充分的融合后,又会带来哪些前所未有的可能?

图一 CCF HPC China 2021上的英特尔展位

这两个问题,或许每个专业人士的心里都有自己的答案,普通大众也会有自己的那份期盼,暂时让我们过滤掉这种多样性和复杂度,仅就刚才提到的医疗及生命科学领域做个展望。

1


更多疑难杂症将迎来

精准疗法或药物

上面这句话,就是高性能计算未来升级到E级计算时代,并与AI和大数据深度融合后,即将为这个领域带来的变化。

正如前文提到的,高性能计算已经显著缩短了新冠病毒分析和疫苗的研发时间,拯救了数亿普通人的生命。如果把它,特别是有了E级计算能力的它用于更为广泛的医疗细分领域,那么它又快又精准的效果,也会随之扩展到这些细分领域。

一个典型的例子就是美国著名影星安吉丽娜·朱莉,她有家族性乳腺癌史,在做了基因检测之后,结果显示她患乳腺癌的风险高达87%,于是她与医生商量后进行了预防性乳腺切除,把乳腺癌风险降低到了5%以下。

这种融合基因测序、分子诊断等手段、并由高性能计算加速的精准医疗方案,目前还只能惠及少部分人,主要原因就是高性能计算的整体算力还有所不足,无法为更多个体提供同样精准和快捷的服务。而且目前医学领域的基础研究与临床医学也处于分立的状态,这让很多基础研究偏离了解决实际需求的出发点,无法更高效地作用于医学的发展和进步。

于是,在高性能计算演进的同时,能更有效利用它的转化医学概念也被提出,它就是要把基础医学研究与临床实践更紧密地结合起来,通过多学科交叉合作实现“从实验室到临床”的双向且高效的转化。

在这个方向上,作为中国第一个,也是目前唯一建成的国家级综合性转化医学中心——上海交通大学附属瑞金医院转化医学中心很有发言权,其重点研究方向聚焦在肿瘤(包括白血病)、代谢性疾病和心脑血管疾病等领域,其实践过程就是需要收集全面多维的患者生物信息数据,然后基于海量数据的挖掘和分析,最终形成更个性化且精准的诊疗方案,然后再把这些方案涉及的新疗法和新药物普及开来。

这一过程说起来简单,但在落实时却十分复杂,仅在数据的收集、传输、存储和处理环节就面临重重困难,根本原因就是其涉及到本就庞大且还在持续增长的数据量。毕竟,单个人类全基因测序分析涉及的数据就高达870GB,再加上招募的患者病情通常比较危急,要求数据处理越快越好。另一方面,由于不同转化医学研究团队都需要同时访问海量数据库,所以,数据并行访问的性能,就与算力一起,成为了影响整体效率高下的关键。

为此,瑞金医院转化医学中心搭建了一个集存、传、算、用为一体的定制化超算平台,其中不但导入了英特尔至强可扩展处理器的强劲算力和高效算法来保障超算平台的计算性能,还使用了“英特尔傲腾持久内存+分布式异步对象存储 (DAOS)”的方案,来满足转化医学实时、高频和高效访问数据的需求。

图二 瑞金医院转化医学中心对DAOS优势的剖析

瑞金医院转化医学国家重大科技基础设施(上海)生信大数据平台共同负责人吕纲就在本次HPC China年会上表示:“DAOS充分发挥了英特尔傲腾持久内存的性能,提供了高带宽、低时延以及优异的小文件并发性能。对应全球IO500排行榜的公开数据,这将是生信领域第一个可以冲击榜单前十的系统,也是一个突破天花板的里程碑。”

吕纲在这里提到的英特尔傲腾持久内存,就是英特尔目前的高性能计算产品技术组合中的重要成员。它与DRAM相比,性能相近,但容量、耐用性和性价比更高,还有掉电不丢数据的独家本领。DAOS在软件上针对持久内存的特性做了优化,从而显著提升数据存储的访问效率。按吕纲的话说,就是:“以前做全基因组测序需要花近168小时,有了定制的生信计算平台,不到8小时就可以完成!这为挽救患者生命争取最佳治疗时机提供了保障。“

2


说E级盼E级,E级实现不容易

有了瑞金医院转化医学中心的开创性工作,并伴随更多转化医学中心的建立、运作和辐射,更多疾病,尤其是疑难杂症就有望获得更为精准的疗法和药物的支持,甚至被攻克。但这一愿景的落地,也离不开高性能计算的进一步发展演进。当然,高性能计算发展和演进惠及了很多行业。相信随着E级计算时代的到来,它必将在更多的行业中激发出更多让人意想不到的创新。

E级计算既然有这么大的价值,那还不废寝忘食、日以继夜地加速搞定?

这一点,可没有圈外人想象得那么简单。毕竟,它的算力水平,就是每秒钟要实现百亿亿次浮点运算。用一个形象但不够精确的方式来解释,它一瞬间的计算量,需要地球上的所有人持续不停地算上四年时间。

要实现如此级别的算力,现有的高性能计算技术必然要进行大的变革甚至是颠覆。而一个大家都已公认的方向,就是必须要导入基于异构架构的基础设施。

所谓异构架构,翻译成易懂的语言就是:CPU要有,GPU也要上,FPGA和ASIC(专用芯片)都有更好,总之……不论通用算力还是特定加速,一个都不能少!

英特尔近几年来被频频提及的XPU战略,就是这种异构架构创新方向的具体体现。

先说说这个架构中的CPU,它在未来的XPU时代大概率仍会扮演C位角色,算是通用算力的主要输出和整个平台的总控。例如今年刚刚发布的第三代英特尔至强可扩展处理器,就一方面借助创新内核架构、对最多40个内核和英特尔深度学习加速等技术的集成来实现通用算力,同时兼顾了对AI应用的加速。

来自实测的数据,证明这些技术的使用确实是立竿见影:与上一代相比,第三代至强可扩展处理器将金融领域的蒙特卡罗、布莱克-舒尔斯和二项式期权定价模型等应用的性能分别提升了高达70%、67%和28% ;将生命科学领域的NAMD、GROMACS、LAMMPS和 RELION的性能分别提升了高达57%、64%、60% 和 61%;将制造业中的 CONVERGE、NUMECA、OpenFOAM和Altair Radioss的性能分别提升了高达52%、61%、51%和47% 。而AI推理性能上,它相比前一代产品也提升了74%。

图三 英特尔高性能计算产品组合现阶段的核心——第三代至强可扩展处理器

另一方面,业内人士也非常看重第三代至强可扩展处理器在IO能力上的升级,特别是支持PCI-e 4这一进步,让它能与更多高性能 GPU 搭配。

下一代至强可扩展处理器 Sapphire Rapids 相比之下就更加让人期待:它将会采用全新模块化SoC架构,除了最多可支持 56个内核以及112线程外,它更吸引人的地方是一股脑导入了对DDR5、PCIe5 、CXL 和HBM技术的支持,可以进一步增强内存、存储和互连的性能,而且这款产品还会集成 AMX(高级矩阵扩展)技术,让CPU在运行矩阵运算任务时,拥有更显著的加速效果。

图四 英特尔公司副总裁 Trish Damkroger 展望下一代至强可扩展处理器的规格特性

与Sapphire Rapids主要提升通用计算性能相对应的,就是Ponte Vecchio将为高性能计算和人工智能带来的更强加速能力。根据Trish Damkroger的介绍,这款由47种不同芯片模块组合而成的英特尔GPU,将采用灵活的数据并行向量矩阵引擎来处理一系列高度并行的工作负载,以助力加速 E 级计算愿景的实现。它可提供超高的双精度浮点运算吞吐量并提供超高缓存和内存带宽,以满足需要高内存带宽的应用程序的需求。

图五 集领先架构和多种先进制造、封装技术于一身的Ponte Vecchio

异构架构虽然主要会落实在硬件上,但它并不只是硬件需要面对的机遇和挑战。“异构系统增加了对可扩展软件方法的需求,这种软件应该能在堆栈的不同层级工作,” Trish Damkroger指出,“英特尔推出了oneAPI 行业计划来帮助应对这一挑战。”

图六 英特尔在本次HPC China上分享的oneAPI技术演示

oneAPI为充分简化跨CPU、GPU、FPGA及其他加速器的异构计算应用开发及优化而生,肩负着推进和落实XPU战略的重任。它不仅能够提供编译器、库和分析工具,还支持AI和HPC应用加速的AMX、VNNI/DL Boost 指令和内存技术等功能。其目标,就是为更多相关应用负载提供更优的支持,并实现异构计算“一次编译,处处运行”。

图七 英特尔现在已大部分就绪,明后两年就会完全就绪的高性能计算产品组合

从硬件到软件再到产品组合,从计算到存储再到互联,英特尔向高性能计算市场交出的答案就是丰富、多维、软硬兼施的完整产品技术组合。至强是这一组合现阶段的核心,上文提及的oneAPI、傲腾持久内存和DAOS也同样是其不可或缺的部分。Sapphire Rapids和Ponte Vecchio则会为这个组合第一次带来“双主角”的配置。

不过更值得说明的是,不论是现阶段以CPU为主的组合,还是未来CPU与GPU协作的组合,英特尔提供这种组合,而非单独CPU支持的根本原因,都是要实现“均衡”。英特尔对这种均衡的解读,一是要实现数据全链路,包括计算、存储和传输的均衡提升和优化,以避免平台出现性能短板和瓶颈;二是要实现对通用计算和专用加速能力的兼顾和均衡提升,以满足高性能计算应用多样化+差异化+融合化的需求。而不论是这两种解读中的哪一种,目前整个业界几乎也只有英特尔具备足够的实力将之实现。

图八 英特尔在本次HPC China现场展示的部分高性能计算硬件产品 

3


高性能计算要持续创新:超级力量

和生态合作需并重

虽然Sapphire Rapids和Ponte Vecchio的指标非常诱人,但它肯定不是英特尔在高性能计算领域的创新终点。同样,尽管E级计算现在还是一个颇有难度的创新目标,但它也迟早会成为高性能计算创新史书上的里程碑之一。 

在它们达成之后技术和产业又会发生哪些新的变化,这才是大家目前更为好奇的话题。

虽然同样没有一个标准答案,但英特尔CEO帕特.基辛格最近提出的“四大超级技术力量”,或许可以帮我们拨开些许迷雾。“这四种超级力量分别是无处不在的计算、无处不在的连接、从云到边缘的基础设施,以及人工智能,”英特尔公司市场营销集团副总裁、中国区行业解决方案部总经理梁雅莉表示:“每一个超级力量都有其特质,同时也相得益彰,创造了强大的全新可能性。”

图九 英特尔公司市场营销集团副总裁、中国区行业解决方案部总经理梁雅莉

虽然提到可能性,就会有很多种可能,但梁雅莉还是锁定了一个重要的方向,即万物智能化,它是在万物数字化、万物网络化、万物移动化和万物云化基础上衍生出来的更大变革。“它将让人们对计算的需求呈指数级增长,”梁雅莉表示:“具备E级计算能力的高性能计算,就是支持这个转变的重要基础设施之一。”

图十 将赋能“万物智能化”变革的四大超级技术力量

赋能万物智能化的目标,肯定不是一家企业能够达成的愿景。就像在高性能计算领域不能只靠一个CPU或GPU,要凭产品组合打天下,在实现如此创新愿景的过程中,英特尔也在呼唤来自广泛生态系统合作伙伴的支持。

很明显,合作伙伴的响应很是积极——仅本次HPC China大会上,英特尔就联合十五家合作伙伴,展示了它们在高性能计算系统和解决方案上的最新成果,其中三家的实物展示还“嵌入”到了英特尔展区中,它们分别是新华三集团基于第三代英特尔至强可扩展处理器、英特尔傲腾持久内存、英特尔SSD Optimizer 存储构建的通用液冷服务器 H3C UniServer R4900 G5 以及整体液冷解决方案,联想基于第三代英特尔至强可扩展处理器的 ThinkSystem SD650 V2 温水水冷服务器,以及同样基于该款处理器的宝德HPC&AI集群解决方案。

图十一 H3C UniServer R4900 G5服务器不仅提升了服务器性能,也可有效减低噪音,助力“双碳”目标实现

图十二 联想ThinkSystem SD650 V2温水水冷服务器使用铜质水回路实现成本缩减和更高散热效率,能为要求严苛的 HPC 工作负载提供更可靠的支持

图十三 宝德 HPC & AI 集群解决方案能充分释放英特尔深度学习加速技术的潜能,助用户获得将HPC和AI有机融合的应用体验

4


写在最后

经过多年发展,高性能计算终于吹响了向E级计算时代冲刺的总攻号角,此为“势”正成。

英特尔与合作伙伴的关系更加密切、对创新的传递和放大更为明显,此为“道”已显。

英特尔高性能计算产品技术组合的成员越来越多维和丰富,搭配后还能带来更强的加成效果,此为“术”渐精。

这种道、术、势三合一带来的天时+地利+人和,就是英特尔持续发力高性能计算创新的底气所在。

同样,一场席卷全球的新冠肺炎,也为更多人接触、了解甚至是应用高性能计算带来了一个意料之外的契机,也让大家认识到,正是由于人类对于包括健康在内的更美好生活永不停歇的追求,才会对高性能计算不断提出更高的要求,同时也推动着高性能计算的普及。

当追求美好遇见勇于创新,会有怎样的化合作用?过去的,我们已经见证;未来的,让我们拭目以待。

本文由雷锋网原创,本号授权转载。




智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论 (0)
  • 一、智能家居的痛点与创新机遇随着城市化进程加速,现代家庭正面临两大核心挑战:情感陪伴缺失:超60%的双职工家庭存在“亲子陪伴真空期”,儿童独自居家场景增加;操作复杂度攀升:智能设备功能迭代导致用户学习成本陡增,超40%用户因操作困难放弃高阶功能。而WTR096-16S录音语音芯片方案,通过“语音交互+智能录音”双核驱动,不仅解决设备易用性问题,更构建起家庭成员间的全天候情感纽带。二、WTR096-16S方案的核心技术突破1. 高保真语音交互系统动态情绪语音库:支持8种语气模板(温柔提醒/紧急告警
    广州唯创电子 2025-04-28 09:24 128浏览
  •  探针台的维护直接影响其测试精度与使用寿命,需结合日常清洁、环境控制、定期校准等多维度操作,具体方法如下:一、日常清洁与保养1.‌表面清洁‌l 使用无尘布或软布擦拭探针台表面,避免残留清洁剂或硬物划伤精密部件。l 探针头清洁需用非腐蚀性溶剂(如异丙醇)擦拭,检查是否弯曲或损坏。2.‌光部件维护‌l 镜头、观察窗等光学部件用镜头纸蘸取wu水jiu精从中心向外轻擦,操作时远离火源并保持通风。3.‌内部防尘‌l 使用后及时吹扫灰尘,防止污染物进入机械滑
    锦正茂科技 2025-04-28 11:45 74浏览
  • 在CAN总线分析软件领域,当CANoe不再是唯一选择时,虹科PCAN-Explorer 6软件成为了一个有竞争力的解决方案。在现代工业控制和汽车领域,CAN总线分析软件的重要性不言而喻。随着技术的进步和市场需求的多样化,单一的解决方案已无法满足所有用户的需求。正是在这样的背景下,虹科PCAN-Explorer 6软件以其独特的模块化设计和灵活的功能扩展,为CAN总线分析领域带来了新的选择和可能性。本文将深入探讨虹科PCAN-Explorer 6软件如何以其创新的模块化插件策略,提供定制化的功能选
    虹科汽车智能互联 2025-04-28 16:00 82浏览
  • 贞光科技代理品牌紫光国芯的车规级LPDDR4内存正成为智能驾驶舱的核心选择。在汽车电子国产化浪潮中,其产品以宽温域稳定工作能力、优异电磁兼容性和超长使用寿命赢得市场认可。紫光国芯不仅确保供应链安全可控,还提供专业本地技术支持。面向未来,紫光国芯正研发LPDDR5车规级产品,将以更高带宽、更低功耗支持汽车智能化发展。随着智能网联汽车的迅猛发展,智能驾驶舱作为人机交互的核心载体,对处理器和存储器的性能与可靠性提出了更高要求。在汽车电子国产化浪潮中,贞光科技代理品牌紫光国芯的车规级LPDDR4内存凭借
    贞光科技 2025-04-28 16:52 90浏览
  • 晶振在使用过程中可能会受到污染,导致性能下降。可是污染物是怎么进入晶振内部的?如何检测晶振内部污染物?我可不可以使用超声波清洗?今天KOAN凯擎小妹将逐一解答。1. 污染物来源a. 制造过程:生产环境不洁净或封装密封不严,可能导致灰尘和杂质进入晶振。b. 使用环境:高湿度、温度变化、化学物质和机械应力可能导致污染物渗入。c. 储存不当:不良的储存环境和不合适的包装材料可能引发化学物质迁移。建议储存湿度维持相对湿度在30%至75%的范围内,有助于避免湿度对晶振的不利影响。避免雨淋或阳光直射。d.
    koan-xtal 2025-04-28 06:11 98浏览
  • 在电子电路设计和调试中,晶振为电路提供稳定的时钟信号。我们可能会遇到晶振有电压,但不起振,从而导致整个电路无法正常工作的情况。今天凯擎小妹聊一下可能的原因和解决方案。1. 误区解析在硬件调试中,许多工程师在测量晶振时发现两端都有电压,例如1.6V,但没有明显的压差,第一反应可能是怀疑短路。晶振电路本质上是一个交流振荡电路。当晶振未起振时,两端会静止在一个中间电位,通常接近电源电压的一半。万用表测得的是稳定的直流电压,因此没有压差。这种情况一般是:晶振没起振,并不是短路。2. 如何判断真
    koan-xtal 2025-04-28 05:09 116浏览
  • 2025年全球人形机器人产业迎来爆发式增长,政策与资本双重推力下,谷歌旗下波士顿动力、比亚迪等跨国企业与本土龙头争相入局,产业基金与风险投资持续加码。仅2025年上半年,中国机器人领域就完成42笔战略融资,累计金额突破45亿元,沪深两市机器人指数年内涨幅达68%,印证了资本市场对智能终端革命的强烈预期。值得关注的是,国家发展改革委联合工信部发布《人形机器人创新发展行动计划》,明确将仿生感知系统、AI决策中枢等十大核心技术纳入"十四五"国家重大专项,并设立500亿元产业引导基金。技术突破方面,本土
    电子资讯报 2025-04-27 17:08 242浏览
  •  集成电路封装测试是确保芯片性能与可靠性的核心环节,主要包括‌晶圆级测试(CP测试)‌和‌封装后测试(FT测试)‌两大阶段,流程如下:一、晶圆级测试(CP测试)1.‌测试目的‌:在晶圆切割前筛选出功能缺陷或性能不达标的晶粒(Die),避免后续封装环节的资源浪费,显著降低制造成本。2.‌核心设备与操作‌l ‌探针台(Prober)‌:通过高精度移动平台将探针与晶粒的Pad jing准接触,实现电气连接。l ‌ATE测试机‌:提供测试电源、信号输入及功能向量,接收晶粒反
    锦正茂科技 2025-04-27 13:37 186浏览
  • 探针台作为高精度测试设备,在光电行业的关键器件研发、性能测试及量产质量控制中发挥核心作用,主要涵盖以下应用场景与技术特性:一、光电元件性能测试1.‌光电器件基础参数测量‌l 用于LED、光电探测器、激光器等元件的电流-电压(I-V)特性、光功率、响应速度等参数测试,支撑光通信、显示技术的器件选型与性能优化。l 支持高频信号测试(如40GHz以上射频参数),满足高速光调制器、光子集成电路(PIC)的带宽与信号完整性验证需求。2.‌光响应特性分析‌l 通过电光转换效率测
    锦正茂科技 2025-04-27 13:19 115浏览
  •     今天,纯电动汽车大跃进牵引着对汽车电气低压的需求,新需求是48V。车要更轻,料要堆满。车身电子系统(电子座舱)从分布改成集中(域控),电气上就是要把“比12V系统更多的能量,送到比12V系统数量更少的ECU去”,所以,电源必须提高电压,缩小线径。另一方面,用比传统12V,24V更高的电压,有利于让电感类元件(螺线管,电机)用更细的铜线,缩小体积去替代传统机械,扩大整车电气化的边界。在电缆、认证行业60V标准之下,48V是一个合理的电压。有关汽车电气低压,另见协议标准第
    电子知识打边炉 2025-04-27 16:24 221浏览
  • 随着电子元器件的快速发展,导致各种常见的贴片电阻元器件也越来越小,给我们分辨也就变得越来越难,下面就由smt贴片加工厂_安徽英特丽就来告诉大家如何分辨的SMT贴片元器件。先来看看贴片电感和贴片电容的区分:(1)看颜色(黑色)——一般黑色都是贴片电感。贴片电容只有勇于精密设备中的贴片钽电容才是黑色的,其他普通贴片电容基本都不是黑色的。(2)看型号标码——贴片电感以L开头,贴片电容以C开头。从外形是圆形初步判断应为电感,测量两端电阻为零点几欧,则为电感。(3)检测——贴片电感一般阻值小,更没有“充放
    贴片加工小安 2025-04-29 14:59 40浏览
  • 4月22日下午,备受瞩目的飞凌嵌入式「2025嵌入式及边缘AI技术论坛」在深圳深铁皇冠假日酒店盛大举行,此次活动邀请到了200余位嵌入式技术领域的技术专家、企业代表和工程师用户,共享嵌入式及边缘AI技术的盛宴!1、精彩纷呈的展区产品及方案展区是本场活动的第一场重头戏,从硬件产品到软件系统,从企业级应用到高校教学应用,都吸引了现场来宾的驻足观看和交流讨论。全产品矩阵展区展示了飞凌嵌入式丰富的产品线,从嵌入式板卡到工控机,从进口芯片平台到全国产平台,无不体现出飞凌嵌入式在嵌入式主控设备研发设计方面的
    飞凌嵌入式 2025-04-28 14:43 95浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦