伴随着5G与AI持续释放的效应,智能边缘正在快速地崛起。根据IDC预测,2025年全球物联网连接数将增长至270亿个,未来超过70%的数据和应用将在边缘产生和处理。
对AI和视频分析等计算密集型工作负载而言,边缘处理有着靠近数据源或行动点的优势,同时,也提出了更高的智能化、灵活性、安全性的要求。英特尔公司物联网事业部副总裁、中国区总经理陈伟博士日前在“英特尔智能边缘主题论坛”上发表主题演讲时表示,最新推出的第三代英特尔至强(Xeon)可扩展处理器,相比前代的平台性能提高了40%以上,能够提供出色的边缘推理性能、灵活性和安全性,从而满足强大的人工智能、复杂的图像或视频分析,以及边缘本地或任何工作环境的整合工作负载的需求,可同时应用于制造、医疗、零售、教育等多个行业,是英特尔面向物联网迈出的又一个重要里程碑。
例如在在医疗领域,特别是医学成像设备领域,医生在诊治时可能需要多次进行细致的全身扫描以确定肿瘤是否已经扩散,且每次扫描都会生成数百张图像,人工逐一检查每张图像非常非常的耗时间,并且可能产生人为的错误。第三代至强可扩展处理器具有更多内核以及更高的内存带宽,其内置的英特尔深度学习加速功能可以帮助医生快速评估每幅图像,并重点分析最关键的图像细节,提高诊断的准确性,从而帮助病人确定最为恰当的治疗方案。另外,这些处理器还提供了英特尔软件保护扩展(SGX技术)和储存加密技术(Total Memory Encryption技术),为安全的医疗和研究奠定了更信赖的基础。
而在零售领域,零售商会使用视频数据来了解客户在哪里滞留最多的时间,以确定客户的兴趣所在,让他们可以轻松地买到需要的商品。借助第三代至强可扩展处理器具备的强大AI功能,零售商不再需要将大量数据发送到云端并且等待响应,而是在本地进行推理处理,还可以将广告营销、库存管理、售后服务等各种工作负载整合到单个设备上,优化整个商店的运营,随时满足客户需求,帮助改善店内的体验。
陈伟博士同时透露称,为了丰富智能边缘产品线,英特尔正在进行下一代至强D处理器的抽样工作,这些处理器能够在更小的外形中以更低的功耗提供相同的强大功能,其耐用性设计可以轻松应对室外和其他复杂的条件,从而为物联网解决方案带来更多的可能性。
新的里程碑
第三代至强可扩展处理器采用了Intel最新的10nm工艺,单个芯片最多包含40核。与上一代20核Cascade Lake相比,IPC性能提升20%;在主流数据中心工作负载上性能平均提升46%;74%的AI推理性能增加;与5年前的老系统相比,平均性能提升2.65倍。
值得一提的是,第三代至强可扩展处理器是Intel首个主流双插槽并启用SGX软件防护扩展技术的数据中心处理器,也是Intel唯一一个内置AI加速的数据中心处理器。此外,作为多代策略的延续,第三代至强内置有Intel密码操作硬件加速。
在整个第三代家族中,Intel已经宣布了适用于4个和8个插槽的系统,因此截至目前可以服务1个、2个、4个、8个插槽配置,便于用户优化节点大小,实现更高的虚拟机密度,减少滞留资源,节约拥有成本。
而为了应对数据中心AI负载任务的增长,第三代至强处理器通过代际硬件平台改进、软件优化,在机器学习用例中,比如XGBoost算法、Kmeans算法等方面,实现了1.3-1.6倍的性能提升;面向深度学习应用中常见的图像识别、图像分类、语言处理等,DL Boost指令实现了1.45-1.74倍的性能提升。
与第三代至强处理器共同推出的,还包括一整套系统级方案:
- 傲腾持久内存200系列,这是下一代持久内存模块,内存带宽增加32%,每个插槽内存容量最高可以达到6TB;
- 最新的傲腾固态盘是迄今为止最快的数据中心固态盘,IOPS提升4倍,可满足高速网络的需求,同时TOS最高提升6倍,可以满足最严苛的SLA要求,相较于NAND固态盘,延迟降低13倍;
- NAND 固态盘D5-P5316,耐久性是QLC固态盘的5倍,在密集、大容量、高质量的工作负载方面尤为重要;
- 以太网适配器800系列,网络数据吞吐量最高可达200GB/s,适合高性能 vRAN、NFV转发面、存储、高性能计算、云和CDN等应用场景,能够为虚拟机密度提供最多两倍的资源;
- 采用Intel 10nm SuperFin制程技术的Agilex FPGA,搭配Quartus Prime软件,能够实现高于7nm竞品2倍的每瓦性能。
Intel官方提供的数据显示,自2017年推出第一款至强可扩展处理器以来,英特尔不但向全球客户交付了超过5000万颗至强处理器,部署了超过10亿颗至强核心,还成功的将用户每台虚拟机的基础设施成本降低了25%,且性能保持不变,并将超过80%的TOC转化为已有实际收益的部署。目前,超过800家云服务提供商部署了基于至强可扩展处理器的服务器,超过1000个客户进行了TOC认证。
应万变
云桌面三擎方案是锐捷云桌面产品总监王良列举的代表性应用,可总结为“一平台、三引擎、多场景”。在该方案中,底层云服务器采用了英特尔至强可扩展处理器架构为整个云桌面方案提供强大算力支撑、海量数据存储以及统一运维管理;服务器之上是超融合云平台RCCP,云桌面VDI、IDV、TCI三擎架构,以及自主研发远程桌面传入协议;云终端从产品形态上可分为终端形态和一体机形态,针对不同的用户场景,会采用不同的云桌面方案与之对应。
三擎架构中,VDI是一种经典桌面虚拟化引擎,特点是数据更安全、桌面可漫游、计算性能弹性可扩展,适用于办公、研发以及移动办公场景;IDV架构称之为智能桌面虚拟化引擎,优点是可以利用本地终端的强大计算性能,网络依赖程度低,在网络断线的情况下不影响业务的办理,同时外设兼容性更好,适用于政府办事窗口、工厂产线等实时性要求更高的场景;TCI(透明桌面计算引擎)具备硬件性能无损耗、高效软件分发部署,以及支持软件个性化升级部署的特点,适用于融合计算场景以及PC利用场景。
宇视有两大类产品形态:一是面向中高端行业解决方案的多节点服务器;二是面向中低端通用领域的单节点服务器。根据宇视研发副总裁胡华明的介绍,在多节点服务器上,昆仑系列旗舰产品具有高融合、高可靠、灵活配置的特点,在一些中高端应用场景中,能够进行快速的部署和落地,实现软硬一体化的快速交付。目前,该方案已经服务超过100多个城市300多个区县的上千个社区和学校。在单节点服务器上,基于至强平台的强计算能力、较高的性能功耗比,宇视推出了事件检测相关的旗舰类产品,具有高性能高可靠的特点,主要应用在社区、高速公路管理等场景中。
英特尔公司物联网事业部中国区首席技术官及高级首席工程师张宇博士在接受媒体采访时表示,这次推出的至强处理器对很多边缘场景都有很好支持,包括网络边缘、物联网边缘,甚至包括网络边缘里的小栈、5G基站和MEC平台等等。
英特尔公司物联网事业部中国区首席技术官及高级首席工程师张宇博士
可配置特性是张宇博士着重强调的一点。考虑到物联网的不同使用场景对算力要求各异,所以第三代至强产品有很多不同硬件配置,有不同的核数、不同的速度,用户可以根据自己对于负载的要求选择不同的配置。同时,得益于SST(Speed Select Technology)技术,用户可以根据每个核上所跑的负载的轻与重,选择内核运行速度和主频,从而带来更好的性能功耗比指标。
指令方面的增强也值得关注。第三代至强处理器支持DL Boost Int8的指令集,能够访问的内存最大容量达到6T,从而使AI推理速度实现了1.8倍的提升。除此以外,在安全方面,开发者在英特尔软件防护扩展(SGX)、英特尔全内存机密技术(TME)技术和新的AEX指令集基础上开发针对不同垂直行业的应用。
以目前AI领域讨论最多的“联邦学习”技术为例,该技术的核心思路是形成一个协同机制,所有的参与者、数据贡献者和模型使用者可以把原始数据保留在本地或可信执行环境中,只对各自模型训练的增量进行交流,再通过联邦学习机制形成最终统一的、新的、完整的增量模型,最终将完整增量模型下发给不同使用者进行使用。整个过程中,原始数据没有进行交互,交互只是各自的模型增量,和原始数据的相关性不是很大,从而最大程度的保护了用户隐私。在这一过程中,SGX技术从过去只能支持128G到现在支持1T,就起到了很好的支撑作用。
2020年,为了更好的帮助用户“一站式”获取软件工具,快速开发原型,迅速集成上市,英特尔推出了“英特尔边缘软件中心”,并针对工业、零售、视觉三个垂直领域开发了边缘洞见软件包。软件包提供了针对行业需求的软件模块与架构设计,并且经过充分验证可在各类平台快速部署。同时,针对每款边缘洞见软件包,中心也配备了商用级别的参考示例,例如预测性诊断与系统维护,损失检测的实时传感器融合。
在实操过程中,利用“英特尔边缘软件中心”,用户只需通过中心提供的教程轻松入门,下载软件组合安装脚本,再利用参考代码与推荐边缘设备快速生成可部署的解决方案,最终将方案提交至英特尔物联网开发套件(Intel RFP Ready Kits)或英特尔物联网行业整体解决方案(Intel Market Ready Solutions),来获取更多推广支持。
张宇表示,2021年,“英特尔边缘软件中心”的扩展思路有两个方面:一是提高用户体验,主要是解决国内国外不同网络条件下的下载速度;二是继续扩大软件内容,除了将零售行业包括在内之外,英特尔工业边缘洞见平台(EII)、英特尔工业边缘控制平台(ECI)、OpenVINO等工具都将被纳入其中,助力工业客户实现IT/OT融合。
“总体来看,在边缘进行数据处理的使用模式正在发生变化,负载整合和云原生就是两个非常显著的趋势。”张宇解释说,负载整合指的是运用一些虚拟化技术,充分利用处理器的多核技术,让同一个处理器平台承载若干个不同应用;而云原生最大的特点是容器化,是把很多应用依赖的软件模块放在一个容器内,便于进行管理和升级,而上述两方面都需要引入“计算池”的概念。简单而言,就是将足够的计算资源比喻成“计算池”,不同的边缘设备使用者可以根据应用需求不断动态的调整应用与硬件资源,这涉及到虚拟化、安全、AI算力、多核等多个技术的支持,而新发布的第三代至强可扩展处理器能够起到非常坚固的支撑作用。