为什么加速数据处理对各行各业的AI创新都至关重要

原创 英伟达NVIDIA中国 2024-07-03 19:46

在各行各业,AI 正在用机器驱动的计算来推动创新。在金融领域,银行正在使用 AI 更快地检测欺诈行为并确保账户安全;电信公司正在使用 AI 优化网络以提供优质服务;科学家正在使用 AI 开发治疗罕见病的新疗法;公共事业正在使用 AI 建设更清洁、更可靠的能源网络,汽车行业正在利用 AI 使自动驾驶汽车更安全、更便捷。



数据是各种大型 AI 用例的基础。有效且精确的 AI 模型需要使用广泛的数据集进行训练。企业要想利用 AI 的力量,就必须建立一个数据流,从各种来源提取数据,并将其转换成一致的格式并进行有效存储。


数据科学家通过多次实验完善数据集以微调 AI 模型,从而在真实应用中实现其最佳性能。从语音助手到个性化推荐系统,这些应用都需要快速处理大量数据,以保障实时性能。


随着 AI 模型变得越来越复杂,并开始处理文本、音频、图像和视频等各类数据,满足快速数据处理的需求变得更加关键。对于继续依赖传统 CPU 计算的机构而言,数据瓶颈、数据中心成本不断攀升和算力不足阻碍了其创新发展和性能提升。


许多企业正转向加速计算以将 AI 融入其业务运营中。这种方法充分利用 GPU、专用硬件、软件和并行计算技术,将计算性能提升最高达 150 倍,能效提升高达 42 倍。


各行各业的领先企业正在利用加速数据处理来实施其开创性的 AI 计划。


金融机构瞬间检测到欺诈行为


由于需要对大量交易数据进行快速分析,金融机构在检测欺诈方式时面临巨大挑战。此外,由于缺乏真实欺诈案例的标记数据,也给 AI 模型的训练造成了困难。在处理与欺诈检测相关的大量数据时,传统的数据科学工作流缺乏所需的加速能力。这导致数据处理缓慢,阻碍了实时数据分析和欺诈检测。


为了克服这些挑战,每年处理超过 80 亿笔交易的美国运通使用加速计算来训练和部署长短期记忆(LSTM)模型。这些模型用于顺序分析和异常检测,并能够适应新数据和从中学习,是打击欺诈的理想选择。


利用 GPU 上的并行计算技术,美国运通大幅加快了 LSTM 模型的训练速度。GPU 还使已经投入使用的模型能够处理大量交易数据,以进行高性能的计算,从而实时检测欺诈行为。


该系统可在低于两毫秒的延迟中运行,以更好地保护客户和商家,与基于 CPU 的配置相比性能提高了 50 倍。通过将加速的 LSTM 深度神经网络与其现有方法相结合,美国运通在特定领域的欺诈检测准确率提高了 6%。


金融公司还可以使用加速计算来降低数据处理成本。通过在 NVIDIA GPU 上运行涉及大量数据的 Spark3 工作负载,PayPal 证实了其有望将大数据处理和 AI 应用的云成本降低 70%。


通过更高效地处理数据,金融机构可以实时检测欺诈行为,从而在不干扰交易流的情况下更快决策,并将财务损失的风险降至最低。


电信公司简化复杂的人员调派


电信公司的各项业务产生了海量数据,包括网络设备、客户交互、计费系统以及网络性能和维护。


每天处理数百 PB 数据的全国性网络需要进行复杂的技术人员调派,以确保服务。为了优化技术人员调度,先进的调派引擎需要执行数万亿次计算,并充分考虑天气、技术人员技能、客户需求和车队分布等因素。这些操作的成功取决于细致的数据准备和充足的算力。


AT&T 拥有美国最大的现场调度服务团队之一。该公司正在通过 NVIDIA cuOpt 改善数据密集型人员调派,依靠启发式、元启发式和优化来计算复杂的车辆调派问题。


在早期试验中,cuOpt 在 10 秒内就提供了调派解决方案,将云计算成本降低了 90%,这使技术人员每天能够完成更多的服务呼叫。NVIDIA RAPIDS 是一套能够加速数据科学和分析数据流的软件库,它进一步加速了 cuOpt,使企业能够集成 本地搜索启发式算法和元启发式算法(如 Tabu 搜索),以持续地优化人员调派。


AT&T 正在采用 NVIDIA RAPIDS Accelerator for Apache Spark,以增强基于 Spark 的 AI 和数据流的性能。这有助于该公司从训练 AI 模型到保持网络质量,再到减少客户流失和改进欺诈检测的运营效率全方位提升。通过 RAPIDS 加速器,AT&T 正在减少目标工作负载的云计算支出,同时实现更高的性能并减少碳排放量。


基于电信公司对提高运营效率同时提供高质量服务的需求,加速数据流的传输和处理将至关重要。


生物医学研究人员缩短新药研发时间


研究人员对人类基因组中大约 25000 个基因进行了研究,以了解它们与疾病之间存在何种关系,这使得医学数据和同行评审的研究论文数量激增。生物医学研究人员依靠这些论文来缩小开发新疗法的研究范围。然而,对数量如此庞大且仍在不断增加的相关研究进行文献综述,已成为一项不可能完成的任务。


领先的制药公司阿斯利康开发了一个生物学洞察知识图谱(BIKG),从文献综述到筛选命中率评级、靶点识别等整个药物发现过程为科学家提供帮助。该图谱将公共和内部数据库与科学文献中的信息进行整合,模拟了 1000 万至 10 亿种复杂的生物关系。


BIKG 已被有效地用于基因排序,帮助科学家假设高潜力靶点以研发新疗法。在今年的 NVIDIA GTC 上,阿斯利康团队介绍了一个项目,该项目成功识别了与肺癌治疗耐药性相关的基因。


为了缩小潜在基因的范围,数据科学家和生物学研究人员共同定义了相关标准和基因特征,以确定理想的开发疗法靶点。他们训练了一种机器学习算法,在 BIKG 数据库中搜索具有文献中提到的可治疗基因的特征。通过利用 NVIDIA RAPIDS 来加快计算速度,该团队将初始基因库从 3000 个减少到仅仅 40 个目标基因,以前完成这项任务需要耗时几个月,但现在只需要几秒钟。


通过用加速计算和 AI 助力药物研发,制药公司和研究人员最终可以利用医学领域积累的大量数据,更快、更安全地开发新药,帮助挽救生命。


公共事业公司创造清洁能源的未来


能源部门正大力推动碳中和能源转型。在过去的 10 年里,随着太阳能等可再生能源的使用成本大幅下降,清洁能源未来的实现取得了重大的进展。


然而,在整合来自风力发电厂、太阳能发电厂和家用电池的清洁能源时,电网管理面临着新的复杂性考验。在能源基础设施多元化并且需要双向输电的情况下,电网管理变得更加数据密集化。因此,现在需要新的智能电网来处理汽车充电的高压充电区,此外还必须管理分布式储能的可用性,并适应整个电网的各种用电情况。


知名电网边缘软件公司 Utilidata 与 NVIDIA 合作,使用定制的 NVIDIA Jetson Orin 边缘 AI 模块,为电网边缘开发了分布式 AI 平台 Karman。这种嵌入电表的定制芯片和平台将每个电表转化为一个数据收集和控制终端,支持每秒处理数千个数据点。


Karman 处理来自电网边缘电表的实时高分辨率数据。这使公共事业公司能够在几秒钟内(而不是几分钟或几小时)详细了解电网状况,预测用电情况,并无缝整合分布式能源。此外,通过边缘设备上的推理模型,电网运营商可以预测并快速识别线路故障,以预测潜在的停电,并进行预防性维护,从而提高电网的可靠性。


通过集成 AI 和加速数据分析,Karman 帮助公共事业公司将现有的基础设施改造成高效的智能电网。这样即可实现量身定制、本地化的电力分配,以满足波动的用电需求,而无需大规模地升级实体基础设施,从而实现更具成本效益的电网现代化。


汽车制造商使自动驾驶汽车

更安全、更便捷


汽车厂商正在努力实现全自动驾驶。为此,车辆必须能够实时检测物体和进行导航。这就需要高速的数据处理,包括将摄像头、激光雷达、雷达和 GPS 的实时数据输入 AI 模型,以做出导航决策,确保道路安全。


自动驾驶的推理工作流非常复杂,包括多个 AI 模型以及必要的预处理和后处理步骤。传统上,这些步骤是在客户端使用 CPU 处理的。然而,这可能会导致处理速度出现重大瓶颈,对于快速处理等同于安全的应用来说是不可接受的缺点。


为了提高自动驾驶工作流的效率,智能电动汽车制造商蔚来将 NVIDIA Triton 推理服务器集成到其推理工作流中。NVIDIA Triton 是一款开源、多框架的推理服务软件。通过整合数据处理任务,蔚来在一些核心领域将延时降低至原来的 1/6,并将总体数据吞吐量提高最多达 5 倍。


蔚来以 GPU 为中心的方法使更新和部署全新 AI 模型变得更容易,并无需对车辆进行任何改动。此外,该公司还可以在同一组图像上同时使用多个 AI 模型,而无需通过网络来回发送数据,从而节省了数据传输成本并提高了性能。


通过使用加速的数据处理,自动驾驶汽车软件开发人员可确保他们能够达到高性能标准,以避免交通事故,降低运输成本,从而助力用户更好地出行。


零售商提升需求预测能力


在快节奏的零售环境中,快速处理和分析数据的能力对于调整库存水平、个性化客户互动和动态地优化定价策略至关重要。零售商的规模越大,销售的产品越多,其数据操作就越复杂,同时计算密集程度也更高。


世界上最大的零售商沃尔玛通过使用加速计算,显著地提高了对其 4500 个商店中 5 亿种商品组合的预测准确性。


随着现有的计算环境开始出现无法完成工作或产生不准确结果的问题,沃尔玛的数据科学团队构建了更强大的机器学习算法,以来应对这一巨大的预测挑战,他们发现,数据科学家必须从算法中删除一些特征,才能顺利运行。


为了改进预测,沃尔玛开始使用 NVIDIA GPU 和 RAPIDS。该公司现在使用的预测模型拥有 350 种数据特征,可以预测所有产品类别的销量情况,包括销售数据、促销活动以及影响需求的外部因素(如天气状况和超级碗等重大活动)。


先进的模型帮助沃尔玛将预测准确率从 94% 提高到 97%,同时消除了约 1 亿美元的生鲜产品浪费,减少了缺货和降价的情况。GPU 运行模型的速度也提高了 100 倍,只需 4 小时即可完成各项作业,而这在 CPU 环境中则花费数周的时间。


通过将数据密集型操作转移到 GPU 和加速计算,零售商可以降低成本和碳排放量,同时为消费者提供最适合的选择和更低的价格。


公共部门提高防灾能力


无人机和卫星拍摄了大量航空图像数据,公共和私营机构则使用这些数据来预测天气模式、追踪动物迁徙和观察环境变化。这些数据对研究和规划非常宝贵,可以帮助农业、灾害管理和应对气候变化等领域做出更加明智的决策。然而,如果缺乏特定的位置元数据,则这些图像发挥的价值可能会受到限制。


与 NVIDIA 合作的一家美国机构正在探索一种方法来自动确定缺少地理空间元数据的图像位置,这对搜救、应对自然灾害和监测环境等任务至关重要。然而,使用没有元数据的航空图像识别更大的区域内的一块小区域,这种挑战有如大海捞针。设计有助于地理定位的算法,必须解决图像光照的变化以及在不同时间、日期和角度拍摄图像所造成的差异。


为了识别无地理标记的航空图像,NVIDIA、Booz-Allen 公司和当地政府机构合作开发了一种解决方案,即通过使用计算机视觉算法从图像像素数据中提取信息,以解决图像相似性搜索问题。


在试图解决此问题时,一位 NVIDIA 解决方案架构师首先使用了基于 Python 的应用程序。最初在 CPU 上运行时,其处理时间超过 24 小时。而 GPU 可将处理时间压缩到仅几分钟,且并行执行数千个数据操作,而在 CPU 上只能执行少量操作。通过将应用程序代码转移到开源 GPU 加速库 CuPy 中,该应用程序惊人地提速了 180 万倍,在 67 微秒内就返回了结果。


借助可以在几分钟内处理大面积陆地图像和数据的解决方案,各个组织或机构就可以获得其所需的关键信息,从而更快、更有效地应对紧急情况,并积极主动地制定计划,从而有望挽救生命、保护环境。


加速 AI 计划,交付业务成果


使用加速计算进行数据处理的企业正在推进 AI 计划,以实现其在业内更高水平的创新并取得更好的成果。


加速计算可以更高效地处理大型数据集,更快地实现模型训练和精选的优化算法,并为实时 AI 解决方案提供更精确的结果。


与基于 CPU 的传统系统相比,使用加速计算的企业可以实现更高的性价比,并增强其向客户、员工和合作伙伴提供卓越结果和优质体验的能力。


点击 “阅读原文”了解加速计算如何帮助组织机构实现 AI 目标并推动创新。



扫描下方海报二维码,立即观看在 NVIDIA AI Summit 的精彩视频,了解生成式 AI、工业数字化、机器人、大语言模型等领域的行业领导者对 AI 的宝贵见解,探索 AI 时代的无限可能。


评论
  • 01. 什么是过程能力分析?过程能力研究利用生产过程中初始一批产品的数据,预测制造过程是否能够稳定地生产符合规格的产品。可以把它想象成一种预测。通过历史数据的分析,推断未来是否可以依赖该工艺持续生产高质量产品。客户可能会要求将过程能力研究作为生产件批准程序 (PPAP) 的一部分。这是为了确保制造过程能够持续稳定地生产合格的产品。02. 基本概念在定义制造过程时,目标是确保生产的零件符合上下规格限 (USL 和 LSL)。过程能力衡量制造过程能多大程度上稳定地生产符合规格的产品。核心概念很简单:
    优思学院 2025-01-12 15:43 520浏览
  • 流量传感器是实现对燃气、废气、生活用水、污水、冷却液、石油等各种流体流量精准计量的关键手段。但随着工业自动化、数字化、智能化与低碳化进程的不断加速,采用传统机械式检测方式的流量传感器已不能满足当代流体计量行业对于测量精度、测量范围、使用寿命与维护成本等方面的精细需求。流量传感器的应用场景(部分)超声波流量传感器,是一种利用超声波技术测量流体流量的新型传感器,其主要通过发射超声波信号并接收反射回来的信号,根据超声波在流体中传播的时间、幅度或相位变化等参数,间接计算流体的流量,具有非侵入式测量、高精
    华普微HOPERF 2025-01-13 14:18 482浏览
  •   在信号处理过程中,由于信号的时域截断会导致频谱扩展泄露现象。那么导致频谱泄露发生的根本原因是什么?又该采取什么样的改善方法。本文以ADC性能指标的测试场景为例,探讨了对ADC的输出结果进行非周期截断所带来的影响及问题总结。 两个点   为了更好的分析或处理信号,实际应用时需要从频域而非时域的角度观察原信号。但物理意义上只能直接获取信号的时域信息,为了得到信号的频域信息需要利用傅里叶变换这个工具计算出原信号的频谱函数。但对于计算机来说实现这种计算需要面对两个问题: 1.
    TIAN301 2025-01-14 14:15 108浏览
  • ARMv8-A是ARM公司为满足新需求而重新设计的一个架构,是近20年来ARM架构变动最大的一次。以下是对ARMv8-A的详细介绍: 1. 背景介绍    ARM公司最初并未涉足PC市场,其产品主要针对功耗敏感的移动设备。     随着技术的发展和市场需求的变化,ARM开始扩展到企业设备、服务器等领域,这要求其架构能够支持更大的内存和更复杂的计算任务。 2. 架构特点    ARMv8-A引入了Execution State(执行状
    丙丁先生 2025-01-12 10:30 466浏览
  • 食物浪费已成为全球亟待解决的严峻挑战,并对环境和经济造成了重大影响。最新统计数据显示,全球高达三分之一的粮食在生产过程中损失或被无谓浪费,这不仅导致了资源消耗,还加剧了温室气体排放,并带来了巨大经济损失。全球领先的光学解决方案供应商艾迈斯欧司朗(SIX:AMS)近日宣布,艾迈斯欧司朗基于AS7341多光谱传感器开发的创新应用来解决食物浪费这一全球性难题。其多光谱传感解决方案为农业与食品行业带来深远变革,该技术通过精确判定最佳收获时机,提升质量控制水平,并在整个供应链中有效减少浪费。 在2024
    艾迈斯欧司朗 2025-01-14 18:45 59浏览
  • 根据Global Info Research(环洋市场咨询)项目团队最新调研,预计2030年全球无人机电池和电源产值达到2834百万美元,2024-2030年期间年复合增长率CAGR为10.1%。 无人机电池是为无人机提供动力并使其飞行的关键。无人机使用的电池类型因无人机的大小和型号而异。一些常见的无人机电池类型包括锂聚合物(LiPo)电池、锂离子电池和镍氢(NiMH)电池。锂聚合物电池是最常用的无人机电池类型,因为其能量密度高、设计轻巧。这些电池以输出功率大、飞行时间长而著称。不过,它们需要
    GIRtina 2025-01-13 10:49 181浏览
  • 新年伊始,又到了对去年做总结,对今年做展望的时刻 不知道你在2024年初立的Flag都实现了吗? 2025年对自己又有什么新的期待呢? 2024年注定是不平凡的一年, 一年里我测评了50余块开发板, 写出了很多科普文章, 从一个小小的工作室成长为科工公司。 展望2025年, 中国香河英茂科工, 会继续深耕于,具身机器人、飞行器、物联网等方面的研发, 我觉得,要向未来学习未来, 未来是什么? 是掌握在孩子们生活中的发现,和精历, 把最好的技术带给孩子,
    丙丁先生 2025-01-11 11:35 457浏览
  • 随着数字化的不断推进,LED显示屏行业对4K、8K等超高清画质的需求日益提升。与此同时,Mini及Micro LED技术的日益成熟,推动了间距小于1.2 Pitch的Mini、Micro LED显示屏的快速发展。这类显示屏不仅画质卓越,而且尺寸适中,通常在110至1000英寸之间,非常适合应用于电影院、监控中心、大型会议、以及电影拍摄等多种室内场景。鉴于室内LED显示屏与用户距离较近,因此对于噪音控制、体积小型化、冗余备份能力及电气安全性的要求尤为严格。为满足这一市场需求,开关电源技术推出了专为
    晶台光耦 2025-01-13 10:42 498浏览
  • PNT、GNSS、GPS均是卫星定位和导航相关领域中的常见缩写词,他们经常会被用到,且在很多情况下会被等同使用或替换使用。我们会把定位导航功能测试叫做PNT性能测试,也会叫做GNSS性能测试。我们会把定位导航终端叫做GNSS模块,也会叫做GPS模块。但是实际上他们之间是有一些重要的区别。伴随着技术发展与越发深入,我们有必要对这三个词汇做以清晰的区分。一、什么是GPS?GPS是Global Positioning System(全球定位系统)的缩写,它是美国建立的全球卫星定位导航系统,是GNSS概
    德思特测试测量 2025-01-13 15:42 491浏览
  • 数字隔离芯片是现代电气工程师在进行电路设计时所必须考虑的一种电子元件,主要用于保护低压控制电路中敏感电子设备的稳定运行与操作人员的人身安全。其不仅能隔离两个或多个高低压回路之间的电气联系,还能防止漏电流、共模噪声与浪涌等干扰信号的传播,有效增强电路间信号传输的抗干扰能力,同时提升电子系统的电磁兼容性与通信稳定性。容耦隔离芯片的典型应用原理图值得一提的是,在电子电路中引入隔离措施会带来传输延迟、功耗增加、成本增加与尺寸增加等问题,而数字隔离芯片的目标就是尽可能消除这些不利影响,同时满足安全法规的要
    华普微HOPERF 2025-01-15 09:48 78浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦