为什么加速数据处理对各行各业的AI创新都至关重要

原创 英伟达NVIDIA中国 2024-07-03 19:46

在各行各业,AI 正在用机器驱动的计算来推动创新。在金融领域,银行正在使用 AI 更快地检测欺诈行为并确保账户安全;电信公司正在使用 AI 优化网络以提供优质服务;科学家正在使用 AI 开发治疗罕见病的新疗法;公共事业正在使用 AI 建设更清洁、更可靠的能源网络,汽车行业正在利用 AI 使自动驾驶汽车更安全、更便捷。



数据是各种大型 AI 用例的基础。有效且精确的 AI 模型需要使用广泛的数据集进行训练。企业要想利用 AI 的力量,就必须建立一个数据流,从各种来源提取数据,并将其转换成一致的格式并进行有效存储。


数据科学家通过多次实验完善数据集以微调 AI 模型,从而在真实应用中实现其最佳性能。从语音助手到个性化推荐系统,这些应用都需要快速处理大量数据,以保障实时性能。


随着 AI 模型变得越来越复杂,并开始处理文本、音频、图像和视频等各类数据,满足快速数据处理的需求变得更加关键。对于继续依赖传统 CPU 计算的机构而言,数据瓶颈、数据中心成本不断攀升和算力不足阻碍了其创新发展和性能提升。


许多企业正转向加速计算以将 AI 融入其业务运营中。这种方法充分利用 GPU、专用硬件、软件和并行计算技术,将计算性能提升最高达 150 倍,能效提升高达 42 倍。


各行各业的领先企业正在利用加速数据处理来实施其开创性的 AI 计划。


金融机构瞬间检测到欺诈行为


由于需要对大量交易数据进行快速分析,金融机构在检测欺诈方式时面临巨大挑战。此外,由于缺乏真实欺诈案例的标记数据,也给 AI 模型的训练造成了困难。在处理与欺诈检测相关的大量数据时,传统的数据科学工作流缺乏所需的加速能力。这导致数据处理缓慢,阻碍了实时数据分析和欺诈检测。


为了克服这些挑战,每年处理超过 80 亿笔交易的美国运通使用加速计算来训练和部署长短期记忆(LSTM)模型。这些模型用于顺序分析和异常检测,并能够适应新数据和从中学习,是打击欺诈的理想选择。


利用 GPU 上的并行计算技术,美国运通大幅加快了 LSTM 模型的训练速度。GPU 还使已经投入使用的模型能够处理大量交易数据,以进行高性能的计算,从而实时检测欺诈行为。


该系统可在低于两毫秒的延迟中运行,以更好地保护客户和商家,与基于 CPU 的配置相比性能提高了 50 倍。通过将加速的 LSTM 深度神经网络与其现有方法相结合,美国运通在特定领域的欺诈检测准确率提高了 6%。


金融公司还可以使用加速计算来降低数据处理成本。通过在 NVIDIA GPU 上运行涉及大量数据的 Spark3 工作负载,PayPal 证实了其有望将大数据处理和 AI 应用的云成本降低 70%。


通过更高效地处理数据,金融机构可以实时检测欺诈行为,从而在不干扰交易流的情况下更快决策,并将财务损失的风险降至最低。


电信公司简化复杂的人员调派


电信公司的各项业务产生了海量数据,包括网络设备、客户交互、计费系统以及网络性能和维护。


每天处理数百 PB 数据的全国性网络需要进行复杂的技术人员调派,以确保服务。为了优化技术人员调度,先进的调派引擎需要执行数万亿次计算,并充分考虑天气、技术人员技能、客户需求和车队分布等因素。这些操作的成功取决于细致的数据准备和充足的算力。


AT&T 拥有美国最大的现场调度服务团队之一。该公司正在通过 NVIDIA cuOpt 改善数据密集型人员调派,依靠启发式、元启发式和优化来计算复杂的车辆调派问题。


在早期试验中,cuOpt 在 10 秒内就提供了调派解决方案,将云计算成本降低了 90%,这使技术人员每天能够完成更多的服务呼叫。NVIDIA RAPIDS 是一套能够加速数据科学和分析数据流的软件库,它进一步加速了 cuOpt,使企业能够集成 本地搜索启发式算法和元启发式算法(如 Tabu 搜索),以持续地优化人员调派。


AT&T 正在采用 NVIDIA RAPIDS Accelerator for Apache Spark,以增强基于 Spark 的 AI 和数据流的性能。这有助于该公司从训练 AI 模型到保持网络质量,再到减少客户流失和改进欺诈检测的运营效率全方位提升。通过 RAPIDS 加速器,AT&T 正在减少目标工作负载的云计算支出,同时实现更高的性能并减少碳排放量。


基于电信公司对提高运营效率同时提供高质量服务的需求,加速数据流的传输和处理将至关重要。


生物医学研究人员缩短新药研发时间


研究人员对人类基因组中大约 25000 个基因进行了研究,以了解它们与疾病之间存在何种关系,这使得医学数据和同行评审的研究论文数量激增。生物医学研究人员依靠这些论文来缩小开发新疗法的研究范围。然而,对数量如此庞大且仍在不断增加的相关研究进行文献综述,已成为一项不可能完成的任务。


领先的制药公司阿斯利康开发了一个生物学洞察知识图谱(BIKG),从文献综述到筛选命中率评级、靶点识别等整个药物发现过程为科学家提供帮助。该图谱将公共和内部数据库与科学文献中的信息进行整合,模拟了 1000 万至 10 亿种复杂的生物关系。


BIKG 已被有效地用于基因排序,帮助科学家假设高潜力靶点以研发新疗法。在今年的 NVIDIA GTC 上,阿斯利康团队介绍了一个项目,该项目成功识别了与肺癌治疗耐药性相关的基因。


为了缩小潜在基因的范围,数据科学家和生物学研究人员共同定义了相关标准和基因特征,以确定理想的开发疗法靶点。他们训练了一种机器学习算法,在 BIKG 数据库中搜索具有文献中提到的可治疗基因的特征。通过利用 NVIDIA RAPIDS 来加快计算速度,该团队将初始基因库从 3000 个减少到仅仅 40 个目标基因,以前完成这项任务需要耗时几个月,但现在只需要几秒钟。


通过用加速计算和 AI 助力药物研发,制药公司和研究人员最终可以利用医学领域积累的大量数据,更快、更安全地开发新药,帮助挽救生命。


公共事业公司创造清洁能源的未来


能源部门正大力推动碳中和能源转型。在过去的 10 年里,随着太阳能等可再生能源的使用成本大幅下降,清洁能源未来的实现取得了重大的进展。


然而,在整合来自风力发电厂、太阳能发电厂和家用电池的清洁能源时,电网管理面临着新的复杂性考验。在能源基础设施多元化并且需要双向输电的情况下,电网管理变得更加数据密集化。因此,现在需要新的智能电网来处理汽车充电的高压充电区,此外还必须管理分布式储能的可用性,并适应整个电网的各种用电情况。


知名电网边缘软件公司 Utilidata 与 NVIDIA 合作,使用定制的 NVIDIA Jetson Orin 边缘 AI 模块,为电网边缘开发了分布式 AI 平台 Karman。这种嵌入电表的定制芯片和平台将每个电表转化为一个数据收集和控制终端,支持每秒处理数千个数据点。


Karman 处理来自电网边缘电表的实时高分辨率数据。这使公共事业公司能够在几秒钟内(而不是几分钟或几小时)详细了解电网状况,预测用电情况,并无缝整合分布式能源。此外,通过边缘设备上的推理模型,电网运营商可以预测并快速识别线路故障,以预测潜在的停电,并进行预防性维护,从而提高电网的可靠性。


通过集成 AI 和加速数据分析,Karman 帮助公共事业公司将现有的基础设施改造成高效的智能电网。这样即可实现量身定制、本地化的电力分配,以满足波动的用电需求,而无需大规模地升级实体基础设施,从而实现更具成本效益的电网现代化。


汽车制造商使自动驾驶汽车

更安全、更便捷


汽车厂商正在努力实现全自动驾驶。为此,车辆必须能够实时检测物体和进行导航。这就需要高速的数据处理,包括将摄像头、激光雷达、雷达和 GPS 的实时数据输入 AI 模型,以做出导航决策,确保道路安全。


自动驾驶的推理工作流非常复杂,包括多个 AI 模型以及必要的预处理和后处理步骤。传统上,这些步骤是在客户端使用 CPU 处理的。然而,这可能会导致处理速度出现重大瓶颈,对于快速处理等同于安全的应用来说是不可接受的缺点。


为了提高自动驾驶工作流的效率,智能电动汽车制造商蔚来将 NVIDIA Triton 推理服务器集成到其推理工作流中。NVIDIA Triton 是一款开源、多框架的推理服务软件。通过整合数据处理任务,蔚来在一些核心领域将延时降低至原来的 1/6,并将总体数据吞吐量提高最多达 5 倍。


蔚来以 GPU 为中心的方法使更新和部署全新 AI 模型变得更容易,并无需对车辆进行任何改动。此外,该公司还可以在同一组图像上同时使用多个 AI 模型,而无需通过网络来回发送数据,从而节省了数据传输成本并提高了性能。


通过使用加速的数据处理,自动驾驶汽车软件开发人员可确保他们能够达到高性能标准,以避免交通事故,降低运输成本,从而助力用户更好地出行。


零售商提升需求预测能力


在快节奏的零售环境中,快速处理和分析数据的能力对于调整库存水平、个性化客户互动和动态地优化定价策略至关重要。零售商的规模越大,销售的产品越多,其数据操作就越复杂,同时计算密集程度也更高。


世界上最大的零售商沃尔玛通过使用加速计算,显著地提高了对其 4500 个商店中 5 亿种商品组合的预测准确性。


随着现有的计算环境开始出现无法完成工作或产生不准确结果的问题,沃尔玛的数据科学团队构建了更强大的机器学习算法,以来应对这一巨大的预测挑战,他们发现,数据科学家必须从算法中删除一些特征,才能顺利运行。


为了改进预测,沃尔玛开始使用 NVIDIA GPU 和 RAPIDS。该公司现在使用的预测模型拥有 350 种数据特征,可以预测所有产品类别的销量情况,包括销售数据、促销活动以及影响需求的外部因素(如天气状况和超级碗等重大活动)。


先进的模型帮助沃尔玛将预测准确率从 94% 提高到 97%,同时消除了约 1 亿美元的生鲜产品浪费,减少了缺货和降价的情况。GPU 运行模型的速度也提高了 100 倍,只需 4 小时即可完成各项作业,而这在 CPU 环境中则花费数周的时间。


通过将数据密集型操作转移到 GPU 和加速计算,零售商可以降低成本和碳排放量,同时为消费者提供最适合的选择和更低的价格。


公共部门提高防灾能力


无人机和卫星拍摄了大量航空图像数据,公共和私营机构则使用这些数据来预测天气模式、追踪动物迁徙和观察环境变化。这些数据对研究和规划非常宝贵,可以帮助农业、灾害管理和应对气候变化等领域做出更加明智的决策。然而,如果缺乏特定的位置元数据,则这些图像发挥的价值可能会受到限制。


与 NVIDIA 合作的一家美国机构正在探索一种方法来自动确定缺少地理空间元数据的图像位置,这对搜救、应对自然灾害和监测环境等任务至关重要。然而,使用没有元数据的航空图像识别更大的区域内的一块小区域,这种挑战有如大海捞针。设计有助于地理定位的算法,必须解决图像光照的变化以及在不同时间、日期和角度拍摄图像所造成的差异。


为了识别无地理标记的航空图像,NVIDIA、Booz-Allen 公司和当地政府机构合作开发了一种解决方案,即通过使用计算机视觉算法从图像像素数据中提取信息,以解决图像相似性搜索问题。


在试图解决此问题时,一位 NVIDIA 解决方案架构师首先使用了基于 Python 的应用程序。最初在 CPU 上运行时,其处理时间超过 24 小时。而 GPU 可将处理时间压缩到仅几分钟,且并行执行数千个数据操作,而在 CPU 上只能执行少量操作。通过将应用程序代码转移到开源 GPU 加速库 CuPy 中,该应用程序惊人地提速了 180 万倍,在 67 微秒内就返回了结果。


借助可以在几分钟内处理大面积陆地图像和数据的解决方案,各个组织或机构就可以获得其所需的关键信息,从而更快、更有效地应对紧急情况,并积极主动地制定计划,从而有望挽救生命、保护环境。


加速 AI 计划,交付业务成果


使用加速计算进行数据处理的企业正在推进 AI 计划,以实现其在业内更高水平的创新并取得更好的成果。


加速计算可以更高效地处理大型数据集,更快地实现模型训练和精选的优化算法,并为实时 AI 解决方案提供更精确的结果。


与基于 CPU 的传统系统相比,使用加速计算的企业可以实现更高的性价比,并增强其向客户、员工和合作伙伴提供卓越结果和优质体验的能力。


点击 “阅读原文”了解加速计算如何帮助组织机构实现 AI 目标并推动创新。



扫描下方海报二维码,立即观看在 NVIDIA AI Summit 的精彩视频,了解生成式 AI、工业数字化、机器人、大语言模型等领域的行业领导者对 AI 的宝贵见解,探索 AI 时代的无限可能。


评论
  • 一、SAE J1939协议概述SAE J1939协议是由美国汽车工程师协会(SAE,Society of Automotive Engineers)定义的一种用于重型车辆和工业设备中的通信协议,主要应用于车辆和设备之间的实时数据交换。J1939基于CAN(Controller Area Network)总线技术,使用29bit的扩展标识符和扩展数据帧,CAN通信速率为250Kbps,用于车载电子控制单元(ECU)之间的通信和控制。小北同学在之前也对J1939协议做过扫盲科普【科普系列】SAE J
    北汇信息 2024-12-11 15:45 99浏览
  • 近日,搭载紫光展锐W517芯片平台的INMO GO2由影目科技正式推出。作为全球首款专为商务场景设计的智能翻译眼镜,INMO GO2 以“快、准、稳”三大核心优势,突破传统翻译产品局限,为全球商务人士带来高效、自然、稳定的跨语言交流体验。 INMO GO2内置的W517芯片,是紫光展锐4G旗舰级智能穿戴平台,采用四核处理器,具有高性能、低功耗的优势,内置超微高集成技术,采用先进工艺,计算能力相比同档位竞品提升4倍,强大的性能提供更加多样化的应用场景。【视频见P盘链接】 依托“
    紫光展锐 2024-12-11 11:50 62浏览
  • 全球知名半导体制造商ROHM Co., Ltd.(以下简称“罗姆”)宣布与Taiwan Semiconductor Manufacturing Company Limited(以下简称“台积公司”)就车载氮化镓功率器件的开发和量产事宜建立战略合作伙伴关系。通过该合作关系,双方将致力于将罗姆的氮化镓器件开发技术与台积公司业界先进的GaN-on-Silicon工艺技术优势结合起来,满足市场对高耐压和高频特性优异的功率元器件日益增长的需求。氮化镓功率器件目前主要被用于AC适配器和服务器电源等消费电子和
    电子资讯报 2024-12-10 17:09 92浏览
  • 在智能化技术快速发展当下,图像数据的采集与处理逐渐成为自动驾驶、工业等领域的一项关键技术。高质量的图像数据采集与算法集成测试都是确保系统性能和可靠性的关键。随着技术的不断进步,对于图像数据的采集、处理和分析的需求日益增长,这不仅要求我们拥有高性能的相机硬件,还要求我们能够高效地集成和测试各种算法。我们探索了一种多源相机数据采集与算法集成测试方案,能够满足不同应用场景下对图像采集和算法测试的多样化需求,确保数据的准确性和算法的有效性。一、相机组成相机一般由镜头(Lens),图像传感器(Image
    康谋 2024-12-12 09:45 53浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-11 17:58 69浏览
  • 天问Block和Mixly是两个不同的编程工具,分别在单片机开发和教育编程领域有各自的应用。以下是对它们的详细比较: 基本定义 天问Block:天问Block是一个基于区块链技术的数字身份验证和数据交换平台。它的目标是为用户提供一个安全、去中心化、可信任的数字身份验证和数据交换解决方案。 Mixly:Mixly是一款由北京师范大学教育学部创客教育实验室开发的图形化编程软件,旨在为初学者提供一个易于学习和使用的Arduino编程环境。 主要功能 天问Block:支持STC全系列8位单片机,32位
    丙丁先生 2024-12-11 13:15 57浏览
  • RK3506 是瑞芯微推出的MPU产品,芯片制程为22nm,定位于轻量级、低成本解决方案。该MPU具有低功耗、外设接口丰富、实时性高的特点,适合用多种工商业场景。本文将基于RK3506的设计特点,为大家分析其应用场景。RK3506核心板主要分为三个型号,各型号间的区别如下图:​图 1  RK3506核心板处理器型号场景1:显示HMIRK3506核心板显示接口支持RGB、MIPI、QSPI输出,且支持2D图形加速,轻松运行QT、LVGL等GUI,最快3S内开
    万象奥科 2024-12-11 15:42 80浏览
  • 首先在gitee上打个广告:ad5d2f3b647444a88b6f7f9555fd681f.mp4 · 丙丁先生/香河英茂工作室中国 - Gitee.com丙丁先生 (mr-bingding) - Gitee.com2024年对我来说是充满挑战和机遇的一年。在这一年里,我不仅进行了多个开发板的测评,还尝试了多种不同的项目和技术。今天,我想分享一下这一年的故事,希望能给大家带来一些启发和乐趣。 年初的时候,我开始对各种开发板进行测评。从STM32WBA55CG到瑞萨、平头哥和平海的开发板,我都
    丙丁先生 2024-12-11 20:14 56浏览
  • 时源芯微——RE超标整机定位与解决详细流程一、 初步测量与问题确认使用专业的电磁辐射测量设备,对整机的辐射发射进行精确测量。确认是否存在RE超标问题,并记录超标频段和幅度。二、电缆检查与处理若存在信号电缆:步骤一:拔掉所有信号电缆,仅保留电源线,再次测量整机的辐射发射。若测量合格:判定问题出在信号电缆上,可能是电缆的共模电流导致。逐一连接信号电缆,每次连接后测量,定位具体哪根电缆或接口导致超标。对问题电缆进行处理,如加共模扼流圈、滤波器,或优化电缆布局和屏蔽。重新连接所有电缆,再次测量
    时源芯微 2024-12-11 17:11 99浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-10 16:13 113浏览
  • 铁氧体芯片是一种基于铁氧体磁性材料制成的芯片,在通信、传感器、储能等领域有着广泛的应用。铁氧体磁性材料能够通过外加磁场调控其导电性质和反射性质,因此在信号处理和传感器技术方面有着独特的优势。以下是对半导体划片机在铁氧体划切领域应用的详细阐述: 一、半导体划片机的工作原理与特点半导体划片机是一种使用刀片或通过激光等方式高精度切割被加工物的装置,是半导体后道封测中晶圆切割和WLP切割环节的关键设备。它结合了水气电、空气静压高速主轴、精密机械传动、传感器及自动化控制等先进技术,具有高精度、高
    博捷芯划片机 2024-12-12 09:16 67浏览
  • 我的一台很多年前人家不要了的九十年代SONY台式组合音响,接手时只有CD功能不行了,因为不需要,也就没修,只使用收音机、磁带机和外接信号功能就够了。最近五年在外地,就断电闲置,没使用了。今年9月回到家里,就一个劲儿地忙着收拾家当,忙了一个多月,太多事啦!修了电气,清理了闲置不用了的电器和电子,就是一个劲儿地扔扔扔!几十年的“工匠式”收留收藏,只能断舍离,拆解不过来的了。一天,忽然感觉室内有股臭味,用鼻子的嗅觉功能朝着臭味重的方向寻找,觉得应该就是这台组合音响?怎么会呢?这无机物的东西不会腐臭吧?
    自做自受 2024-12-10 16:34 153浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦