NIM让不可能成为可能:解码用于加速生成式AI的微服务

英伟达NVIDIA中国 2024-08-16 17:15

在快速发展的人工智能领域中,生成式 AI 正在激发人们的想象力并变革各行各业。使这一切成为可能的是一位默默无闻的幕后英雄:微服务架构。


现代 AI 应用的基础模组


微服务已成为一种强大的架构,从根本上改变了人们设计、构建和部署软件的方式。


微服务架构可将应用分解为一系列可独立部署的松散耦合服务。每个服务都负责一项特定的功能,并通过明确定义的应用编程接口(API)与其他服务通信。这种模块化方法与传统的一体化架构形成了鲜明的对比。在传统的一体化架构中,所有功能都会捆绑至单个紧密集成的应用中。


解除各个服务之间的耦合后,团队可以同时处理不同的组件,进而加速开发流程。同时,团队还能针对各个服务单独推出更新,避免对整个应用造成影响。开发者可以专注于构建和改进特定服务,进而提高代码质量并加快解决问题的速度。这种专业化开发让开发者能够成为其特定领域的专家。


服务可以根据需求独立扩展,从而优化资源利用率并提高系统的整体性能。此外,不同的服务可以使用不同的技术,这让开发者能够为各个特定任务选择最合适的工具。


完美搭配:微服务与生成式 AI


微服务架构具有可扩展性、增强的模块化属性和灵活性,因而特别适用于开发生成式 AI 应用。


AI 模型(尤其是大语言模型)需要用到大量的计算资源。微服务能够让这些资源密集型组件实现高效扩展,同时避免对整个系统产生影响。


生成式 AI 应用通常涉及多个步骤,例如数据预处理、模型推理和后处理。借助微服务,每个步骤都可以独立开发、优化和扩展。此外,随着 AI 模型和技术的快速发展,微服务架构可使集成新模型及替换现有模型的过程变得更加轻松,同时不会中断整个应用的运行。


NVIDIA NIM:简化生成式 AI 部署


随着人们对 AI 赋能应用的需求不断增长,开发者在有效部署和管理 AI 模型方面面临着挑战。


NVIDIA NIM 推理微服务可将模型作为经优化的容器提供,以便在云端、数据中心、工作站、台式电脑和笔记本电脑中部署这些模型。每个 NIM 容器都包含经过预训练的 AI 模型和所有必要的运行时组件,可让用户轻松地将 AI 功能集成到应用中。


NIM 可简化集成过程,且兼具生产就绪性和灵活性,为希望引入 AI 功能的应用开发者提供了一种具有变革性的开发方法。开发者可以专注于构建应用,而无需担心数据准备、模型训练或自定义会过于复杂,这是因为 NIM 推理微服务针对性能进行了优化,自带运行时优化,还支持行业标准 API。


触手可及的 AI:

工作站和 PC 上的 NVIDIA NIM


构建企业级生成式 AI 应用面临着诸多挑战。虽然云托管模型 API 可以帮助开发者着手进行开发,但与数据隐私、安全性、模型响应延迟、准确性、API 成本和扩展相关的问题往往会阻碍应用投入生产环境。


在支持 NIM 的工作站上,开发者可以安全访问各种模型和经过性能优化的推理微服务。


通过消除与云托管 API 相关的延迟、成本和合规性问题并降低模型部署的复杂性,开发者可以专注于应用开发,进而加速生产就绪型生成式 AI 应用的交付,并在数据中心和云端实现流畅的自动扩展及性能优化。


最近宣布可作为 NIM 的 Meta Llama 3 8B 模型正式版可以在 RTX 系统上本地运行,为个人开发者提供先进的语言模型功能,使其无需云资源的支持即可进行本地测试和实验。借助本地运行的 NIM,开发者可以直接在其工作站上创建复杂的检索增强生成(RAG)项目。


本地 RAG 是指完全在本地硬件上部署的 RAG 系统,这种 RAG 不依赖基于云的服务或外部 API。


开发者可以在配备一个或多个 NVIDIA RTX 专业旗舰级 GPU 的工作站或 NVIDIA RTX 系统上使用 Llama 3 8B NIM,完全立足于本地硬件构建端到端 RAG 系统。这种设置让开发者能够充分利用 Llama 3 8B 的强大功能,以确保获得高性能和低延迟。


通过在本地运行整个 RAG 工作流,开发者可以始终保持对其数据的完全掌控,以确保隐私和安全。如果开发者正在构建的应用需要做到实时响应,同时还需兼具高准确性(例如客户支持聊天机器人、个性化内容生成工具和交互式虚拟助手),那么对于开发者来说,上述方法特别有用。


混合式 RAG 可结合本地和基于云的资源来优化 AI 应用的性能和灵活性。借助 NVIDIA AI Workbench,开发者可以开始使用混合式 RAG Workbench 项目,这是一个示例应用,可提供灵活的资源分配方法,既能用于在本地运行向量数据库和嵌入模型,又能用于在云端或数据中心使用 NIM 执行推理。


开发者可借助这种混合式设置平衡本地和云资源之间的计算负载,以便优化性能和降低成本。例如,向量数据库和嵌入模型可以托管在本地工作站,以确保实现快速的数据检索和处理,而计算强度更大的推理任务则可以分流至基于云的强大 NIM 推理微服务。这种灵活性让开发者能够流畅地扩展应用,以适应不同水平的工作负载,同时确保性能始终都能保持在同一水平。


借助在 RTX PC 和工作站上运行的生成式 AI,NVIDIA ACE NIM 推理微服务可创建栩栩如生的数字人、AI 非玩家角色(NPC)和用于客户服务的交互式虚拟形象。


ACE NIM 语音推理微服务(包括 Riva 自动语音识别、文本转语音和神经网络机器翻译)可提供准确的转录、翻译和逼真的声音。


NVIDIA Nemotron 小型语言模型是一种智能 NIM,其中包含用于尽可能减少内存使用量的 INT4 量化功能。此外,它还支持角色扮演和 RAG 用例。


而 ACE NIM 外观推理微服务则包括 Audio2Face 和 Omniverse RTX,可用于创建栩栩如生的超逼真动画视觉效果。这有助于提供更具吸引力的游戏角色,为玩家带来更加优秀的沉浸式体验;还能在用户与虚拟客服人员互动时,提供更加令人满意的体验。


深入探究 NIM


随着 AI 的不断发展,快速部署并扩展 AI 功能的能力将变得越来越重要。


NVIDIA NIM 微服务可助力实现突破性创新,为 AI 应用开发的新时代奠定了基础。无论是构建新一代 AI 赋能游戏、开发先进的自然语言处理应用,还是创建智能自动化系统,用户都可以使用这些触手可及的强大开发工具。


如何开始使用:


  • 前往 ai.nvidia.com 体验 NVIDIA NIM 微服务并与之交互。

  • 加入 NVIDIA 开发者计划,以便免费访问 NIM,并将其用于 AI 赋能应用的测试和原型设计。

  • 购买 NVIDIA AI Enterprise 许可证(带有为期 90 天的免费生产部署评估期),并使用 NVIDIA NIM 在云端或数据中心部署自托管 AI 模型。



点击“阅读原文”,或扫描下方海报二维码,观看 NVIDIA 创始人兼 CEO 黄仁勋和 Meta 创始人兼 CEO 马克·扎克伯格在 SIGGRAPH 2024 上就 AI 领域新突破进行的炉边谈话。

评论
  • 【工程师故事】+半年的经历依然忧伤,带着焦虑和绝望  对于一个企业来说,赚钱才是第一位的,对于一个人来说,赚钱也是第一位的。因为企业要活下去,因为个人也要活下去。企业打不了倒闭。个人还是要吃饭的。企业倒闭了,打不了从头再来。个人失业了,面对的不仅是房贷车贷和教育,还有找工作的焦虑。企业说,一个公司倒闭了,说明不了什么,这是正常的一个现象。个人说,一个中年男人失业了,面对的压力太大了,焦虑会摧毁你的一切。企业说,是个公司倒闭了,也不是什么大的问题,只不过是这些公司经营有问题吧。
    curton 2025-01-02 23:08 289浏览
  • 光耦合器,也称为光隔离器,是一种利用光在两个隔离电路之间传输电信号的组件。在医疗领域,确保患者安全和设备可靠性至关重要。在众多有助于医疗设备安全性和效率的组件中,光耦合器起着至关重要的作用。这些紧凑型设备经常被忽视,但对于隔离高压和防止敏感医疗设备中的电气危害却是必不可少的。本文深入探讨了光耦合器的功能、其在医疗应用中的重要性以及其实际使用示例。什么是光耦合器?它通常由以下部分组成:LED(发光二极管):将电信号转换为光。光电探测器(例如光电晶体管):检测光并将其转换回电信号。这种布置确保输入和
    腾恩科技-彭工 2025-01-03 16:27 155浏览
  • 本文继续介绍Linux系统查看硬件配置及常用调试命令,方便开发者快速了解开发板硬件信息及进行相关调试。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。查看系统版本信息查看操作系统版本信息root@ido:/# cat /etc/*releaseDISTRIB_ID=UbuntuDISTRIB_RELEASE=20.04DISTRIB_CODENAME=focalDIS
    Industio_触觉智能 2025-01-03 11:37 137浏览
  • 在快速发展的能源领域,发电厂是发电的支柱,效率和安全性至关重要。在这种背景下,国产数字隔离器已成为现代化和优化发电厂运营的重要组成部分。本文探讨了这些设备在提高性能方面的重要性,同时展示了中国在生产可靠且具有成本效益的数字隔离器方面的进步。什么是数字隔离器?数字隔离器充当屏障,在电气上将系统的不同部分隔离开来,同时允许无缝数据传输。在发电厂中,它们保护敏感的控制电路免受高压尖峰的影响,确保准确的信号处理,并在恶劣条件下保持系统完整性。中国国产数字隔离器经历了重大创新,在许多方面达到甚至超过了全球
    克里雅半导体科技 2025-01-03 16:10 117浏览
  • Matter加持:新世代串流装置如何改变智能家居体验?随着现在智能家庭快速成长,串流装置(Streaming Device,以下简称Streaming Device)除了提供更卓越的影音体验,越来越多厂商开始推出支持Matter标准的串流产品,使其能作为智能家庭中枢,连结多种智能家电。消费者可以透过Matter的功能执行多样化功能,例如:开关灯、控制窗帘、对讲机开门,以及操作所有支持Matter的智能家电。此外,再搭配语音遥控器与语音助理,打造出一个更加智能、便捷的居家生活。支持Matter协议
    百佳泰测试实验室 2025-01-03 10:29 140浏览
  • 在测试XTS时会遇到修改产品属性、SElinux权限、等一些内容,修改源码再编译很费时。今天为大家介绍一个便捷的方法,让OpenHarmony通过挂载镜像来修改镜像内容!触觉智能Purple Pi OH鸿蒙开发板演示。搭载了瑞芯微RK3566四核处理器,树莓派卡片电脑设计,支持开源鸿蒙OpenHarmony3.2-5.0系统,适合鸿蒙开发入门学习。挂载镜像首先,将要修改内容的镜像传入虚拟机当中,并创建一个要挂载镜像的文件夹,如下图:之后通过挂载命令将system.img镜像挂载到sys
    Industio_触觉智能 2025-01-03 11:39 113浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 159浏览
  • 国际标准IPC 标准:IPC-A-600:规定了印刷电路板制造过程中的质量要求和验收标准,涵盖材料、外观、尺寸、焊接、表面处理等方面。IPC-2221/2222:IPC-2221 提供了用于设计印刷电路板的一般原则和要求,IPC-2222 则针对高可靠性电子产品的设计提供了进一步的指导。IPC-6012:详细定义了刚性基板和柔性基板的要求,包括材料、工艺、尺寸、层次结构、特征等。IPC-4101:定义了印刷电路板的基板材料的物理和电气特性。IPC-7351:提供了元件封装的设计规范,包括封装尺寸
    Jeffreyzhang123 2025-01-02 16:50 198浏览
  • 物联网(IoT)的快速发展彻底改变了从智能家居到工业自动化等各个行业。由于物联网系统需要高效、可靠且紧凑的组件来处理众多传感器、执行器和通信设备,国产固态继电器(SSR)已成为满足中国这些需求的关键解决方案。本文探讨了国产SSR如何满足物联网应用的需求,重点介绍了它们的优势、技术能力以及在现实场景中的应用。了解物联网中的固态继电器固态继电器是一种电子开关设备,它使用半导体而不是机械触点来控制负载。与传统的机械继电器不同,固态继电器具有以下优势:快速切换:确保精确快速的响应,这对于实时物联网系统至
    克里雅半导体科技 2025-01-03 16:11 162浏览
  • 车身域是指负责管理和控制汽车车身相关功能的一个功能域,在汽车域控系统中起着至关重要的作用。它涵盖了车门、车窗、车灯、雨刮器等各种与车身相关的功能模块。与汽车电子电气架构升级相一致,车身域发展亦可以划分为三个阶段,功能集成愈加丰富:第一阶段为分布式架构:对应BCM车身控制模块,包含灯光、雨刮、门窗等传统车身控制功能。第二阶段为域集中架构:对应BDC/CEM域控制器,在BCM基础上集成网关、PEPS等。第三阶段为SOA理念下的中央集中架构:VIU/ZCU区域控制器,在BDC/CEM基础上集成VCU、
    北汇信息 2025-01-03 16:01 173浏览
  • 影像质量应用于多个不同领域,无论是在娱乐、医疗或工业应用中,高质量的影像都是决策的关键基础。清晰的影像不仅能提升观看体验,还能保证关键细节的准确传达,例如:在医学影像中,它对诊断结果有着直接的影响!不仅如此,影像质量还影响了:▶ 压缩技术▶ 存储需求▶ 传输效率随着技术进步,影像质量的标准不断提高,对于研究与开发领域,理解并提升影像质量已成为不可忽视的重要课题。在图像处理的过程中,硬件与软件除了各自扮演着不可或缺的基础角色,有效地协作能够确保图像处理过程既高效又具有优异的质量。软硬件各扮演了什么
    百佳泰测试实验室 2025-01-03 10:39 136浏览
  • 前言近年来,随着汽车工业的快速发展,尤其是新能源汽车与智能汽车领域的崛起,汽车安全标准和认证要求日益严格,应用范围愈加广泛。ISO 26262和ISO 21448作为两个重要的汽车安全标准,它们在“系统安全”中扮演的角色各自不同,但又有一定交集。在智能网联汽车的高级辅助驾驶系统(ADAS)应用中,理解这两个标准的区别及其相互关系,对于保障车辆的安全性至关重要。ISO 26262:汽车功能安全的基石如图2.1所示,ISO 26262对“功能安全”的定义解释为:不存在由于电子/电气系统失效引起的危害
    广电计量 2025-01-02 17:18 218浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦