借助小语言模型(SLM)降低延迟:NVIDIA首款设备端小语言模型如何让数字人栩栩如生

原创 英伟达NVIDIA中国 2024-08-27 19:50

Gamescom 2024,西山居游戏推出的“解限机(Mecha BREAK)”首次展示了采用设备端小语言模型 NVIDIA Nemotron-4 4B 的 ACE 技术,它使游戏角色提供更快、更准确的响应。



在 Gamescom 2024,NVIDIA 宣布 NVIDIA ACE 技术推出首款设备端小语言模型(SLM),由 RTX AI 提供本地支持。NVIDIA ACE 是一套利用生成式 AI 驱动的让数字人栩栩如生的技术。


这款小语言模型 Nemotron-4 4B Instruct,可提供更出色的角色扮演、检索增强生成(RAG)和功能调用能力,使游戏角色能更准确地理解玩家指令,回应玩家并做出更准确的相关操作。


此模型可作为 NVIDIA NIM 微服务供游戏开发者在云端和设备端进行部署。模型为低显存使用进行优化,可提供更快的响应速度,为开发者利用超过 1 亿台 GeForce RTX 驱动的 PC、笔记本电脑、RTX 工作站提供途径。


小语言模型(SLM)的优势


AI 模型的准确性和性能取决于用于训练的数据集的规模和质量。大语言模型使用大量数据进行训练,但通常是通用型的,包含的信息对于大多数用途来说都是多余的。


相反,小语言模型则专注于特定用例。因此,即使训练数据较少,这些模型也能提供更快、更准确的响应,这也是与数字人对话自如的关键要素。


Nemotron-4 4B 最初是从 Nemotron-4 15B 大语言模型中精炼出来的。这个过程需要小模型(类似“学生”)来模拟大模型(类似“老师”)的输出。在此过程中,学生模型的非关键输出会经过精简或删除,以减少模型的参数量。然后,SLM 会被量化,这会降低模型权重的精度。


与较大的 Nemotron-4 LLM 相比,Nemotron-4 4B 的参数更少,精度更低,显存占用率更低,并且生成第一个 Token 的时间(即响应开始的速度)更快,同时基于模型精炼仍然能够保持高准确性。其较小的显存占用也意味着集成 NIM 微服务的游戏和应用可以在 GeForce RTX AI PC 和笔记本电脑以及 NVIDIA RTX AI 工作站的本地运行。


这种经优化的全新小语言模型(SLM)还专门设计了指令微调功能,这是一种根据指令提示词对模型进行微调,使其更准确地执行特定任务的技术。这项技术在“解限机(Mecha BREAK)”游戏 Demo 中展示:玩家可以与机械师 NPC 交谈,指示其选择机甲或定制机甲涂装。


ACE 持续升级


ACE NIM 微服务使开发者可以通过云端或 RTX AI PC 和工作站部署先进的生成式 AI 模型,从而将 AI 引入他们的游戏和应用。通过 ACE NIM 微服务,非玩家角色 (NPC)可以在游戏中与玩家进行实时动态互动和对话。


ACE 由语音转文本、语言、文本转语音和面部动画的关键 AI 模型组成。它同样采用模块化构建,可让开发者为其特定流程中每个元素选择所需的 NIM 微服务。


NVIDIA Riva 自动语音识别(ASR)功能可处理用户的语音输入并利用 AI 实时提供非常准确的转录文本。该技术可利用 GPU 加速的多语种语音和翻译微服务,构建完全可定制的对话式 AI 工作流。其他支持 ASR 功能的还包括 Whisper 模型,这是一个开源神经网络,在英语语音识别拥有接近真人水平的鲁棒性和准确性。


翻译成数字化的文本后,转录内容就会进入 LLM(例如 Gemma、Llama 3 或如今推出的 NVIDIA Nemotron-4 4B),开始对用户原始语音输入生成响应。



接下来,Riva 的另一项技术“文本转语音”会生成音频响应。此外,ElevenLabs 专有 AI 语音和声音技术,已作为 ACE 的一部分在“解限机(Mecha BREAK)”中演示。


最后,NVIDIA Audio2Face(A2F)可生成面部表情,并与多种语言的对话同步。通过微服务,数字虚拟化身可以显示出逼真的动态情绪,这类情绪可以实时串流传输,也能在后期处理过程中烘焙。


AI 模型会自动生成面部、眼睛、嘴巴、舌头和头部动作的动画,并使这些动画与所选情绪范围和强度水平相匹配。A2F 还可以直接根据音频片段自动推断情绪。


最后,完整的角色或数字人会在渲染器(如虚幻引擎或 NVIDIA Omniverse 平台)中制作成动画。


NIM 提供迅捷 AI 体验


除了模块化支持 NVIDIA 驱动的 AI 模型以及第三方 AI 模型提外,ACE 还能让开发者在云端或 RTX AI PC 和工作站上本地运行每个模型的推理。


NVIDIA AI Inference Manager 软件开发套件允许根据经验、工作量和成本等各种需求进行混合推理。它通过为 PC 预先配置必要的 AI 模型、引擎和依赖项,为 PC 应用开发者简化了 AI 模型部署和集成。然后,应用和游戏可以将 PC 或工作站的推理和云端推理无缝结合。


ACE NIM 微服务可在 RTX AI PC 和工作站上本地运行,也可以在云端运行。目前本地运行的微服务包括 Covert Protocol 技术 Demo 中的 Audio2Face,以及“解限机(Mecha BREAK)”中的全新 Nemotron-4 4B Instruct 和 Whisper ASR。


创造更多可能


数字人远不止是游戏中的 NPC。在上个月的 SIGGRAPH 大会上,NVIDIA 为观众预览了一个可以通过调动情绪、展现幽默等不同方式与人类沟通的交互式数字人“James”。James 基于 ACE 的客户服务工作流设计。


前往 ai.nvidia.com 与 James 互动。


几十年来,人类与科技之间交流方式的变化最终促成数字人的诞生。未来的人机界面将是一张友好的面庞,并且无需物理输入。


数字人将推动更有趣和更自然的互动。Gartner 数据预测,到 2025 年,80% 的对话式产品将嵌入生成式 AI,75% 的面向客户的应用将具备情感对话式 AI。除游戏外,数字人还将改变多个行业和用例,包括客户服务、医疗健康、零售、远程呈现和机器人开发等领域。


用户现在即可前往 ai.nvidia.com 与 James 实时互动,一窥数字人技术的未来。



GTC 2025 内容征集现已开放点击“阅读原文”,或扫描下方海报二维码即可提交。明年 3 月,在圣何塞向全世界分享您的成就。

评论
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 164浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 156浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 123浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 189浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 105浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 118浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 65浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 68浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 502浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 76浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 184浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦