CES2025|NVIDIA推出面向RTXAIPC的AI基础模型

英伟达NVIDIA中国 2025-01-07 22:16


NVIDIA 今日发布能在 NVIDIA RTX™ AI PC 本地运行的基础模型,为数字人、内容创作、生产力和开发提供强大助力。


这些基础模型以 NVIDIA NIM™ 微服务的形式提供,由全新 GeForce RTX™ 50 系列 GPU 加速,提供最高可达 2375 AI TOPS 和 32GB 显存。基于 NVIDIA Blackwell 架构的 RTX 50 系列 GPU 是首批支持 FP4 计算精度的消费级 GPU。与上一代产品相比,AI 推理性能提升 2 倍,并让生成式 AI 模型在本地以更小的显存占用空间运行。


长期以来,GeForce™ 一直是 AI 开发者的重要平台。早在 2012 年,首个由 GPU 加速的深度学习网络 AlexNet 就是在 GeForce GTX 580 上进行训练的。在去年发表的 AI 研究论文中,超过 30% 都提及了对 GeForce RTX 的使用。


现如今,在生成式 AI 和 RTX AI PC 的助力下,任何人都能成为开发者。借助 AnythingLLM、ComfyUI 和 LangFlow 等新一代低代码和无代码工具,发烧友能够通过简单的图形用户界面(GUI)在复杂的工作流中使用 AI 模型。


连接到这些 GUI 的 NIM 微服务使获取和部署最新生成式 AI 模型轻而易举。NVIDIA AI Blueprint 基于 NIM 微服务构建,旨在为数字人、内容创作等应用提供易于使用的预配置参考工作流。


为满足 AI 开发者和发烧友日益增长的需求,领先 PC 制造商和系统集成商即将推出搭载 GeForce RTX 50 系列 GPU 且支持 NIM 的 RTX AI PC。


NVIDIA 创始人兼首席执行官黄仁勋表示,“AI 正在以光速发展,从感知式 AI 到生成式 AI,再到如今的代理式 AI。NIM 微服务和 AI Blueprint 为 PC 开发者和发烧友探索 AI 提供了基础模块。”


NIM 提供迅捷 AI 体验


基础模型,即使用海量原始数据训练而成的神经网络,是生成式 AI 的基础模块。


NVIDIA 将发布一系列来自包括 Black Forest Labs、Meta、Mistral 和 Stability AI 等顶尖模型开发者的适用于 RTX AI PC 的 NVIDIA NIM 微服务。涵盖大语言模型(LLM)、视觉语言模型、图像生成、语音、检索增强生成(RAG)的嵌入模型、PDF 提取和计算机视觉等应用场景。


Black Forest Labs 首席执行官 Robin Rombach 表示,“支持 FP4 计算精度的 GeForce RTX 50 系列 GPU 将使一大批此前仅适用于大型数据中心的模型得以在 PC 上运行。把 Flux 打造成 NVIDIA NIM 微服务,让更多用户以更快的速度部署和体验 AI,同时提供超乎想象的性能。”

NVIDIA 今天还宣布推出 Llama Nemotron,这是一系列开放许可的基础模型,能够在各类代理式任务中提供极高的精度。Llama Nemotron Nano 模型将作为面向 RTX AI PC 和工作站的 NIM 微服务提供,在指令遵循、工具调用、聊天、代码和数学等代理式 AI 任务方面表现出众。


NIM 微服务包含在 PC 上运行 AI 所需的关键组件,并针对 NVIDIA GPU 的部署进行优化,无论 GPU 在 RTX PC 、工作站,还是在云端。


开发者和发烧友将能快速下载这些 NIM 微服务,并可在带有适用于 Linux 的 Windows 子系统(WSL)的 Windows 11 PC 上设置和运行。


微软副总裁,Windows 业务负责人 Pavan Davuluri 表示:“AI 正在快速驱动 Windows 11 PC 创新,适用于 Linux 的 Windows 子系统(WSL)和 Windows Copilot Runtime 为 Windows 11 上的 AI 开发提供出色的跨平台环境。NVIDIA NIM 微服务为 Windows PC 提供优化,为开发者和发烧友提供可立即集成到其 Windows 应用中的 AI 模型,从而进一步加速 Windows 用户的 AI 功能部署。”


运行在 RTX AI PC 上的 NIM 微服务将兼容‌先进 AI 开发和智能体框架,包括 AI Toolkit for VSCode、AnythingLLM、ComfyUI、CrewAI、Flowise AI、LangChain、LangFlow 和 LM Studio。开发者可以通过行业标准端点,将基于上述框架构建的应用和工作流连接到运行 NIM 微服务的 AI 模型,无论在云端、数据中心、工作站还是 PC 上,都可通过统一的接口使用最新技术。


发烧友还可通过即将发布的 NVIDIA ChatRTX 技术 Demo 体验一系列 NIM 微服务。


让代理式 AI 拥有拟人表情


为了向 RTX 发烧友和开发者展示使用 NIM 微服务构建 AI 智能体和助手的方法,NVIDIA 今天首度公开 Project R2X。这是一款具有视觉能力的 PC 虚拟形象,它可以让用户需要的信息触手可及、协助用户使用桌面应用、进行视频会议、阅读和总结文档等。


该虚拟形象采用全新生成式 AI 算法 NVIDIA RTX Neural Faces 渲染而成,这种算法可利用完全生成的像素来增强传统光栅化渲染。然后,面部通过基于扩散原理的全新 NVIDIA Audio2Face™-3D 模型驱动动画,该模型可改善唇部和舌头动作。R2X 可以通过 CrewAI、Flowise AI 和 LangFlow 等开发者框架连接到 OpenAI 的 GPT 4o 或 xAI 的 Grok 等云端 AI 服务,以及 NIM 微服务和 AI Blueprint,如 PDF 检索器或其他 LLM。


AI Blueprint 即将登陆 PC


NIM 微服务还可通过 AI Blueprint(可在 RTX PC 上本地运行的参考 AI 工作流)供 PC 用户使用。借助这些蓝图,开发者能够基于 PDF 文档创建播客、生成由 3D 场景引导的令人惊艳的图像等。


将 PDF 转换为播客的蓝图可从 PDF 中提取文本、图像和表格,创建可供用户编辑的播客脚本。它还能根据此脚本,使用蓝图中提供的语音或基于用户的语音样本生成完整的音频录音。此外,用户还能与 AI 播客主持人进行实时对话,了解有关特定主题的更多信息。


该蓝图利用像 Mistral-Nemo-12B-Instruct 这样的 NIM 微服务来处理语言,借助 NVIDIA Riva 进行文本转语音和自动语音识别,以及使用 NeMo Retriever 微服务集合进行 PDF 提取。


使用由 3D 引导的生成式 AI Blueprint,艺术家能对图像生成进行更精细的控制。虽然 AI 可以通过简单的文本提示生成令人惊叹的图像,但仅使用文字控制图像的内容极具挑战。有了上述蓝图,创作者可以借助使用 Blender 等 3D 渲染器布置简单的 3D 物体来引导 AI 图像生成。艺术家可手动或使用 AI 生成创建 3D 资产,将其放置在场景中,并设置 3D viewport 相机。由 Flux NIM 微服务提供支持的预打包工作流将可以通过插件(例如 Blender 中由开发者 ACGGit 开发的 ComfyUI-BlenderAI-node)使用当前布景生成与 3D 场景相匹配的高质量图像。


NVIDIA NIM 微服务和 AI Blueprint 将从 2 月起开始提供,首发支持的硬件包含 GeForce RTX 50 系列、GeForce RTX 4090 和 4080 以及 NVIDIA RTX 6000 和 5000 GPU,未来还会陆续提供对其他 GPU 的支持。宏碁、华硕、戴尔、惠普、联想、微星、雷蛇将推出支持 NIM 的 RTX AI PC。



点击“阅读原文”扫描海报二维码,观看 NVIDIA CEO 黄仁勋在拉斯维加斯现场发表的 CES 开幕主题演讲精彩回放。


评论
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 330浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 272浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 597浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 204浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 180浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 178浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 106浏览
  • 故障现象 一辆2007款日产天籁车,搭载VQ23发动机(气缸编号如图1所示,点火顺序为1-2-3-4-5-6),累计行驶里程约为21万km。车主反映,该车起步加速时偶尔抖动,且行驶中加速无力。 图1 VQ23发动机的气缸编号 故障诊断接车后试车,发动机怠速运转平稳,但只要换挡起步,稍微踩下一点加速踏板,就能感觉到车身明显抖动。用故障检测仪检测,发动机控制模块(ECM)无故障代码存储,且无失火数据流。用虹科Pico汽车示波器测量气缸1点火信号(COP点火信号)和曲轴位置传感器信
    虹科Pico汽车示波器 2025-01-23 10:46 34浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 137浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 103浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 134浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 130浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦