刚才的CES主题演讲中,黄仁勋发布一款与众不同的“AI PC”,但它似乎又不是个PC...

感觉现在NVIDIA在各类顶会、展会之上的产品和技术发布越来越放飞自我了:在SIGGRAPH这种图形技术顶会上谈AI;在CES消费电子展上,发布企业级技术与产品——汽车、机器人、Omniverse都来。

我们今年把CES上针对NVIDIA的重点放在AI PC和机器人技术上。本篇作为先导,谈几个媒体会上公布的有关消费电子、AI PC的有趣产品。可能大部分人聚焦今年的CES展会,核心关注点都在GeForce RTX 50系显卡上——作为重头戏,这部分我们放到后面的报道里去聊(参见《GeForce RTX 50系显卡发布:三倍于40系GPU算力》)。

实际上,在游戏显卡之外,NVIDIA这次还发布了把数据中心Grace-Blackwell超级芯片下放到桌面设备的“Project DIGITS”——虽然黄仁勋(NVIDIA CEO)主题演讲给到这个小设备的时间不多,但我们认为这是个相当有趣的产品;

以及针对RTX AI PC,面向开发者发布一系列以NIM微服务方式提供的AI基础模型(foundation model),以及Blueprints参考流程——也是数据中心及企业技术产品的下放,对未来的AI PC生态建设还是相当有价值的。

 

用GB10超级芯片的台式机?

这个名为“Project DIGITS”的新产品,其实也很难被定义为消费电子——用着Grace CPU和Blackwell GPU构成的GB10超级芯片,Linux操作系统(具体是NVIDIA自己的DGX OS),预装DGX用户熟悉的NVIDIA AI软件栈,面向AI开发者、研究人员、数据科学家和学生。

但它也有一些属于PC台式机的属性,比如GB10芯片中的Blackwell GPU带图形单元(暂不清楚具体给了多少图形单元)——搞不好装一些图形中间件也能用来玩游戏;128GB的统一系统内存是LPDDR5X;其整机尺寸非常小——黄仁勋在发布会上直接把它拿在手里,就像一台miniPC,普通家用墙插供电即可;公布的产品图还配了键盘鼠标...

是不是突然感觉就平易近人了许多?不像去年GTC上发布的GB200及NVL72系统...

但再细看:FP4数据精度1 PetaFLOP AI算力;竟然还配了ConnectX NIC(目前暂无哪一代ConnectX的信息),借助高速networking可以连接两台Project DIGITS,就能将原本单台支持至多2000亿参数模型提升到4050亿;这也不像是普通台式机该有的样子了...

显示器左下角那个是Project DIGITS

只不过新闻稿中提到Project DIGITS今年5月可以从NVIDIA及合作伙伴处买到,价格3000美元起——看起来也还是普通用户买得起的程度。NVIDIA在媒体会上说这款设备面向的用户群时,多少也提到了“爱好者(enthusiasts)”——虽然指的应该是AI技术爱好者。

目前有关GB10芯片和Project DIGITS整机的信息仍然不多。GB10芯片所用Grace CPU为20个Arm核心——还是比应用于HPC的Grace规模小了不少的——不过既然叫Grace,那么推测也应当是Neoverse V2核心;Blackwell GPU部分包括有CUDA核心、第5代Tensor核心,还带RT光追核心,目前仅知其FP4 AI算力1 PFLOP。

GB10的Grace-Blackwell之间也是用NVLink C2C连接:带宽未公布。新闻稿中提到联发科也参与了GB10的设计——是不是又让这颗芯片及设备带上一抹消费品的味道?

GB10芯片

此外系统层面包含有128GB LPDDR5X系统内存,4TB NVMe SSD存储空间,外部扩展连接支持Wi-Fi、蓝牙、USB,还有就是前文提到的带ConnectX芯片基于NCCL支持RDMA和GPUDirect,可达成两台Project DIGITS扩展,能跑至多4050亿参数规模AI模型。

NVIDIA AI软件栈,包括框架、工具、API皆有提供。所以其应用方向还是了然的,包括AI模型实验与原型设计,AI模型的fine-tune、推理,测试与评估,也可用于Chatbot或者代码生成的本地AI推理部署;数据科学家令其搭配NVIDIA RAPIDS也就能“在桌面加速大型数据科学工作流”;利用Isaac, Metropolis等工具则可以做机器人、CV之类的边缘应用开发。

Project DIGITS在我们看来也像是NVIDIA硬件与软件生态端侧设备的某种尝试。NVIDIA总结这是个“桌面上的AI超级计算机”,不知道将来会不会有人拿它爆改成跑Windows的PC,并试跑游戏...或许传言中NVIDIA要做自己的PC CPU(或与联发科配合)已经在此初见雏形了。

 

AI PC生态扩展:基础模型和开发工具

即便Project DIGITS算不上“正经”AI PC,但AI PC必然是这两年CES展会的热门话题:产品方面,除了后续我们会另行撰文详述的GeForce RTX 50系显卡,NVIDIA也在CES上针对RTX AI PC,面向开发者发布了新的工具。如文首所述,这些工具是继承了NVIDIA在AI领域的生态优势与积累的。

在NVIDIA看来,在生成式AI的急速发展时代,现在的Hugging Face已经有多大120万模型、多模态输入成为常态出现新的API、乃至在不需要掌握编程能力的情况下每个人都能成为开发者。

只不过要将这些潜在能力带到PC上还是存在不少挑战的:开发者需要管理、适配、优化跑在PC上的模型;将模型连接到新的API;还需要将其带入AI工具生态中。

所以NVIDIA面向RTX AI PC,发布了一系列的AI基础模型——包括语言、语音、动画、计算机视觉、图片、视频、RAG相关的模型——有来自社区和合作伙伴的,也有NVIDIA自己开发的。

比如在NVIDIA这次推出的Llama Nemotron大语言模型(针对开源Llama模型做过特别优化和CUDA加速的版本)家族中,有个特别针对PC与边缘设备的Llama Nemotron Nano,一款4b参数规模的模型——就是个典型例子。

为便于开发者入手,也为了维系自家AI生态发展,不出意料的这些AI模型都以NIM(NVIDIA Inference Microservice)微服务的形式向开发者提供。电子工程专辑不止一次撰文介绍过NIM:除了AI模型之外,这个名为NIM的“盒子”里还包括运行所需的依赖包、软件栈及相关优化构成,并对外提供标准API接口。

所以说NIM是面向开发者简易部署AI模型的一套解决方案。具体到RTX AI PC,NIM微服务中就包含了让AI跑在Windows PC之上的关键组件和效率优化:“把相同的技术特别针对RTX做适配”,“AI基础模型和NIM微服务会帮助PC开发者与爱好者快速启用AI,快速迭代,用RTX GPU为AI工作负载加速”。

相对的,NVIDIA也在此基础上发布了面向RTX AI PC的AI Blueprints。所谓的Blueprints,简单来说就是针对标准生成式AI用例的参考工作流;或者说是开发者可参考的定制化参考应用;着眼于进一步加速生成式AI的应用开发。比如说将多个打包了基础模型的NIM连接起来,建立起参考实施方案。

本次NVIDIA发布了两个面向RTX AI PC的Blueprints,分别是(1)PDF to Podcast的参考流程。也就是把PDF文档转为podcast播客的方案,基于PDF中的文字、图片、表格构建播客脚本,再生成完整的音频。

用户可以和播客进行实时交互,就特定话题对话。据说将白皮书、财报之类的复杂文档转为可交互的podcast,就能更方便地辅助研究。全流程用到了语言、文字转语音及自动语音识别等NIM微服务。

以及(2)3D引导的生成式AI Blueprint。去年SIGGRAPH大会上,我们就见过类似的“让AI更可控”的工作流。借助简单的3D对象——而且是手绘生成的3D资产,将其置于场景中,引导实现更契合3D场景、更可控的AI图像生成。

前几个月的NVIDIA媒体会上,也有艺术家做过相似的工作流创作尝试;现在NVIDIA即面向开发者提供来自官方的参考流程,可见内容创作者对于此类应用是有迫切需求的;AI也是真正提升了生产力的。

上述NIM微服务及Blueprints参考工作流预计会在下个月推向市场。从Project DIGITS及更多面向RTX AI PC开发工具与AI基础模型的发布,都能看出NVIDIA期望把一直以来的AI生态优势,带到PC端侧,并真正从严肃生产的角度普惠AI PC;即便Project DIGITS不能算是PC,其形态某种程度也称得上端侧AI设备尝试,虽然它是个完全面向AI开发者及技术爱好者、且完全基于NVIDIA软硬件生态的产品。

而且RTX AI PC也的确是我们所见目前在行业市场创造了较大价值的技术。这一生态的持续完善,也是让AI PC全面迈入高速发展期的基础。

后续几天,电子工程专辑还将继续关注NVIDIA在CES 2025展上的更多产品与技术发布。

责编:Illumi
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
NVIDIA刚才在CES上发布了GeForce RTX 50系显卡,据说这一代的5070就能达到上代4090的性能水平...
CMC清单主要与美国对中国高科技企业的打压以及对抗中国军民融合战略有关。
随着制程技术的不断升级,芯片制造成本也大幅攀升。苹果从A7芯片的晶圆价格5000美元,到A17和A18 Pro芯片的18000美元,晶圆成本上涨了约300%。每平方毫米的成本从A7时期的0.07美元增加到A17和A18 Pro的0.25美元......
实际上,联发科放弃2纳米是明智之举。台积电N3P工艺已经相对成熟,具备较高的良率和可靠性,与其跟风2纳米,不如做稳N3P。
物理世界对智能的需求正在推动边缘设备支持复杂计算,如人工智能、机器学习、数字信号处理和数据分析等。这增加了能源需求,而这些设备通常处于能源匮乏状态。因此,迫切需要从根本上重新考虑制造这些设备的计算硬件以提高能源效率。
据台湾工商时报报道,英伟达(Nvidia)已正式成立ASIC(应用特定集成电路)部门,并计划在中国台湾招募上千名芯片设计、软件开发及AI研发人员。
AMOLED行业的关键模具FMM及Invar在市场中属于极其细分而品质又要求极高的赛道,传统企业打法在这两个产品上都难以适用。唯有对上下游有深度了解,并能够将产业链技术链条打通,才能够将近似于黑箱中的FMM及其原材料Invar长期受限的困局打破。
IDC定义下的网络安全硬件市场分别由统一威胁管理 (UTM)、基于UTM平台的防火墙 (UTM Firewall) 、安全内容管理(SCM)、入侵检测与防御 (IDP)、虚拟专用网(VPN)和传统防火墙 (Traditional Firewall) 构成。
先进特殊应用集成电路 (ASIC) 领导厂商创意电子 (GUC) 今天宣布,已正式设计定案每通道 40Gbps 的 Universal Chiplet Interconnect Express™ (UCIe™) 物理层 IP在台积电N5制程,超越 UCIe 目前的最高速度,可运用于 AI/HPC/xPU/网络应用。UCIe 40G 小芯片接口提供领先业界的带宽密度,每毫米芯片边缘可达 1,645 GB/s。此 IP 支持高达 40Gbps 的任何速度,并采用自适应电压调节 (AVS) 技术来降低供电电压,能在满足所需速度时达到 2 倍的能源效率提升。此芯片系采用台积电 CoWoS ®(Chip on Wafer on Substrate) 先进封装技术完成组装。
英飞凌日前发布了其最新、最先进的RASIC™ CTRX8191F 28nm雷达单片微波集成电路(MMIC)的最终样品。CTRX8191F专为满足自动驾驶的要求而设计,具有高性能、低系统成本的特点,并将推动新一代雷达成像模块的开发。
芯片超人现有1600平米芯片智能仓储基地,现货库存型号1000+,品牌高达100种,5000万颗现货库存芯片,总重量10吨,库存价值高达1亿+。同时,芯片超人在深圳设有独立实验室,每颗物料均安排QC质
SESIP(Security Evaluation Standard for IoT Platforms)是针对物联网(IoT)平台的安全评估标准。它为物联网设备和平台提供了一个系统化的安全性评估框架
面板价格观察-1月上旬版昨日,TrendForce集邦咨询公布了1月上旬面板报价,TrendForce集邦咨询表示:2025年1月,电视面板价格预期将呈上升趋势;显示器、笔记本面板价格保持稳定。1电视
组委会 发自 副驾寺智能车参考 | 公众号 AI4Auto中国智能车群星闪耀,其中有这样一批核心技术,它们往往在聚光灯前一闪而过,但却对智能车的大卖起到了重要作用。它们有的来自主机厂自研,是车企赖以生
芝能智芯出品2024年,英伟达以7亿美元完成了对以色列AI初创公司Run:ai的收购,这一交易不仅成为业界焦点,更引发了关于其战略目的和未来规划的深层探讨。Run:ai是一家专注于GPU调度技术的公司
2024年第52周中国新能源汽车市场持续展现品牌分化趋势。比亚迪以71785辆的周销量稳居榜首,继续巩固其市场主导地位。方程豹品牌销量达到2824辆,环比小幅增长,展现出新兴品牌的增长潜力。腾势销量为
2024年12月,挪威汽车市场的插电式电动车占比高达89.8%,全年纯电动车(BEV)占比88.9%,再次巩固其全球电动车普及的领先地位。然而,尽管纯电动车销量持续增长,插电式混合动力车(PHEV)的
贾浩楠 发自 副驾寺智能车参考 | 公众号 AI4Auto高阶智驾普及到10万级车的安卓时刻,现在已经有了明确时间表:就在2025年Q1。A级小车宝骏云海车主成幸运儿,可能比很多四五十万、百万级车型用
美通社消息,2025年1月4日, X-SPACE富士胶片影像空间•南京(以下简称“X-SPACE南京”)在南京正式开业。该空间坐落于南京市鼓楼区汉中路280号,空间面积超过400平方米。这是继上海市淮
12.2.2 编译程序执行如下命令编译:左右滑动查看完整内容$ source /opt/remi-sdk/environment-setup-aarch64-poky-linux$ cd lv_por