9 月 19 – 21 日,2024 云栖大会将于杭州云栖小镇国际会展中心举行。本次大会以“云启智跃·产业蝶变”为主题,精心策划了三日主论坛与 400 场并行分论坛,涵盖主题演讲、圆桌讨论、互动展示等环节。大会还特别设置了人工智能+、计算、前沿应用三大主题馆,围绕云计算与 AI,全景式呈现 AI 时代云计算最新技术形态与产品进展,齐聚 AI 硬科技。
NVIDIA 将以“NVIDIA 加速计算新时代”为主题参与本次科技盛会,并设立 NVIDIA 展区带来数据中心级的端到端技术栈、云上解决方案、客户用例、生态加速项目展示,以及 LLM 互动技术演示等。此外,众多 NVIDIA 技术专家也将在各论坛和并行话题演讲分享全栈加速计算的技术经验。
亮点一:
NVIDIA 展区前沿 LLM 技术与产品大解密
C 馆 C-12
在云栖大会的 NVIDIA 展区,将展示七大板块内容,主要包括 NVIDIA 技术、LLM 互动技术演示、NVIDIA 初创加速计划、NVIDIA 企业开发者社区、NVIDIA 深度学习培训中心(DLI)、NVIDIA AI 小课堂以及云上解决方案和客户实践,每个板块都彰显了 NVIDIA 和云服务提供商等伙伴协作,在计算的各个层级驱动企业和开发者在应用、软件、算法、集群上协同设计、持续优化并提高系统韧性。
基于 CUDA 的加速计算是大语言模型时代下,AI 落地和产业焕新的技术底座;数据中心正在演变为由成千上万 GPU 构建的 AI 工厂,推动新一轮生成式 AI 的突破。NVIDIA 展区让您一站式领略基于 CUDA 的全栈加速计算技术。
在数据科学层面,我们将展示如何通过 NVIDIA RAPIDS™ cuDF 获得 GPU 高效计算优势的数据分析,无需代码更改,实现更快的 Pandas 数据处理和分析速度。
NVIDIA NeMo™ 用于构建、定制和部署生成式 AI,提供管护数据、训练和定制基础模型以及大规模运行推理的组件。
在 LLM 训练层面,我们将展示 NVIDIA Megatron-Core,它能够支持多模态训练、MoE 模型的训练吞吐量优化、快速分布式检查点,并进一步提高可扩展性;
在 LLM 推理和部署层面,您将看到 NVIDIA TensorRT-LLM 推理引擎,它为推理的 LLM 提供编译和优化库,并为定义和构建新模型提供 Python API,而 NVIDIA Triton™ 推理服务器是 AI 部署的“中央车站”,它提供 TensorRT-LLM C++ 运行时加速推理,包含 in-flight batching,paged KV caching 等技术。
在 AI 应用开发平台层面,我们将展示 NVIDIA NIM 微服务,这是一个加速企业在云、数据中心和工作站中部署生成式 AI 的预构建容器工具,您还将体验 NVIDIA 企业开发者社区带来的基于 NIM 和 RAG 的技术演示,这些智能对话助手结合了多模态和 AI-Agent 技术,展示了 NIM 在电力、消费互联网、企业 IT 服务、汽车等各个行业的应用潜力。
通过万卡级别及以上的集群开发和运行 LLM 已经成为常态,凭借高效的 Scale-Up 和 Scale-Out 的方式提升集群性能,是网络定义数据中心的具体表现。NVIDIA NVLink 提供了领先的 Scale-Up 性能,是将模型规模扩大到万亿参数的第一层保障;NVIDIA Spectrum-X™ 和 InfiniBand 网络平台为 AI 数据中心的 Scale-Out 提供了强大的网络横向加速性能。我们将展示 NVIDIA Spectrum-4 SN5600 网络交换机、BlueFields®-3 网络平台、NVIDIA DOCA™ DPU 软件开发平台,以及基于 NVIDIA Spectrum-4 的阿里云白盒以太网交换机,它是全球第一代专门面向高性能 AI 的数据中心交换机。
作为工业数字化和生成式物理 AI 的核心技术之一,NVIDIA Omniverse™ 平台也是本次展出的一大看点,助力开发 OpenUSD 应用程序。
精彩 LLM 互动技术演示
我们将展示由 Inworld AI 与 NVIDIA 合作创建的动态 NPC 交互技术演示,它集成 NVIDIA Riva 自动语音识别功能以实现准确的语音转文本,并使用 NVIDIA Audio2Face 提供逼真的面部动画。
另一个使用 Stable Diffusion ComfyUI 应用的图像生成技术演示,借助 NVIDIA RTX 实现了 10 倍更快的图像生成和一步式训练 ControlNets,ComfyUI 通过 TensorRT 加速,可将图像和视频生成速度提高 60%,体验者能够基于即时自拍照,来创建超级英雄形象并在几秒钟内完成。
NVIDIA 企业开发者社区也展示了中文智能对话的数字人技术演示,它利用 TensorRT-LLM 实现了千问大模型的本地化部署,并且应用了 ASR 模型,TTS 模型,RAG 技术和 Audio2Face 技术。
探索丰富的学习资源
NVIDIA 初创加速计划致力于培养颠覆行业格局的优秀创业公司,其展示内容将在现场开放。此外,您还会看到 NVIDIA 企业开发者社区和 NVIDIA 深度学习培训中心(DLI)的身影,为创业者、开发者和学习者提供丰富的资源和支持。到访“NVIDIA 实战培训”互动体验区,您可以现场体验 NVIDIA 培训配备云端实验环境的在线自学课程,并从 50 门课程中自由选择领取多门免费课程。到访观众还有特别培训课程的免费兑换权益。此外,“NVIDIA AI 小课堂”也将如期而至,为参会者提供与讲师互动的机会,让您亲身感受 AI 技术带来的魅力与变革。
课程及讲师详细信息:
基于 NIM 构建 LLM-RAG 智能检索应用
赵阳阳,NVIDIA 企业开发者社区经理
NVIDIA AI 推理加速解决方案
何琨,NVIDIA 企业开发者社区高级经理
NVIDIA Spectrum-X – 适用于 AI 的下一代以太网
崔岩,NVIDIA 网络技术专家
云上解决方案和客户用例展示
在 NVIDIA 展区,您将看到使用 NVIDIA 加速计算的云上解决方案和企业用户实践:
猿辅导集团:Motiff 妙多 AI 时代设计工具,基于 NVIDIA 加速计算,驱动 AI 直接生成产品界面。
吉利集团:极氪浩瀚智驾 2.0 启动端到端大模型,基于 NVIDIA 芯片,打造智驾新体验,自研域控,行车,泊车与主动安全全场景覆盖,城市领航功能全国都能用。
阿里云容器服务(ACK):在阿里云容器服务 ACK 集群上部署 NIM 预构建容器工具,使用其云原生 AI 套件,开源的 KServe 等组件和 Prometheus 监控服务,以及 NIM 提供的丰富监控指标,快速拉起高性能、可实时观测、极致弹性的模型推理服务。
魔搭社区:魔搭社区上线 TensorRT-LLM,支持主流 LLM 推理优化和常用量化方法,并适配不同环境,其中使用 FP8 量化,可获得相比 HuggingFace 基准,最高 8.6 倍的整体推理性能提升。
蚂蚁集团:图谱自动构建和可信问答,基于 LLM 的私域知识库自动图谱构建和可信问答。
阿里云云工开物校园云: NVIDIA 与阿里云支持中国高校 AI 通识教育。
阿里云函数计算(FC):阿里云与 NVIDIA 共同打造更高效的推理平台,推理速度提升 30%。
月之暗面:Kimi 底层推理平台 Mooncake——基于 KVCache 的分离式推理架构。
阿里云计算巢服务:NVIDIA AI Enterprise 结合计算巢实现 LLM 快速 SaaS 化和软件一站式上云。
vGPU:按“虚”而动,大势所趋,NVIDIA vGPU 解决方案助力阿里云弹性计算。
亮点二:
NVIDIA 专场“大语言模型时代的加速计算”
9 月 20 日 14:00 - 17:45,A 馆 A1-1
在 NVIDIA 专场中,我们将邀请数位技术专家与生态企业共同探讨大语言模型落地应用的关键要素,并分享全栈加速计算的技术经验。
上下滑动查看演讲详情
亮点三:
NVIDIA 精彩演讲与专题论坛
在本次云栖大会上,与会者不仅可以亲临展台参观体验,还能现场聆听 NVIDIA 多位专家的精彩演讲与洞察分享。
在大会首日《云与 AI 的创见》 主论坛的圆桌对话环节 ,NVIDIA 全球副总裁,汽车事业部负责人吴新宙将分享对 “生成式 AI 重塑自动驾驶” 话题的见解。在“智汇”她力量论坛,NVIDIA 全球副总裁刘念宁将带来主题为新工业革命中的女性“加速度”的演讲。在 20 日的“面向 Al 的可预期智算网络”论坛,NVIDIA 网络高级副总裁 Gilad Shainer 将分享 NVIDIA AI 计算和网络架构在下一代 AI 数据中心设计中的重要作用。此外,NVIDIA 的专家和生态企业还将在 NVIDIA 加速计算专场等论坛,以及并行话题演讲,带来以 NIM, Megatron-Core, TensorRT-LLM,NVIDIA Drive 平台等为主题的加速计算技术。
上下滑动查看演讲详情
亮点四:
NVIDIA Inception Pavilion 展区
3 号馆 3-11K
今年,10 家来自 NVIDIA 初创加速计划的会员企业也将在大会上一展风采。特别值得一提的是,其中 4 家来自亚太区域的会员企业将首次亮相云栖大会。欢迎您前来参观 NVIDIA Inception Pavilion 展区,与这些企业互动交流,了解来自不同国家和地区的科创企业在各自领域的最新技术突破。
参展企业一览
6Estates、FathomX Pte.Ltd.、MetaLearner、8glabs Inc.、WeShop、深圳幻影未来信息科技有限公司、万生华态科技有限公司、北京睿甄创新科技有限公司、酷牛创新技术(深圳)有限公司、埃罗科技(上海)有限公司。
与您相约在云栖
精彩内容即将揭幕,敬请持续关注 NVIDIA 公众号,我们将为您解锁更多大会亮点和参会攻略!让我们共同期待这场科技盛宴的到来,一起在云栖大会上见证 AI 技术如何塑造未来。