SIGGRAPH亮点抢先看|NVIDIA最新图形学研究成果推动生成式AI前沿领域的进一步发展

原创 英伟达NVIDIA中国 2023-05-06 12:14

NVIDIA 将于本年度最重要的计算机图形大会 — SIGGRAPH 上发表约 20 篇研究论文。



NVIDIA 近日发布了一批尖端 AI 研究。无论是静态还是动态、2D 还是 3D、超写实风格或是幻想风格,开发者和艺术家都能借助这些研究成果将其创意变为现实。


SIGGRAPH 2023 计算机图形学大会将于 8 月 6 日至 10 日在美国洛杉矶举办,NVIDIA 将亮相大会并发表约 20 篇用以推动生成式 AI 和神经图形学发展的研究论文,其中包括多项与美国、欧洲及以色列的十几所大学的联合研究成果。


NVIDIA 将发布的论文内容丰富,涵盖将文本转换成个性化图像的生成式 AI 模型、将静态图像转换成 3D 对象的逆向渲染工具、使用 AI 模拟超逼真复杂 3D 元素的神经物理模型以及可用于解锁全新的实时、AI 赋能的视觉细节生成能力的神经渲染模型等。


NVIDIA 研究人员经常在 GitHub 上与开发者分享创新成果,并将这些创新整合到产品中,包括用于构建和运行元宇宙应用的 NVIDIA Omniverse 平台,以及最近发布的用于视觉设计的自定义生成式 AI 模型“工坊” — NVIDIA Picasso。凭借多年深耕图形学领域所积累的研究成果,NVIDIA 能够将电影级渲染技术应用于游戏中,例如最近发布的《赛博朋克 2077》的“光线追踪:Overdrive 模式”技术预览版,其是全球首款利用全景光线追踪(也称为路径追踪)3A 游戏大作。


今年将于 SIGGRAPH 大会展示的研究进展,将能够帮助开发者和企业快速生成合成数据,以丰富用于训练机器人和自动驾驶汽车的虚拟世界。此外,这些研究还将能够赋能艺术、建筑、平面设计、游戏开发和电影领域的创作者,提升其用于故事板、预览乃至实际制作的高质量视觉效果的生成速度。


为 AI 增添个性化色彩:

自定义文本-图像转换模型


能够将文本转换成图像的生成式 AI 模型,可为电影、电子游戏和 3D 虚拟世界的概念艺术或故事板创建带来强大工具。AI 文本-图像转换工具可以将“儿童玩具”这样的提示语转换成近乎无限的视觉效果,创作者可以从中获得灵感,生成毛绒动物玩偶、积木或拼图等图像。


然而,艺术家们的心中可能已经构思出了特定的主题。例如,一位玩具品牌的创意总监可能正准备围绕一款新的泰迪熊玩偶展开广告宣传,并希望基于泰迪熊茶会等各种不同的场景实现玩偶可视化。为提升生成式 AI 模型输出结果的细节水平,NVIDIA 与特拉维夫大学的研究人员将于 SIGGRAPH 大会上共同发表两篇论文,使用户能够提供便于模型快速学习的图像实例。


其中的一篇论文所介绍的技术需要利用实例图像来实现自定义输出,可在单个 NVIDIA A100 Tensor Core GPU 上加速个性化进程,将其速度从几分钟提升至约 11 秒,与以往的个性化方法相比,速度可提升约 60 倍。


第二篇论文则介绍了一个高度紧凑的模型 — Perfusion 模型。该模型可支持用户仅需少量概念图像就可将多个个性化元素(如特定的泰迪熊和茶壶等)组合至 AI 生成的视觉图像中:



推动 3D 创作:

逆向渲染和角色创作方面的进展


在创作者构思出虚拟世界的概念艺术后,下一步就是渲染环境,并在其中填充 3D 物品和角色。NVIDIA Research 正在发明可加速这一耗时流程的 AI 技术,将 2D 图像和视频自动转换成 3D 形式,让创作者可以将其导入图形应用进行进一步编辑。


第三篇论文是与加州大学圣地亚哥分校的研究人员共同创作的,该论文中的技术可根据一张 2D 肖像画生成并渲染逼真的 3D 头像模型。这项重大突破能够使用 AI 来创建 3D 虚拟形象和召开 3D 视频会议,它可以在用户的桌面上实时运行,只需要使用普通的网络摄像头或智能手机摄像头就能生成一个写实化或风格化的 3D 远程呈现形象。


第四个项目是与斯坦福大学一起生成栩栩如生的 3D 角色动作。研究人员创建了一个 AI 系统,可以从现实世界网球比赛的 2D 视频录像中学习各种网球技能,并将这些动作应用于 3D 角色。模拟网球运动员可以准确地将球打到虚拟球场的目标位置,甚至与其他角色进行长时间的对攻。


除了网球的测试案例之外,这篇 SIGGRAPH 论文还解决了一个难题:即在不使用昂贵的动作捕捉数据的前提下,生成能够逼真地完成各种技术动作的 3D 角色。



一“丝”不苟:

运用神经物理学实现逼真的模拟


在生成 3D 角色后,艺术家们就可以对头发等写实细节进行分层,这对动画师而言是一项复杂且计算成本相对较高的挑战。


平均而言,人类有 10 万根头发,每根头发都会对人类的运动和周围环境做出动态反应。过去,创作者会使用物理公式来计算头发的运动,根据可用的资源简化或近似化头发的运动。这也是大制作电影中虚拟角色的头发细节会比实时电子游戏中的虚拟形象更为精细的原因。


第五篇论文展示了一种可以利用神经物理学来实现数万根头发实时且高清模拟的方式。该项 AI 技术可训练神经网络预测相应对象在现实世界中的运动轨迹。



该团队的这种用于精确、全面地模拟头发的新颖方式还基于现阶段的 GPU 进行了针对性优化。其性能大幅优于目前最先进的基于 CPU 的求解器,可将模拟时间从数天缩短到数小时,同时还可提高实时头发模拟的质量。该技术最终可实现符合物理学的精确、交互式的头发形态。


神经渲染为实时图形带来电影级精细度


在使用动态 3D 物品和角色填充环境后,实时渲染会在该虚拟场景中模拟光线反射时的物理特性。NVIDIA 最近的研究展示了用于纹理、材质和体积的 AI 模型如何为电子游戏和数字孪生实时提供电影级的逼真视觉效果。


NVIDIA 在二十多年前发明了可编程着色技术,使开发者能够自定义图形流程。而在最新的神经渲染创新成果中,研究者使用了在 NVIDIA 实时图形流程中运行的 AI 模型来扩展可编程着色代码。


在第六篇 SIGGRAPH 论文中,NVIDIA 将介绍在不额外占用 GPU 内存的前提下,可提供多达 16 倍纹理细节的神经网络压缩技术。神经纹理压缩技术可大幅提高 3D 场景的真实性,下图中,旧格式中的文字是模糊的(中),而神经压缩纹理(右)可捕捉到比旧格式更加清晰的细节。


相比以前的纹理格式,神经纹理压缩(右)在不额外占用 GPU 内存的前提下可提供多达 16 倍的纹理细节


去年发布的 NeuralVDB 相关论文的研究成果现已开放提前访问,这项 AI 赋能的数据压缩技术将表现烟、火、云和水等体积数据所需的内存减少了 100 倍。


NVIDIA 还发布了关于神经材质研究的更多详情,这项研究出现在前不久的 NVIDIA GTC 主题演讲中。这篇论文描述了一种学习光如何在逼真的多层材料上反射的 AI 系统,将这些资产的复杂性简化成实时运行的小型神经网络,使着色速度提高了 10 倍。


这个利用神经渲染制作的茶壶可体现高逼真度,可精确表现出陶瓷材质及其不完美的透明涂层釉、指纹、污点甚至灰尘等。


该神经材质模型还可学习光线如何在逼真的多层次参考材质上进行反射


探索更多生成式 AI 和图形学领域的研究


以上只是部分亮点,您还可以进入相关页面进一步了解 NVIDIA 将于 SIGGRAPH 大会发布的所有论文。NVIDIA 还将在本届大会上开展六门课程、四场分会,并进行两场新兴技术演示,涵盖路径追踪、远程呈现和用于生成式 AI 的扩散模型等内容。

(https://research.nvidia.com/publications)


NVIDIA Research 在全球范围内拥有数百名科学家和工程师,在 AI、计算机图形学、计算机视觉、自动驾驶汽车、机器人技术等领域开展研究。



即刻点击 “阅读原文” 在 NVIDIA On-Demand 上观看 GTC 精选回放,包括主题演讲相关精选、中国本地精选内容、生成式 AI 专题以及全球各行业及领域最新成果!


评论
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 60浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 123浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 103浏览
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 198浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 188浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 118浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 76浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 58浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 221浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 164浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 184浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 156浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 492浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦