下一代神经网络:NVIDIAResearch在NeurIPS大会上发布一系列AI技术进步

原创 英伟达NVIDIA中国 2023-11-03 19:01


NVIDIA 研究人员正在与世界各地的学术机构合作,推进生成式 AI、机器人和自然科学领域的进步。在全球顶级 AI 会议之一 NeurIPS 上,NVIDIA 将介绍其中的十几个项目。


NeurIPS 大会将于太平洋时间 12 月 10 日至 16 日在新奥尔良举行,汇集了生成式 AI、机器学习、计算机视觉等领域的专家。在此次大会上,NVIDIA Research 将展示一系列创新,包括将文本转化为图像、将照片转化为 3D 化身,以及将专用机器人转化为多功能机器的新技术。


NVIDIA 学习和感知研究副总裁 Jan Kautz 表示:“NVIDIA Research 继续推动该领域的进步,包括将文本转化为图像或语音的生成式 AI 模型、更快地学习新任务的自主 AI 代理,以及计算复杂物理学的神经网络。这些项目通常与学术界的领军人物合作完成,将有助于加速虚拟世界、模拟和自主机器的开发。”


转换为图像:

改进文本到图像扩散模型


对于将文本转化为逼真的图像,扩散模型已经成为最流行的生成式 AI 模型。NVIDIA 的研究人员与多所大学合作了多个推进扩散模型发展的项目,并将在 NeurIPS 上进行展示。


  • 一篇口头报告论文重点研究让生成式 AI 模型更好地理解文本提示中修饰词和主体之间的联系。当要求现有文本生成图像模型生成一个黄色西红柿和一个红色柠檬时,其可能会生成错误的黄色柠檬和红色西红柿,但新新模型可以分析用户提示词的语法,鼓励在主体与其修饰符之间建立联系,从而更忠实地对文本提示词进行视觉描述。


    了解更多信息,请查阅:https://neurips.cc/virtual/2023/oral/73870

  • SceneScape 是一个使用扩散模型根据文本提示词创建 3D 场景长视频的新框架,其将在会议上以海报的形式进行展示。该项目将文本生成图像模型与深度预测模型相结合,有助于视频中看似合理的场景在连续的几帧中保持不变——生成美术馆、鬼屋和冰雪城堡视频。


    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/71859


  • 另一个海报描述了如何让文本生成图像模型更好地生成那些通常在训练数据中罕见的概念。尝试生成这样的图像通常会导致低质量的视觉效果,不能完全匹配用户的提示词。新方法使用了一小组示例图像,帮助模型识别好的种子——随机数序列,引导 AI 从指定的稀有类中生成图像。


    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/70922

  • 第三个海报展示了文本生成图像扩散模型如何使用不完整点云的文本描述来生成缺失部分,并创建物体的完整 3D 模型。这可能有助于完善激光雷达扫描仪和其他深度传感器收集的点云数据,用于机器人和自动驾驶汽车 AI 应用。收集的图像通常是不完整的,因为物体是从特定角度扫描的。例如,当汽车沿街行驶时,安装在车上的激光雷达传感器只会扫描每栋建筑的一侧。


    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/70648



角色开发:AI 化身的进步


AI 化身结合了多个生成式 AI 模型来创建虚拟角色并做成动画、生成文本并将其转化为语音。NeurIPS 大会上的两个 NVIDIA 海报展示了可以提高这些任务效率的新方法。


  • 其中一个海报描述了一种新方法,可以将一张肖像图转化为 3D 头像,同时捕捉发型和配饰等细节。不同于当前需要多张图像并且优化过程需要较长时间的方法,该模型在推理过程中无需额外优化即可实现高保真度的 3D 重建。这些头像可以通过混合形状(blendshapes)做成动画,混合形状是 3D 网格表示,用于表示不同的面部表情。这些头像也可以使用参考视频剪辑做成动画,视频中人的脸部表情和动作会应用于头像。


    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/72615

  • 另一个海报介绍了 NVIDIA 研究人员和大学合作者使用 P-Flow 模型来开展零样本文本到语音合成。P-Flow 是一种生成式 AI 模型,可以在给出三秒参考提示的情况下快速合成高质量的个性化语音。与近期最先进的同类模型相比,P-Flow具有更好的发音、拟人度和说话者相似度。只需一个 NVIDIA A100 Tensor Core GPU,该模型就能即刻将文本转化为语音。


    了解更多信息,请查阅:https://pflow-demo.github.io/projects/pflow/

强化学习、机器人研究领域的突破


在强化学习和机器人领域,NVIDIA 的研究人员将带来两个海报,着重介绍提高 AI 在不同任务和环境中的通用性的创新技术。


  • 第一个海报提出了一个用于开发强化学习算法的框架,该框架可以适应新任务,同时避免常见的梯度偏差和数据低效陷阱。研究人员表明,他们的方法采用新颖的元算法,可以创建任何元强化学习模型的鲁棒版本——在执行多个基准测试任务时表现优秀。


    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/72040


  • 另一个海报介绍了 NVIDIA 研究人员和大学合作者解决了机器人进行物体操控的挑战。此前,那些帮助机器人用手拾取物体并与之交互的 AI 模型可以处理特定的形状,但难以处理训练数据中未出现过的物体。研究人员引入一个新的框架,该框架可以估计各类物体在几何上的相似性,例如拥有相似把手的抽屉和锅盖,从而使该模型能够更快地推广到新的形状。


    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/71709

推动科学飞速发展:

AI 加速物理、气候、医疗


在 NeurIPS 大会上,NVIDIA 研究人员还将发表涉及多个自然科学领域的论文,涵盖物理模拟、气候模型和医疗 AI。


  • 为了加速大规模 3D 模拟的计算流体动力学,NVIDIA 的一个研究团队提出了一种神经算子架构,该架构在估计车辆周围的压力场时实现了高精度和高计算效率。这是行业标准的大规模汽车基准测试中第一个基于深度学习的计算流体动力学方法。与另一个基于 GPU 的求解器相比,该方法在单个 NVIDIA Tensor Core GPU 上实现了 10 万倍的加速,同时降低了错误率。研究人员可以使用开源的神经算子库,将该模型整合到自己的应用程序中。


    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/72670


  • 来自大学、国家实验室、研究所、Allen AI 和 NVIDIA 的气候科学家和机器学习研究人员组成了一个联盟,合作开发了大规模数据集 ClimSim,用于物理学和基于机器学习的气候研究。这个数据集将在 NeurIPS 大会上的口头报告中进行分享,其中包含多年高分辨率的全球数据。使用这些数据构建的机器学习模拟器可以集成至目前正在使用的气候模拟器中,以提高其保真度、准确性和精度。这可以帮助科学家更好地预测风暴和其它极端事件。


    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/73569


  • NVIDIA Research 的实习生制作的一个海报介绍了一种 AI 算法,可以个性化地预测药物剂量对患者的影响。利用真实数据,研究人员测试了该模型对患者接受不同剂量时的凝血情况预测。他们还分析了新算法对接受药物治疗的患者体内抗生素万古霉素浓度的预测。结果发现,与以前的方法相比,新算法的预测准确性显著提高。


    了解更多信息,请查阅:https://neurips.cc/virtual/2023/poster/71940


NVIDIA Research 由全球数百名科学家和工程师组成,团队专注于 AI、计算机图形学、计算机视觉、自动驾驶汽车、机器人学等领域的研究。点击阅读原文,了解更多信息。



GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。扫描下方海报二维码,关注更多会议及活动信息。


评论
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 115浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 56浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 111浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 48浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 102浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 195浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 140浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 160浏览
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 87浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 55浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦