Meta的GenAI团队开展新研究,公布了一款Meta 3D Gen模型。据悉,该模型可在 1 分钟内之内从文本端到端生成 3D 资产的新AI组合系统,同时具有高分辨率纹理和材质图。GenAI团队称,其结果优于现有解决方案,速度是该领域现有工作的 3-10 倍。

电子工程专辑讯 近日Meta的GenAI团队开展新研究,公布了一款Meta 3D Gen模型。据悉,该模型可在 1 分钟内之内从文本端到端生成 3D 资产的新AI组合系统,同时具有高分辨率纹理和材质图。GenAI团队称,其结果优于现有解决方案,速度是该领域现有工作的 3-10 倍。

AI技术在3D内容生成领域逐步创新并突破。

在数字艺术、游戏设计、影视制作等领域,3D动画一直扮演着重要角色。传统3D动画制作过程繁琐复杂,需要专业技能和大量时间,GenAI+3D技术的出现,有望改变这一现状。

Meta  3DGenAI大模型的三维内容如何生成?

Meta 3DGen 集成了其关键技术组件 Meta 3D AssetGen 和 Meta 3D TextureGen。

通过结合这两种技术的优势,3DGen 可同时以三种方式表示三维物体:视图空间、体积空间和 UV(或纹理)空间。在Meta的一则报告中提到,与单阶段模型相比,这两项技术的集成实现了 68% 的胜率。我们将 3DGen 与众多行业基准进行了比较,结果表明,就复杂文本提示而言,3DGen 在提示保真度和视觉质量方面都优于行业基准,而且速度明显更快。

3D Gen的生成主要分为两个步骤。

第一阶段:可以根据用户提供的文本提示,使用Meta 3D AssetGen模型(简称 AssetGen)创建初始三维资产。这一步将生成带有纹理和 PBR 材质贴图的 3D 网格。推理时间约为 30 秒。

所为的PBR,就是基于物理的渲染,是计算机图学中的着色方法,目的在于模拟光线的物理行为及其与材质的交互作用,从而实现逼真的视觉效果。 

第二阶段:可使用文本到纹理生成器 Meta 3D TextureGen(简称 TextureGen),可以生成更高质量的纹理和 PBR 贴图。此外,也可以重新生成三维(再)纹理,就是给定一个没有纹理的三维网格和一个描述其理想外观的提示,从头开始为该3D资产生成纹理(网格可以是以前生成的,也可以是艺术家创建的)。推理时间约为 20 秒。

GenAI团队称,该技术不仅在设计、视频游戏开发、增强和虚拟现实应用以及电影业特效等,也可以作为 3D 艺术家的人工智能助手,实现以创建个性化、用户生成的 3D 内容为中心的新体验。人工智能驱动的三维生成对于在 Metaverse 中构建无限大的虚拟世界也非常重要。

GenAI+3D是一种基于深度学习的人工智能技术,它利用神经网络对大量数据进行训练,从而学会从单张图像中提取出三维信息。简单来说,其工作原理可分为三个步骤:

其一是数据收集与处理。GenAI+3D首先需要收集大量的三维数据,包括各种形状、纹理、光照等信息。这些数据经过预处理后,被用于训练神经网络。

其二是神经网络训练。在训练阶段,神经网络通过不断学习和调整参数,逐渐学会从单张图像中提取三维信息。这个过程需要大量的计算资源和时间,但一旦训练完成,神经网络便能具备强大的泛化能力,适应各种不同的图像输入。

其三是,三维重建与动画生成。当用户提供一张参考图像时,训练好的神经网络能够迅速提取出图像中的三维信息,生成相应的3D模型。然后,通过一系列算法和技术,将这些3D模型转化为流畅的3D动画。

通过AI制作的3D内容在艺术质量、生成速度、三维网格的结构和拓扑质量、UV 贴图的结构以及纹理的清晰度和分辨率等方面都有严格的标准。当前的三维数据学习内容不及图片和视频的多,因此,三维生成还必须从非三维图像和视频中学习,而三维信息必须从局部的二维观察中推断出来。

在报告中GenAI团队称,经专业 3D 艺术家评估,Meta 3D Gen 显著提高了生产质量 3D 资产的关键指标,尤其是复杂的文字提示。无论是否商业化,该技术生成的三维形状和纹理的质量更好,至少与这些竞争对手不相上下,而且使用的是可扩展系统,速度更快,忠实度更高。对象生成后,可在 20 秒内对其纹理进行进一步编辑和定制,与其他方法相比,质量更高,成本更低。

Meta通过AI技术实现了虚拟现实设备的普及化,并且3D Gen AI模型的发布有望进一步推动了元宇宙的发展。3D Gen大大简化了3D设计的过程。

不过目前该模型的具体发布时间尚未确定。

3D AI大模型,群雄四起

目前,市场上也出现了不少关于AI生成3D模型的应用和工具,比如Meshy是一款基于AI技术的在线3D内容生成工具,能够根据图像和文本生成3D模型;还有Deep Art Effects、Pix2PixHD、Meshroom和GANPaint Studio等也在市场上受到关注。

专长于视觉内容生成的 Stability AI 携手VAST团队推出的TripoSR模型,据悉能够在 0.5s 的时间内由单张图片生成高质量的 3D 模型,甚至无需 GPU 即可运行。

腾讯的 AI新 模型“InstantMesh”可以使用静态照片渲染 3D 对象,并且开源供开发者使用。

OpenAI公司推出了新模型Shap-E,可以通过文字提示和图片提示生成多样化的3D模型。

英伟达与设计工具Shutterstock合作训练“文本生成3D”模型,大幅缩短从创建到发布具有精美纹理、结构化的3D模型的周期。

谷歌推出的DreamFusion项目,同样受到关注。

国盛证券在研报中指出,作为生产力工具,AIGC能够对3D生成内容起到降本增效的重要作用,这将加速推动产业变革,并带给用户更加逼真的视觉体验,包括影视、游戏、建筑、营销等多个场景都将受益,加速元宇宙时代的到来。

AI概念的热潮正涌向影视行业。随着AI的使用场景越来越广泛,自动生成3D类大模型的出现或将再次激发影视行业发展的活力。《复仇者联盟》导演乔·罗素的预测,影视行业在两年后有望出现一部完全由AI制作的电影。

复旦大学和上海AI lab的研究人员推出了3DGen-Arena。这是一个针对3D生成模型的人工评测竞技场,旨在让大众进行公开、匿名的评测。该平台不仅支持匿名投票和比较,还提供交互功能,通过多维度的用户评测来优化3D模型生成质量,推动技术和算法的进一步发展。此外,3DGen-Arena分为文生3D和图生3D两个赛道,提供360°环绕视频展示,并允许用户根据几何合理性、精细度、纹理质量、一致性等维度进行投票。目前平台上已有19个开源3D生成模型,参与者可以通过匿名投票或与指定模型进行比较来进行评测。

3D AI大模型面临的挑战主要包括数据质量和多样性、高成本和长周期、精度与效率的矛盾以及巨大的算力需求。其中,精度与效率的矛盾是3D建模中的一个痛点。在3D建模中,精度越高,模型的质量就越好,但同时建模的效率就会降低。这些挑战需要通过技术创新和数据积累来逐步克服。

责编:Amy.wu
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
新公司将包括本田、日产和三菱汽车,预计年销量将超过800万辆,成为世界第3大汽车制造集团。这将使新公司在全球汽车市场中占据重要地位,尤其是在与特斯拉和中国电动车品牌的竞争中。
新款开发板售价仅为249美元,而上一代40 TOPS开发板售价为499美元,价格仅为上一代的一半。这使得Jetson Orin Nano Super成为“世界上最经济实惠的生成式AI计算机”,特别适合商业AI开发者、爱好者和学生使用。
面对AI时代带来的差异化趋势、软件应用及开发时间长、软硬件协同难、高复杂度高成本等挑战,国产EDA仍需不断探索和创新。
印度政府希望通过这一系列的方式,“推动”中国品牌更深入地“融入”印度市场,并“加强”与当地的经济合作,比如鼓励中国企业与本土电子制造商建立合作关系,共同在印度生产智能手机。而vivo印度公司此次与迪克森成立合资公司,就是在以上政府指引下无奈作出的选择。
通过机器学习技术,EDA工具可以获取更精确的模型来预测设计中存在的问题,如布线拥塞、信号干扰、热效应等,从而为用户提供更准确快速的指导,避免后期返工。
此次柔宇显示名下资产的拍卖页面自11月28日就已经上线,直至12月15日拍卖结束,在这长达半个多月的时间里,始终没有任何人报名参与竞拍。
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
今日,长飞先进武汉基地建设再次迎来新进展——项目首批设备搬入仪式于光谷科学岛成功举办,长飞先进总裁陈重国及公司主要领导、嘉宾共同出席见证。对于半导体行业而言,厂房建设一般主要分为四个阶段:设备选型、设
投资界传奇人物沃伦·巴菲特,一位94岁的亿万富翁,最近公开了他的遗嘱。其中透露了一个惊人的决定:他计划将自己99.5%的巨额财富捐赠给慈善机构,而只将0.5%留给自己的子女。这引起了大众对于巴菲特家庭
对于华为来说,今年的重磅机型都已经发完了,而明年的机型已经在研发中,Pura 80就是期待很高的一款。有博主爆料称,华为Pura 80将会用上了豪威OV50K传感器,同时电池容量达到5600毫安时。至
12月18 日,据报道,JNTC与印度Welspun BAPL就车载盖板玻璃的开发及量产签订了投资引进业务合作备忘录(MOU)。资料显示,JNTC是韩国的一家盖板玻璃厂商。Welspun的总部位于印度
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
阿里资产显示,随着深圳柔宇显示技术有限公司(下称:“柔宇显示”)旗下资产一拍以流拍告终,二拍将于12月24日开拍,起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产,其中不
近期,高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播:加入LED显示行业群,请加VX:hangjia188■ 高科视像:MLED新型显示面板生产项目(二期)招标12月18日,山西高科
LG Display  12月18日表示,为加强OLED制造竞争力,自主开发并引进了“AI(人工智能)生产体系”。“AI生产体系”是AI实时收集并分析OLED工艺制造数据的系统。LG Display表
在科技浪潮翻涌的硅谷,马克·扎克伯格不仅是“脸书”帝国的掌舵人,更是以其谦逊低调的形象,在公众心中树立了独特的领袖风范。然而,在镁光灯难以触及的私人领域,扎克伯格与39岁华裔妻子普莉希拉·陈的爱情故事
极越汽车闪崩,留下一地鸡毛,苦的是供应商和车主。很多人都在关心,下一个倒下的新能源汽车品牌,会是谁?我们都没有未卜先知的超能力,但可以借助数据管中窥豹。近日,有媒体统计了15家造车新势力的销量、盈亏情