Meta的GenAI团队开展新研究,公布了一款Meta 3D Gen模型。据悉,该模型可在 1 分钟内之内从文本端到端生成 3D 资产的新AI组合系统,同时具有高分辨率纹理和材质图。GenAI团队称,其结果优于现有解决方案,速度是该领域现有工作的 3-10 倍。

电子工程专辑讯 近日Meta的GenAI团队开展新研究,公布了一款Meta 3D Gen模型。据悉,该模型可在 1 分钟内之内从文本端到端生成 3D 资产的新AI组合系统,同时具有高分辨率纹理和材质图。GenAI团队称,其结果优于现有解决方案,速度是该领域现有工作的 3-10 倍。

AI技术在3D内容生成领域逐步创新并突破。

在数字艺术、游戏设计、影视制作等领域,3D动画一直扮演着重要角色。传统3D动画制作过程繁琐复杂,需要专业技能和大量时间,GenAI+3D技术的出现,有望改变这一现状。

Meta  3DGenAI大模型的三维内容如何生成?

Meta 3DGen 集成了其关键技术组件 Meta 3D AssetGen 和 Meta 3D TextureGen。

通过结合这两种技术的优势,3DGen 可同时以三种方式表示三维物体:视图空间、体积空间和 UV(或纹理)空间。在Meta的一则报告中提到,与单阶段模型相比,这两项技术的集成实现了 68% 的胜率。我们将 3DGen 与众多行业基准进行了比较,结果表明,就复杂文本提示而言,3DGen 在提示保真度和视觉质量方面都优于行业基准,而且速度明显更快。

3D Gen的生成主要分为两个步骤。

第一阶段:可以根据用户提供的文本提示,使用Meta 3D AssetGen模型(简称 AssetGen)创建初始三维资产。这一步将生成带有纹理和 PBR 材质贴图的 3D 网格。推理时间约为 30 秒。

所为的PBR,就是基于物理的渲染,是计算机图学中的着色方法,目的在于模拟光线的物理行为及其与材质的交互作用,从而实现逼真的视觉效果。 

第二阶段:可使用文本到纹理生成器 Meta 3D TextureGen(简称 TextureGen),可以生成更高质量的纹理和 PBR 贴图。此外,也可以重新生成三维(再)纹理,就是给定一个没有纹理的三维网格和一个描述其理想外观的提示,从头开始为该3D资产生成纹理(网格可以是以前生成的,也可以是艺术家创建的)。推理时间约为 20 秒。

GenAI团队称,该技术不仅在设计、视频游戏开发、增强和虚拟现实应用以及电影业特效等,也可以作为 3D 艺术家的人工智能助手,实现以创建个性化、用户生成的 3D 内容为中心的新体验。人工智能驱动的三维生成对于在 Metaverse 中构建无限大的虚拟世界也非常重要。

GenAI+3D是一种基于深度学习的人工智能技术,它利用神经网络对大量数据进行训练,从而学会从单张图像中提取出三维信息。简单来说,其工作原理可分为三个步骤:

其一是数据收集与处理。GenAI+3D首先需要收集大量的三维数据,包括各种形状、纹理、光照等信息。这些数据经过预处理后,被用于训练神经网络。

其二是神经网络训练。在训练阶段,神经网络通过不断学习和调整参数,逐渐学会从单张图像中提取三维信息。这个过程需要大量的计算资源和时间,但一旦训练完成,神经网络便能具备强大的泛化能力,适应各种不同的图像输入。

其三是,三维重建与动画生成。当用户提供一张参考图像时,训练好的神经网络能够迅速提取出图像中的三维信息,生成相应的3D模型。然后,通过一系列算法和技术,将这些3D模型转化为流畅的3D动画。

通过AI制作的3D内容在艺术质量、生成速度、三维网格的结构和拓扑质量、UV 贴图的结构以及纹理的清晰度和分辨率等方面都有严格的标准。当前的三维数据学习内容不及图片和视频的多,因此,三维生成还必须从非三维图像和视频中学习,而三维信息必须从局部的二维观察中推断出来。

在报告中GenAI团队称,经专业 3D 艺术家评估,Meta 3D Gen 显著提高了生产质量 3D 资产的关键指标,尤其是复杂的文字提示。无论是否商业化,该技术生成的三维形状和纹理的质量更好,至少与这些竞争对手不相上下,而且使用的是可扩展系统,速度更快,忠实度更高。对象生成后,可在 20 秒内对其纹理进行进一步编辑和定制,与其他方法相比,质量更高,成本更低。

Meta通过AI技术实现了虚拟现实设备的普及化,并且3D Gen AI模型的发布有望进一步推动了元宇宙的发展。3D Gen大大简化了3D设计的过程。

不过目前该模型的具体发布时间尚未确定。

3D AI大模型,群雄四起

目前,市场上也出现了不少关于AI生成3D模型的应用和工具,比如Meshy是一款基于AI技术的在线3D内容生成工具,能够根据图像和文本生成3D模型;还有Deep Art Effects、Pix2PixHD、Meshroom和GANPaint Studio等也在市场上受到关注。

专长于视觉内容生成的 Stability AI 携手VAST团队推出的TripoSR模型,据悉能够在 0.5s 的时间内由单张图片生成高质量的 3D 模型,甚至无需 GPU 即可运行。

腾讯的 AI新 模型“InstantMesh”可以使用静态照片渲染 3D 对象,并且开源供开发者使用。

OpenAI公司推出了新模型Shap-E,可以通过文字提示和图片提示生成多样化的3D模型。

英伟达与设计工具Shutterstock合作训练“文本生成3D”模型,大幅缩短从创建到发布具有精美纹理、结构化的3D模型的周期。

谷歌推出的DreamFusion项目,同样受到关注。

国盛证券在研报中指出,作为生产力工具,AIGC能够对3D生成内容起到降本增效的重要作用,这将加速推动产业变革,并带给用户更加逼真的视觉体验,包括影视、游戏、建筑、营销等多个场景都将受益,加速元宇宙时代的到来。

AI概念的热潮正涌向影视行业。随着AI的使用场景越来越广泛,自动生成3D类大模型的出现或将再次激发影视行业发展的活力。《复仇者联盟》导演乔·罗素的预测,影视行业在两年后有望出现一部完全由AI制作的电影。

复旦大学和上海AI lab的研究人员推出了3DGen-Arena。这是一个针对3D生成模型的人工评测竞技场,旨在让大众进行公开、匿名的评测。该平台不仅支持匿名投票和比较,还提供交互功能,通过多维度的用户评测来优化3D模型生成质量,推动技术和算法的进一步发展。此外,3DGen-Arena分为文生3D和图生3D两个赛道,提供360°环绕视频展示,并允许用户根据几何合理性、精细度、纹理质量、一致性等维度进行投票。目前平台上已有19个开源3D生成模型,参与者可以通过匿名投票或与指定模型进行比较来进行评测。

3D AI大模型面临的挑战主要包括数据质量和多样性、高成本和长周期、精度与效率的矛盾以及巨大的算力需求。其中,精度与效率的矛盾是3D建模中的一个痛点。在3D建模中,精度越高,模型的质量就越好,但同时建模的效率就会降低。这些挑战需要通过技术创新和数据积累来逐步克服。

责编:Amy.wu
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
“机器狼群”是一种高度智能化的无人作战系统,由多个不同功能的“机器狼”组成,每个“机器狼”在团队中扮演特定角色,形成高效的协同作战单元。
此次仲裁的核心争议在于,杨植麟和张宇韬在未取得循环智能投资方的同意豁免书之前,便启动了融资并创立了月之暗面。2024年3月,月之暗面旗下AI应用产品Kimi大火,甚至出现二级市场Kimi概念股。
有人评论:AlphaFold-3解决了长距离依赖问题,还能预测RNA等分子结构,甚至细胞内部生化过程,这简直就是生物信息学领域的一场革命。
该计划将通过补贴和其他财政援助的形式,在未来数年内支持芯片制造商,特别是下一代芯片的研发和量产。这一计划是日本政府综合经济方案的一部分,预计将在2024年11月22日由内阁批准。
根据台湾地区的技术保护法规,台积电被禁止在海外生产2纳米芯片,这意味着该公司必须将最尖端的技术保留在本土。
DF30芯片是业界首款基于自主开源RISC-V多核架构、采用国内40nm车规工艺开发的高端车规MCU芯片。该芯片实现了全流程国内闭环,功能安全等级达到了ASIL-D,并已通过295项严格测试。
为了更直观地了解FinFET到GAAFET架构世代的差异,本文利用高倍率的电子显微镜影像进行深入的探讨与分析,观察其于结构微观层面上的特征...
汽车技术领域正处于关键的转折点,其未来依托于动态且适应性强的系统,并可通过软件不断提升驾驶体验。
连接标准联盟很高兴宣布 Matter 1.4 现已正式发布,可供设备制造商和生态平台开发应用。这次更新是Matter生态系统迈出的重要一步。Matter 1.4带来了一系列增强功能......
根植雄厚研发实力及物联网领域的深耕实践,汇顶科技面向新兴车载互联应用全力进击。旗下首款高可靠性、高性能车规级低功耗蓝牙SoC——GR5405,已成功通过AEC-Q100 Grade 2认证。
据36氪报道,保时捷负责采购的执行董事傅伦轲(Barbara Frenkel)向其透露,“我正在与电池、ADAS、互联、娱乐系统等方向的中国供应商接触,希望建立新的合作。”今年前三季度,保时捷在中国市
台积电7nm停供中国大陆!集微网报道称,从多个消息源获悉,台积电已经向目前所有中国大陆AI芯片客户发送正式电子邮件,宣布自下周(11月11日)起,将暂停向中国大陆AI/GPU客户供应所有7纳米(nm)
近几年,越来越多的中国电子零部件企业将目光投向海外市场,寻求“出海”机会。有一家坐落于深圳龙岗坂田的企业,在高端豪华车、工业控制上的产品成功获得了行业标杆客户的订单,出口额更是突破百万美元,成为“出海
东芝电子今日宣布,最新开发出一款用于车载牵引逆变器[1]的裸片[2]1200 V碳化硅(SiC)MOSFET“X5M007E120”,其创新的结构可实现低导通电阻和高可靠性。X5M007E120现已开
英国豪华跑车制造商路特斯宣布,由于市场需求变化和市场环境演变,公司将在英国裁员 200 人。上周,路特斯向员工确认了裁员消息,表示公司将尝试重新安置部分员工,并计划探索如何“在企业内部保留特定技能和知
国芯网[原:中国半导体论坛] 振兴国产半导体产业!   不拘中国、放眼世界!关注世界半导体论坛↓↓↓世界先进11月11日公告,位于桃园的晶圆三厂于下午12:10分因供电系统设备异常,致使厂区电力中断,
11月12日,百度创始人李彦宏在百度世界2024大会上表示,智能体是AI应用最主流的形态,即将迎来爆发点,这里是李彦宏演讲完整视频。●付费专栏文章小白自媒体赚钱,年入十万不是梦:专栏介绍 丨小白自媒体
中国新能源车市场的变化速度用“日新月异”来形容毫不夸张,短短几年时间,车企们的发力方向就从“冰箱彩电大沙发”的卷配置,到猛堆电池的卷续航,再到蜂拥而上卷智能化。各种方向的技能树都没少点,但由于补能效率
艾迈斯欧司朗今日宣布,推出新一代高性能LED——OSCONIQ® C 3030。这款尖端LED系列专为严苛的户外及体育场照明环境而设计,兼具出色的发光强度与卓越的散热效能。其支持高达