谷歌DeepMind新AI可为视频生成配乐和对白，填补了同步视听生成的空白-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 扫一扫

扫码查看更多文章

DeepMind在其官方博客上写道：”视频生成模型正以惊人的速度发展，但目前的许多系统只能生成无声输出。V2A技术‘可能’成为让生成的电影栩栩如生的一种有前途的方法”。

近日，Google的人工智能（AI）研究实验室DeepMind表示，它正在开发为视频生成配乐的人工智能技术——V2A技术（”视频到音频”的缩写）。这项技术被视为人工智能在媒体创作领域的重要进展，旨在解决现有AI模型无法同时生成音效的问题。

据悉，V2A技术的独特之处在于其能够自动匹配音频和视频场景，填补了当前AI生成媒体中同步视听生成的空白。此外，该技术还通过训练系统在大量视频、音频和AI生成注释的基础上学习如何将特定的声音与视频内容关联起来。

V2A技术与视频生成模型如Veo集成，可以大幅提升创意制作能力，实现对话、音效和音乐与视频的无缝匹配。这意味着创作者可以更加专注于内容创作本身，而不是花费大量时间在音频编辑上。此外，这项技术解决了AI视频生成中缺乏同步音频的问题，推动了视频内容创作的新可能性。

V2A技术能够创造出具有戏剧性配乐、逼真音效或与视频角色以及风格相匹配的对话镜头。这种无缝匹配的音频和视频结合能够显著提升观众的观看体验，使视频内容更加生动和引人入胜。

尽管V2A技术带来了许多积极影响，但也存在一些局限性。此外，语音同步也存在待改进之处。DeepMind正在努力解决这些问题，并与顶级创作者合作改进技术。

为了确保V2A技术对创意社区产生积极影响，DeepMind正在收集来自顶尖创作者和电影制作人的多元视角和见解，并利用这些宝贵的反馈进行改进。这种开放的态度有助于不断优化技术，使其更好地服务于创作者和观众。

V2A技术被认为是一个充满希望的未来发展方向，即无声视频可以通过声音赋予生命，这对科技爱好者和音视频行业的专业人士来说是一个重要的突破。随着技术的不断进步和完善，其对创作者和观众的实际影响将会越来越显著。

DeepMind 在其官方博客上发表文章称，V2A技术是人工智能生成媒体拼图中必不可少的一部分。虽然包括 DeepMind在内的许多机构已经开发出了视频生成人工智能模型，但这些模型无法在生成视频时同步生成音效。

DeepMind写道：”视频生成模型正以惊人的速度发展，但目前的许多系统只能生成无声输出。V2A技术‘可能’成为让生成的电影栩栩如生的一种有前途的方法”。“通过对视频、音频和附加注释进行训练，我们的技术学会了将特定音频事件与各种视觉场景联系起来，同时对注释或文本中提供的信息做出响应。”

责编：Jimmy.zhang

阅读全文，请先

人工智能业界新闻

您可能感兴趣

台积电对中国大陆断供7nm芯片？业内人士回应可能性不大

有分析认为，台积电断供7纳米及更先进工艺的芯片，一方面是回应此前的“白手套”事件，配合美国对中国大陆人工智能产业发展进行限制，以避免进一步的法律和政治风险，另一方面则是向新一任总统特朗普“投诚”，毕竟时间点很微妙。

小鹏汽车发布全球首颗可同时应用AI汽车、AI机器人、飞行汽车的芯片

这款芯片不仅适用于AI汽车，还可以应用于AI机器人和未来可能的飞行汽车领域，体现了小鹏在智能化领域的雄心壮志。据悉，图灵AI芯片的算力非常强大，一颗芯片的算力相当于三颗主流智驾芯片。这使得它能够同时驱动自动驾驶系统、智能座舱大模型等多种应用。

亮相IIC Shenzhen 2024，爱芯元智仇肖莘分享AI时代半导体新机遇

由于较早预判了transformer网络架构的发展，爱芯通元AI处理器原生支持transformer，这也保证了其能效比领先于更高端的AI芯片，更加契合边缘大模型的落地应用。基于爱芯智眸AI-ISP和爱芯通元NPU两大核心技术，爱芯元智在智慧城市、智能驾驶和边缘智能等领域不断落地。

2024全球CEO峰会：边缘AI重塑物理世界，开启万物智能时代

作为IIC Shenzhen 2024主论坛之一，2024全球CEO峰会以“边缘·芯未来”为主题，邀请全球领先的半导体技术厂商探讨和分享边缘AI技术在硬件和软件上的创新和布局，以及边缘AI的发展为半导体产业带来的巨大的市场机遇和技术挑战。

芯原汪洋：塑造智能计算未来，为AI技术应用赋能

汪洋特别提到，第十三届芯原CEO论坛五大预测之一是2028年用于端侧微调卡和推理卡的销售额将超过用于云侧的训练卡。目前，推理和端侧微调也是芯原重点关注的领域，同时也希望在这一发展趋势中寻找新的机遇。

三星8英寸晶圆代工部门将裁员30%以上！自愿退休员工可获200万元赔偿

三星电子的晶圆代工业务亏损重要原因之一是错失HBM风口和尖端制程良率问题。作为全球最大的存储芯片制造商，三星电子巅峰时期曾独占全球45%以上的内存市场。然而，近两年来，三星电子在先进制程芯片及AI芯片领域的进展缓慢。

晶体管架构世代交替——由FinFET到GAAFET

为了更直观地了解FinFET到GAAFET架构世代的差异，本文利用高倍率的电子显微镜影像进行深入的探讨与分析，观察其于结构微观层面上的特征...

Arm引领软件定义汽车革新，共同迈向汽车行业未来

汽车技术领域正处于关键的转折点，其未来依托于动态且适应性强的系统，并可通过软件不断提升驾驶体验。

Matter 1.4 让智能家居更强大

连接标准联盟很高兴宣布 Matter 1.4 现已正式发布，可供设备制造商和生态平台开发应用。这次更新是Matter生态系统迈出的重要一步。Matter 1.4带来了一系列增强功能......

共赢智能车联新纪元！汇顶科技与联合电子签署战略合作协议

根植雄厚研发实力及物联网领域的深耕实践，汇顶科技面向新兴车载互联应用全力进击。旗下首款高可靠性、高性能车规级低功耗蓝牙SoC——GR5405，已成功通过AEC-Q100 Grade 2认证。

消息称：台积电7nm、三星7nm停供中国大陆！

台积电7nm停供中国大陆！集微网报道称，从多个消息源获悉，台积电已经向目前所有中国大陆AI芯片客户发送正式电子邮件，宣布自下周（11月11日）起，将暂停向中国大陆AI/GPU客户供应所有7纳米（nm）

歌尔股份被曝成为苹果两款新品供应商；百度文心大模型日均调用量超15亿；马斯克身价突破3300亿美元|日报

互联网与科技企业每日重点资讯文 | 苏丁巨头动向歌尔股份被曝成为苹果2026年两款新品供应商天风国际分析师郭明錤爆料称，苹果将首次进军智能家居IP Camera（网络摄像头）市场，计划2026年量产，

东芝推出具有低导通电阻和高可靠性的适用于车载牵引逆变器的最新款1200 V SiC MOSFET

东芝电子今日宣布，最新开发出一款用于车载牵引逆变器[1]的裸片[2]1200 V碳化硅（SiC）MOSFET“X5M007E120”，其创新的结构可实现低导通电阻和高可靠性。X5M007E120现已开

路特斯宣布裁员200人

英国豪华跑车制造商路特斯宣布，由于市场需求变化和市场环境演变，公司将在英国裁员 200 人。上周，路特斯向员工确认了裁员消息，表示公司将尝试重新安置部分员工，并计划探索如何“在企业内部保留特定技能和知

最高5亿，又4家MicroLED企业完成融资

会议预告活动倒计时 8 天11月20-21日 | 行家说新型显示全产业链年会近期，点莘技术、秋水半导体、纳视智能、睿励科学仪器等4家Micro LED相关企业相继完成新一轮融资，单笔金额最

东风日产宣布成为首个与鸿蒙座舱全方位合作的合资品牌

11月12日，东风日产宣布成为首个与华为鸿蒙座舱全方位合作的合资品牌，双方将共创智能舒适的出行体验。近日，东风日产副总经理周锋在接受采访时分享了公司

拒绝认罪！华为要求美国法官驳回指控

EETOP 11月12日消息，据外媒报道，华为公司已要求美国法官驳回一项联邦起诉书中的大部分指控。该起诉书指控华为试图窃取美国竞争对手的技术机密，并在其伊朗业务问题上误导银行。华为在上周五晚间提交给法

研鼎邀您共赴第二届图像质量评价原理与实践研讨会及培训会（北京站）

ABOUT US研鼎公司总部位于上海浦东张江高科技园区，在深圳、北京和韩国设立研发和运营。是影像测试设备与解决方案领军企业，致力于视觉测试设备和分析软件产品的研发，可为客户提供优质的影像实验室Turn

突发！三星7nm停供！

国芯网[原:中国半导体论坛] 振兴国产半导体产业！不拘中国、放眼世界！关注世界半导体论坛↓↓↓11月12日消息，据台媒报道，继台积电宣布对中国大陆AI芯片企业暂停7nm及以下先进制程代工服务后，

艾迈斯欧司朗发布OSCONIQ® C 3030 LED：打造未来户外及体育场照明新标杆

艾迈斯欧司朗今日宣布，推出新一代高性能LED——OSCONIQ® C 3030。这款尖端LED系列专为严苛的户外及体育场照明环境而设计，兼具出色的发光强度与卓越的散热效能。其支持高达

文章评论

最新
热门

换一换

EE直播

更多>

谷歌DeepMind新AI可为视频生成配乐和对白，填补了同步视听生成的空白

杂志声明