DeepMind 正开发可为视频生成配乐的 AI 技术_陀螺科技

我要发布

DeepMind 正开发可为视频生成配乐的 AI 技术

前方智能原创 2024-06-18 11:18 热度 2075

分享

微信扫一扫：分享

微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈

IP归属：广东

文章AI导读

一键萃取文章精髓，核心观点即刻呈现

# 梳理该事件的完整脉络

# 该文章有哪些有意思的观点或数据

# 大家对该事件的态度表现如何？

编译/前方智能

DeepMind 在其官方博客上的一篇文章中表示，他们正在开发用于为视频生成配乐的 AI 技术。DeepMind 将这项技术视为 AI 生成媒体拼图的重要组成部分。

图源：Google DeepMind

虽然目前包括 DeepMind 在内的许多 AI 公司都已经开发了文生视频的 AI 模型，但这些模型无法创建与生成的视频同步的音效。

DeepMind 的这项技术可以创建与视频中的角色和基调相匹配的音乐、音效甚至对话，并由 DeepMind 的深度伪造对抗技术 SynthID 加水印。

DeepMind 表示这个 AI 模型是一个扩散模型，通过对视频、音频和附加注释进行训练，他们的技术学会了将特定的音频事件与各种视觉场景联系起来，同时对注释或转录中提供的信息做出响应。至于使用的训练数据是否受版权保护，DeepMind 并没有在博客中说明。

目前这项技术还并不完美，再加上底层模型没有在大量带有伪影或失真的视频上进行训练，因此它不会为这些视频生成特别高质量的音频。基于这个原因，DeepMind 不会在近期向公众发布这项技术。

来源：TechCrunch

AI DeepMind 视频

陀螺科技现已开放专栏入驻，详情请见入驻指南： https://www.tuoluo.cn/article/detail-27547.html

前方智能专栏： https://www.tuoluo.cn/columns/author1911845/

本文网址： https://www.tuoluo.cn/article/detail-10113301.html

免责声明：
1、本文版权归原作者所有，仅代表作者本人观点，不代表陀螺科技观点或立场。
2、如发现文章、图片等侵权行为，侵权责任将由作者本人承担。

上一篇：波卡生态一周观察丨Web3基金会推出奖金高达1000万DOT的JAM实现者奖；波卡社区就市场营销展开讨论

下一篇：永安林业收到福建证监局警示函，已被罚股民仍可报名维权

相关文章

我用这本「40万字的AI指南」，让TRAE Work给我...

在这届WAIC上，我们看到了智能体、具身智能和算力的三大...

取次硅谷懒回顾，半缘DeepSeek半缘Kimi

一大批AI硬件，正在帮我们「教」孩子

当大模型搬进终端，AI手机竞赛全面提速

芯报丨三菱电机与索尼半导体解决方案公司将组建AI视觉合资...