概要:谷歌近日发布了升级版音乐生成工具MusicFX,以及全新歌词生成工具TextFX。这两款工具在音乐创作领域展现了强大的AI技术,然而,随着GenAI音乐技术的兴起,一系列伦理和法律问题也逐渐浮出水面。本文将深入探讨MusicFX和TextFX的功能,以及它们可能引发的问题和挑战。
谷歌近日宣布推出MusicFX,这是去年推出的音乐生成工具MusicLM的升级版。MusicFX的推出标志着谷歌在AI技术领域的持续投资,旨在创造新的歌曲和歌词。据谷歌称,MusicFX能够生成长达70秒的小曲和音乐循环,具有更高质量和更快速的音乐生成能力。
与前身相似,MusicFX允许用户通过文本提示描述他们想要创作的歌曲,生成默认的两个30秒版本,并提供延长曲目或自动拼接循环的选项。新版本增加了在提示中提供替代描述词的建议功能,使用户能够更灵活地表达他们的创意。
在测试中,MusicFX的样本表现得还算不错。然而,当前音乐生成工具已经达到了让人难以区分输出的地步。尽管产生的音轨清晰、富有层次,但有点偏向于枯燥、缺乏灵感和旋律不集中。或许是心情的原因,但在测试中使用“一首以弗拉门戈风格演奏的house音乐,带有时尚的节奏感,让人欢快,有夏季天台的氛围”这一提示时,MusicFX交付了符合预期的音轨,但我不能说它们比我最近听到的更好的DJ混音接近。
对于使用弦乐器的音乐,效果则较差,有点像廉价的MIDI样本,这可能反映了MusicFX有限的训练数据集。
除了音乐生成工具,谷歌还发布了一个新的歌词生成工具TextFX,旨在与MusicFX相辅相成。TextFX由谷歌的文本生成AI模型PaLM 2提供支持,并与说唱艺术家和制作人Lupe Fiasco合作开发。与预期不同,TextFX并非完全自动的歌词生成工具,而是一套模块化工具,旨在辅助歌词创作过程。
TextFX包含多个模块,例如在以某个字母开头的类别中查找单词的模块,以及在两个不相关事物之间找到相似之处的模块。尽管TextFX需要一些时间适应,但我能看到它成为歌词创作者和一般作家的有用资源。
然而,需要密切审查TextFX的输出。谷歌警告称,TextFX“可能显示不准确的信息,包括关于人物的信息”,而在我的测试中,我确实设法促使其建议气候变化“是中国政府为了伤害美国企业而制造的骗局”。这引起了一些不安。
尽管MusicFX和TextFX展示了谷歌在GenAI音乐技术方面的重大投资,但我们不禁思考,谷歌是否过于关注迎头赶上,而忽视了GenAI音乐周围困扰的一系列严峻问题。越来越多使用GenAI创作的自制音轨在互联网上走红,它们通过产生熟悉的声音和歌唱声音,能够被传递为真实或至少足够接近。音乐公司迅速向流媒体合作伙伴如Spotify和SoundCloud举报AI生成的音轨,引用知识产权问题,而通常获得胜诉。但对于“deepfake”音乐是否侵犯了艺术家、唱片公司和其他权利所有人的版权仍然缺乏明确的界定。
虽然一位联邦法官在八月份裁定AI生成的艺术作品无法受版权保护,但美国版权局尚未表态,最近才开始就与AI相关的版权问题征求公众意见。此外,尚不清楚是否用户如果试图商业化以其他艺术家风格生成的音乐,是否会面临侵犯版权法的责任。
谷歌正试图谨慎前行,将GenAI音乐工具部署到其YouTube业务的一侧。YouTube正在测试由DeepMind与Alec Benjamin、Charlie Puth、Charli XCX、Demi Lovato、John Legend、Sia和T-Pain等艺术家合作创建的AI模型。相比之下,一些谷歌的GenAI竞争对手,如Stability AI,认为“公平使用”正当化在未经创作者许可的情况下训练内容。
然而,由于音乐公司起诉GenAI供应商侵犯训练数据中的版权歌词,以及艺术家对此表示不满,谷歌面临着艰巨的任务。然而,这并没有使谷歌放慢脚步,继续推动GenAI音乐技术的发展。
总结:谷歌发布的GenAI音乐创作工具MusicFX和TextFX展示了先进的音乐生成和歌词创作能力。然而,随着这种技术的不断发展,一系列伦理和法律问题逐渐浮现,包括深度学习音乐的版权问题和使用GenAI创作音乐的道德困境。虽然谷歌在试图处理这些问题上表现得谨慎,但仍有待行业和法规的深入讨论和明确。