在人工智能飞速发展的今天,内容创作的界限正被不断拓宽。音乐,作为一种高度情感化和技术性的艺术形式,也正迎来AI带来的深刻变革。近期,Google DeepMind推出的一款名为Lyria 3的AI音乐生成模型,无疑是这一趋势下的一个重要里程碑,它以令人惊叹的易用性和强大的创作能力,向全球用户敞开了AI音乐创作的大门。
Google DeepMind已正式发布其最新一代AI音乐生成模型Lyria 3。该模型现已作为Beta版本集成至Gemini应用中,并对全球18岁及以上的用户免费开放。
Lyria 3 最为引人注目的,是其全场景的创作能力。即便是缺乏音乐背景的普通用户,也能通过三种便捷的方式轻松生成音乐。用户只需输入自然语言描述,例如“一段适合海滩派对的欢快雷鬼歌曲”或“关于太空探索的史诗级电子音乐”,模型便能迅速生成包含人声、歌词及器乐伴奏的完整30秒歌曲,自动匹配描述的风格、情绪和节奏。

此外,用户还可以上传任意图片或截图,无论是风景、人像还是插画,Lyria 3都能分析图像的氛围,生成与之契合的原创音乐,并自动配套设计专辑封面。对于短视频创作者而言,上传一段视频片段,模型即可为其量身定制背景音乐,完美契合画面节奏与情感基调。
不过,Lyria 3目前仍存在两项主要限制。首先,生成的音乐长度固定为30秒,尚不能满足长篇音乐创作的需求。其次,该模型仅限于非商业用途;若需进行商业音乐创作,用户则需要寻求其他解决方案。Google方面表示,未来将逐步扩展功能,包括支持更长的音乐生成、提供更多语言支持,以及推出商业授权选项。
从技术角度分析,Lyria 3的出现意味着AI在理解多模态信息(文本、图像、视频)并将其转化为音频的复杂任务上取得了显著进步。其“全场景创作”的能力,不仅降低了音乐创作的门槛,更可能催生全新的内容生态。尤其是在个性化内容需求日益增长的当下,AI赋能的音乐创作工具,将为短视频、游戏、广告等行业提供前所未有的灵活度和效率。然而,其30秒的长度限制和非商业化规定,也预示着AI音乐在专业和商业领域的深度融合,仍需时间和技术的进一步迭代。