谷歌Gemini推出音乐模型,一句话创作歌曲

谷歌Gemini应用整合DeepMind最先进音乐模型Lyria 3,用户可用文字描述或图片在数秒内生成30秒音乐片段。该模型支持多种创作方式,并已向全球18岁以上用户开放。此举可能对流媒体音乐平台构成竞争压力,并促使其加快AI功能研发。谷歌也通过版权保护技术尝试平衡创新与知识产权。

Rain科技2月20日报道,据媒体消息,谷歌宣布其Gemini应用已正式集成DeepMind旗下先进的音乐生成模型Lyria 3。这意味着用户只需提供一段文字描述或一张照片,便能在数秒内生成一段时长约30秒的完整音乐片段。

谷歌方面介绍,Lyria 3的创作方式十分灵活。用户可以通过“描述一个想法”,例如指定特定的音乐风格、表达某种情绪或设定节奏,模型就能够自动生成包含人声、歌词和伴奏的歌曲。此外,用户还可以上传照片或视频,Lyria 3能够分析画面所传达的氛围,并创作出与之匹配的背景音乐,同时还会由Nano Banana设计独具特色的封面。

对于YouTube创作者而言,还可以通过“Dream Track”功能探索Lyria 3的潜力,为他们的Shorts短视频添加配乐。此功能目前已在美国推出,并计划逐步扩展到其他地区。

谷歌Gemini上线音乐模型 一句话即可生成歌曲

此消息公布后,欧美流媒体音乐平台Spotify的股价一度回吐了当日近5%的涨幅,Sirius XM的股价也短暂转为下跌。市场分析认为,虽然Lyria 3在短期内不太可能对Spotify造成致命性的冲击,但它可能会促使Spotify加快推出类似的AI混音功能,以应对潜在的市场竞争。

从谷歌的角度来看,将音频生成工具集成到其移动应用中,不仅有助于提升其消费者产品的竞争力,也向投资者展示了其在人工智能领域投入的实际变现能力。

值得注意的是,在用户提示中如果提及真实音乐人的名字,Gemini只会将其视为“广泛的创作灵感来源”,从而生成风格或氛围相似的作品,并且会设置相应的过滤器来防止输出侵权内容。同时,所有生成的音乐曲目都会通过SynthID技术嵌入不易察觉的水印,以便于识别和追踪AI创作的内容。

生成式AI在音乐行业一直伴随着谨慎甚至抵触的态度,许多从业者担心其会对既有的商业模式和知识产权构成威胁。此次谷歌通过技术手段明确界定相关边界,正是试图在技术创新与权益保护之间寻求一种平衡。

目前,Lyria 3已向全球年满18周岁的用户开放使用,并支持包括英语、德语、西班牙语、法语、印地语、日语、韩语、葡萄牙语等多种语言。谷歌表示,未来还将继续扩展支持的语言种类,并不断提升生成音乐的质量。

谷歌Gemini上线音乐模型 一句话即可生成歌曲

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
Rain科技Rain科技
上一篇 2026年 2月 20日 上午6:37
下一篇 2026年 2月 20日 上午9:25

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!