随着人工智能技术的不断发展,“AI”正在深刻地影响着我们的日常生活,内容创作行业也不例外。作为成立12年的音频平台,喜马拉雅一直致力于科技赋能文化,构建了一个内容丰富多元的“声音宇宙”。截至2023年12月底,喜马拉雅已积累了包含459个品类的4.88亿条音频,总内容时长超过36亿分钟,覆盖从-1岁到100岁不同年龄段的用户需求,满足不同用户群体的独特喜好。
在近期举办的2024云栖大会上,喜马拉雅正式发布了其自主研发的“珠峰AI音频多模态大模型”,也称为“喜马拉雅音频大模型”,展示了该模型的强大功能、应用场景以及商业化案例。该模型依托喜马拉雅超百万小时的自有版权音频数据进行深度学习和训练,具备情感输出、自然表达、语种互译、极速克隆等技术能力,并在音频生成领域取得了多项突破性进展。目前,该模型已广泛应用于有声书等领域,并有望持续推动音频大模型行业的创新和发展。
基于“珠峰AI音频多模态大模型”,喜马拉雅在云栖大会上推出了“珠峰AI创作服务平台”。该平台利用阿里巴巴的通义文本大模型对文本内容的语义进行深层理解,结合喜马拉雅独有的全品类音色库和数字人大模型,为内容创作者提供高品质的AIGC音频和数智人服务。用户可以在“珠峰AI数智人平台互动体验区”体验AI技术带来的全新声音创作方式,例如:极速体验全领域多品类535种AI音色库生成各种AIGC音频内容、15秒内快速定制真人数智人形象、10秒内快速克隆声音(不仅仅是音色克隆,还包含韵律、腔调、口吻等“语流”信息)等等,感受AI技术高效便捷地赋能内容创作者,提高创作效率。
AI正在深刻赋能和影响着喜马拉雅的发展。数据显示,2023年喜马拉雅全场景平均月活跃用户达3.03亿,体现了其强大的用户基础和平台影响力。截至2023年12月,喜马拉雅平台AIGC内容达2.4亿分钟,占其音频内容的6.6%。同时,喜马拉雅移动端平均月活跃用户的AIGC渗透率已达14.8%。这些数据表明,AI技术正在逐渐成为喜马拉雅内容创作的重要力量,未来有望为用户带来更多优质的音频内容。
据灼识咨询资料显示,喜马拉雅拥有中国最全面的音频内容生态,包括体量最大的音频内容库和数量最多的音频内容创作者。截至2023年12月,喜马拉雅拥有约4.9亿条音频内容,总内容时长为36亿分钟,拥有丰富的资源优势,使其在AI时代能够轻松获取海量且多样化的在线音频内容,不断提升其AI能力。这也成为喜马拉雅在AI时代保持竞争优势的关键因素之一。