在2024世界人工智能大会期间,快手举办了以“新AI·新应用·新生态”为主题的大模型论坛。会上,快手大模型首次集体亮相,其中视频生成大模型“可灵”和图像生成大模型“可图”等产品的多项新功能正式发布。继图生视频、视频续写功能发布后,“可灵”在一个月内迎来了第三次重大升级,其网页端(可灵大模型 | AIGC工具导航)也正式上线。
快手高级副总裁、主站业务与社区科学线负责人盖坤介绍,快手已搭建了以快意语言大模型、推荐大模型、视觉生成大模型为核心的“大模型矩阵”,涵盖内容生产、理解、推荐等多个层面,并深度服务快手的商业生态场景。
近年来,视频生成类AI产品的飞速发展引起了广泛关注。此次“可灵”AI发布新功能后,有哪些值得关注的变化呢?
继图生视频、视频续写功能发布之后,“可灵”AI在一个月内迎来了第三次重大升级。在本届论坛上,快手宣布“可灵”AI基础模型再度升级,推出了更加清晰的高画质版,并新增了首尾帧控制、镜头控制等全新编辑能力。
快手视觉生成与互动中心负责人万鹏飞表示,“可灵”AI大模型最新发布的版本中,在运动生成、生成时长、物理规律、视频画质、指令响应、图生视频、视频可控性等7个方向的能力亮点实现进一步升级,可单次生成更高清更可控的10秒及更长的视频。
盖坤介绍,截至目前,“可灵”内测申请用户已超过50万,视频生成数量达700万。用户通过“可灵”创作的“老照片复活”等作品因其触动人心的力量火爆全网。为进一步激发AI爱好者们的创作热情,快手还在论坛上正式发起了“灵”感迸发——首届“可灵”AI x 快影视频创作大赛,联动六大院校,总奖金池超30万元。
在图像生成大模型领域,快手的“可图”拥有多项核心优势能力,如强大的复杂语义理解能力、摄影级的画面质感、多条件的可控风格化生成等。
盖坤介绍,“可图”大模型集成了快手在大语言模型领域的深厚积累,通过数十亿中文语料的训练,树立了中文场景下图像生成的新标杆。本次论坛上,快手宣布“可图”正式开源,这一举措旨在激发行业活力,共建一个更为繁荣的文生图大模型社区生态。
会上,中国计算机学会(CCF)还宣布与快手携手,共同成立“CCF-快手大模型探索者基金”,并同步开启基金申请通道。该基金计划于年内推出12个研究项目,课题最高可获30万元支持,旨在应对AI技术迅猛发展的趋势及业界对前沿技术的迫切需求,聚焦新一代大模型的关键技术研发。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。