腾讯混元视频生成工具全新开源:人物不会“变脸” 物体不会“漂移”

Rain科技5月9日消息,腾讯混元今天正式宣布推出并开源其全新的多模态定制化视频生成工具HunyuanCustom。

据悉,HunyuanCustom模型是在混元视频生成大模型(HunyuanVideo)的基础上构建的,其在主体一致性方面的表现优于现有的开源解决方案。这意味着使用该工具生成的视频,主体人物或物品在不同场景和动作中能够保持高度的统一性,减少了以往AI视频生成中常见的“变脸”或“漂移”问题。

据介绍,HunyuanCustom融合了文本、图像、音频、视频等多模态输入生成视频的能力,是一款智能化视频创作工具,它具备高度的控制力和优秀的生成质量。这种多模态融合的能力,让用户可以更灵活地控制视频的内容和风格,实现更精细化的定制。

在很多实际应用场景中,创作者经常希望在保持人物形象不变的前提下,改变人物所处的环境或执行的动作。例如,电商卖家可能需要快速制作不同背景下的商品展示视频,或者广告公司需要为同一位模特制作各种不同风格的服装广告。

然而,此前的视频生成模型往往难以实现这种程度的精准控制,主体一致性问题突出。

HunyuanCustom通过引入身份增强机制和多模态融合模块,有效地解决了这个问题,真正实现了“图像提供身份,文本定义一切”的理想状态。用户只需提供一张人物照片,然后通过文本描述来指定人物的动作和场景,HunyuanCustom就能生成符合要求的视频内容。

HunyuanCustom的设计目标是满足视频创作者、短视频博主、电商从业者、广告创意人等不同用户在各种场景下的需求。它不仅降低了视频创作的门槛,还大大提高了创作效率。

例如,在广告场景中,HunyuanCustom可以帮助广告人员快速变换商品背景,或者让模特快速更换服装,从而快速生成不同版本的广告素材。在电商和客服场景中,它可以低成本地制作出生动的数字人商品介绍视频,或者制作特定穿着的数字人客服视频,提升用户体验和营销效果。在影视场景中,创作者可以利用它快速制作短剧和小故事短视频,探索新的内容形式。

此外,HunyuanCustom凭借其业内领先的主体一致性建模能力,在单人、非人物体、多主体交互等多种复杂场景中,都能确保身份特征在视频全程保持一致性和连贯性。正如官方宣传所说,使用HunyuanCustom生成的视频,人物不会“变脸”,物体不会“漂移”。

目前,单主体生成能力已经开源并在混元官网上线,用户可以在“模型广场-图生视频-参考生视频”中进行体验。根据官方计划,HunyuanCustom的其他更高级功能将于5月内陆续对外开源,这将进一步丰富用户的创作工具箱。

在单主体生成能力下,用户只需上传一张目标人物或物体的图片,并提供一句如“他正在遛狗”的文本描述,Hunyuan Custom就能在完全不同的动作、服饰与场景中生成连贯自然的视频内容。这为用户提供了极大的创作自由,可以轻松制作出各种创意视频。

腾讯混元视频生成工具全新开源:人物不会“变脸” 物体不会“漂移”

在多主体视频的生成中,用户提供一张人物和一张物体的照片,并输入文字描述,即可能让这两个主体按要求出现在视频里。例如,用户可以上传一张人物的照片和一张汽车的照片,然后输入“这个人在驾驶汽车”的描述,HunyuanCustom就能生成一段人物开车的视频。

腾讯混元视频生成工具全新开源:人物不会“变脸” 物体不会“漂移”

Hunyuan Custom的功能远不止于图像和文本的简单配合,它还具备强大的扩展能力,支持更多模态的输入和控制。

在音频驱动(单主体)模式下,用户可以上传人物图像并配上音频语音,模型便可生成人物在任意场景中说话、唱歌或进行其他音视频同步表演的效果。这种能力广泛适用于数字人直播、虚拟客服、教育演示等需要实时互动和表现的场景,为用户提供了更加生动的互动体验。

腾讯混元视频生成工具全新开源:人物不会“变脸” 物体不会“漂移”

在视频驱动模式下,Hunyuan Custom支持将图片中的人物或物体自然地替换或插入到任意视频片段中,进行创意植入或场景扩展。用户可以利用这一功能轻松实现视频重构与内容增强,例如,将自己的照片植入到电影场景中,或者为现有视频添加新的特效和元素。

腾讯混元视频生成工具全新开源:人物不会“变脸” 物体不会“漂移”

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
Rain科技Rain科技
上一篇 2025年 5月 9日 上午11:45
下一篇 2025年 5月 9日 下午2:33

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!