生成式视频赛道正迎来关键的技术落地节点。当大多数模型仍在追求生成的时长与清晰度时,可控性与编辑能力已成为新的竞争焦点。通义实验室此次将最新模型直接整合至移动端应用,标志着多模态能力正从技术演示走向大众化日常使用。
4 月 3 日,通义 APP 正式上线全新的万相 2.7 视频生成模型。凭借更全面的创意控制能力,通义 APP 推出了三大核心功能:视频编辑、视频延展以及动作模仿。仅需寥寥数语,即可实现视频中猫、狗或人物的替换。

通过视频编辑功能,用户只需输入简单指令即可修改场景:在画面中添加人物、更换服饰、调整背景环境,整体光照与细节将自然匹配。此外,视频风格支持一键切换,可快速实现动画、3D、粘土等多种创意风格。
用户还可直接修改剧情内容,例如调整人物动作、表情,甚至更改对话,同时保持口型与语调自然一致。同一视频可切换不同拍摄手法,如改变镜头角度或推拉变焦,赋予场景截然不同的视觉感受。
通义 APP 支持视频延展功能,可将 2 秒的视频最长扩展至 15 秒。用户只需上传已有的短视频,即可一键生成后续内容。通义 APP 还提供了更精细的创意控制方法,允许用户基于首尾帧进行调整,确保内容连贯性的同时维持整体结构稳定,过渡更加平滑,生成结果可控且连贯。
在动作模仿方面,用户可基于参考视频,让视频中的人物复刻相同动作,包括多人协作或更复杂的动作变化。同时,视频中的运镜节奏与特效韵律也可被复刻,使得创意表达的迁移与重现更为便捷。
据悉,此前发布的图像生成与编辑统一模型万相 2.7-Image 也已登陆通义 APP。目前,万相 2.7 图像模型与视频模型已在通义 APP 全面上线,所有用户均可免费体验。
此次全免费开放策略,无疑将进一步降低 AI 视频创作的门槛,加速内容生态的繁荣。随着可控编辑能力的提升,AI 视频工具正逐步从“玩具”转变为生产力组件,未来在短视频创作、广告制作等场景的应用潜力值得期待。