阿里巴巴重磅!通义万相Wan2.1-VACE视频生成编辑模型全面开源

近日,阿里巴巴宣布全面开源其先进的视频生成与编辑模型——通义万相 Wan2.1-VACE,此举标志着中国在人工智能视频创作领域迈出了重要一步。这款模型具备强大的多功能性,涵盖了从文本到视频的生成、图像参考视频制作、视频重绘、局部编辑、背景延展及时长延展等一系列核心功能,为视频内容创作提供了更多可能性。

根据《科创板日报》的报道,此次开源的通义万相 Wan2.1-VACE 提供了两个版本:1.3B 和 14B。 其中,1.3B 版本因其较低的硬件需求而备受关注。这意味着即便是配备普通消费级显卡的设备也能流畅运行该模型,极大降低了用户的准入门槛。这一设计思路体现了阿里巴巴致力于推动AI技术普及化的决心,让更多个人开发者和小型团队也能参与到AI视频创作的浪潮中。

通义万相作为阿里云通义系列的重要组成部分,自 2023 年 7 月 7 日上线以来,便凭借其在 AI 绘画领域的出色表现赢得了市场认可。2024 年 9 月的阿里云栖大会上,阿里巴巴正式推出了通义万相的视频生成大模型。该模型不仅能够生成高质量、影视级的视频内容,还特别优化了对中文指令的理解和处理能力,使其在中文语境下的应用更具优势。这种对本土语言的支持,无疑将进一步提升其在中国市场乃至全球华人社群中的实用价值。

阿里巴巴重磅!通义万相Wan2.1-VACE视频生成编辑模型全面开源

回顾通义万相的发展历程,其视频生成模型在短短几个月内实现了显著的技术迭代,从初版升级到 2.1 版本。今年 1 月,通义万相宣布升级至2.1版,并在复杂运动处理、真实物理规律还原、电影质感提升以及指令遵循优化等关键领域取得了显著突破。这些改进不仅大幅提升了模型生成视频的质量,也使其在处理复杂场景和用户指令时更加精准高效。相较于其他同类模型,通义万相在模拟真实世界物理规律方面的进步,使其生成的视频更具真实感和沉浸感。

2 月 25 日,阿里巴巴宣布全面开源通义万相 2.1 视频生成模型。这一举措不仅展示了阿里巴巴在 AI 技术领域的开放姿态,也为全球开发者提供了一个宝贵的学习和试验平台。开源意味着开发者可以自由地研究、修改并基于该模型进行二次开发,从而加速 AI 视频生成技术的发展和创新。 预计未来将涌现出大量基于通义万相的创新应用和行业解决方案,推动视频内容创作领域的变革。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,可联系本站进行审核删除。
(0)
AI快讯网编辑-青青AI快讯网编辑-青青
上一篇 2025年 5月 14日 下午11:06
下一篇 2025年 5月 15日 上午12:55

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!