图森未来发布Ruyi视频大模型，可由消费级显卡运行

近日，图森未来在人工智能领域取得重大突破，正式发布了其全新图生视频大模型——“如意 (Ruyi)”。更值得关注的是，他们开源了Ruyi-Mini-7B版本，用户可在Hugging Face平台免费下载并使用。

Ruyi采用独特的DiT架构，由Casual VAE模块（负责视频数据的压缩与解压）和Diffusion Transformer模块（负责生成压缩后的视频内容）两大核心模块构成。该模型拥有约71亿参数，训练数据包含约2亿个视频片段，力求为用户提供高效便捷的视频生成体验。其设计理念注重模型效率，尤其优化了在消费级显卡（例如RTX 4090）上的运行性能，降低了使用门槛。

Ruyi功能强大，支持多种分辨率（384*384至1024*1024）和时长（最长120帧或5秒）的视频生成，并可任意设置长宽比。用户可以通过控制首帧和尾帧（最多5个起始帧和5个结束帧）来定制视频内容，并利用循环叠加功能创建任意长度的视频。此外，Ruyi还提供4档运动幅度控制和5种镜头控制选项（上、下、左、右移动和静止），赋予用户更精细的画面控制能力。

尽管Ruyi功能强大，但目前仍存在一些不足，例如手部动作不够自然、多人场景中面部细节可能失真以及转场效果的不可预测性。图森未来团队已承认这些问题，并表示将在后续版本中逐步改进。

图森未来发布Ruyi视频大模型，可由消费级显卡运行

图森未来表示，Ruyi的发布旨在利用AI技术提升动漫和游戏内容的生产效率，降低制作成本。目前Ruyi已具备根据用户输入的关键帧自动生成后续5秒内容，或根据两个关键帧生成过渡画面的能力。未来，图森未来计划推出更多版本的Ruyi，以满足不同用户的需求。 Ruyi的开源，无疑将加速AI视频生成技术的发展，并为更多开发者提供探索和创新的机会。

对于希望尝试Ruyi-Mini-7B版本的开发者，请访问以下开源链接： [此处应添加开源链接]

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

图森未来发布Ruyi视频大模型，可由消费级显卡运行

相关推荐

发表回复