腾讯混元视频大模型实测：功能丰富，细节待提升

人工智能领域近期发展迅猛，尤其在AI视频生成领域，竞争日益白热化。OpenAI的Sora虽然引发广泛关注，但至今未正式推出，反倒是亚马逊云科技的Nova Reel和谷歌的Veo率先面向市场。国内企业也积极布局，快手推出“可灵”，清华大学与北京数生科技合作推出Vidu，腾讯则推出了混元文生视频大模型。

腾讯，凭借其在国内互联网行业的领先地位，此次推出混元大模型，标志着其在AI技术研发领域迈出了重要一步，也回应了外界对其技术实力的长期质疑。

混元大模型拥有130亿参数，是目前参数规模最大的开源视频生成大模型之一。其元宝App公测期间，用户可多次生成5秒长度的视频，并可自定义视频比例、风格、景别等参数。然而，用户反馈显示，尽管画面较为逼真，但模型存在与预期偏差的问题。例如，在生成“夕阳西下，少女坐在靠窗的书桌前”的场景时，模型生成的视频中出现白人女孩，且细节刻画不足，与用户描述存在明显差异；描述天气变化的场景时，模型也无法准确体现。

为了测试模型的一致性，用户使用相同的描述和参数进行多次生成，结果显示视频细节存在差异，但总体效果仍未能完全符合预期。相比之下，Vidu和可灵在相同条件下表现更为出色，细节捕捉和场景还原更为准确。这表明，虽然混元模型在参数量上占有优势，但在细致度和准确性方面仍有提升空间。

客观来看，混元大模型作为一款新兴的视频生成模型，其进步值得肯定。它实现了从无到有的突破，为腾讯在AI视频生成领域奠定了基础。未来，随着技术的迭代和算法的优化，相信腾讯凭借其强大的技术团队和资源，能够不断改进模型性能，缩小与国际领先水平的差距。

腾讯混元视频大模型实测：功能丰富，细节待提升

2025年或将成为AI视频生成大模型爆发之年，视频长度有望从秒级提升至分钟级，这将深刻改变文娱产业。腾讯、快手等国内企业已积极参与竞争，未来能否在全球市场脱颖而出，值得期待。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

腾讯混元视频大模型实测：功能丰富，细节待提升

相关推荐

发表回复