最新评测数据显示,全球人工智能图像生成模型的竞争格局已基本成型。结果显示,OpenAI 的 GPT-Image-1.5 以 87.03 分稳居总榜榜首,腾讯 Hunyuan-Image-3.0-Instruct 以 83.00 分拿下国内第一,字节、阿里等国产模型紧随其后,形成紧追海外头部的第一梯队。这一排名不仅反映了各模型在技术指标上的硬实力,也揭示了当前多模态领域的发展趋势。
GPT-Image-1.5 凭借均衡的综合实力领跑,其通用能力得分为 85.22 分,场景应用能力更是达到 88.83 分,在语义理解与视觉工程能力上展现出明显优势。作为海外技术的代表,其在复杂指令遵循和画面细节处理上依旧保持着较高的壁垒,为全球用户树立了新的标杆。
国内阵营中,腾讯 Hunyuan-Image-3.0-Instruct 表现突出,以 83.00 分跻身总榜前列,成为国内模型的领头羊。该模型场景应用能力达 83.89 分,在中文语义理解与创意表达上贴合本土需求,支持网页端直接获取,便捷性广受认可。这表明国产模型在特定垂直场景和本地化服务上已经具备了与国际巨头抗衡的能力。
字节 Doubao-Seedream-5.0-lite 与阿里 Qwen-Image-2.0-Pro 分别以 81.77 分、81.39 分紧随其后,构成国产第一梯队。这些模型在快速迭代中不断缩小与领先者的差距,特别是在生成速度和成本控制上展现了中国互联网企业的工程化优势。
细分能力方面,通用能力榜单由 Google 的 Nano Banana 2 与 GPT-Image-1.5 领跑,国内则以字节 Doubao-Seedream-5.0-lite 和阿里 Wan2.6-Image 并列第一。然而,客观来看,但在复杂视觉推理维度,国内外模型仍存在超 10 分的差距,成为国产模型的主要提升方向。这一差距主要体现在对多层逻辑关系的理解以及长上下文的一致性保持上,是需要通过底层架构创新来解决的核心问题。
综合分析认为,虽然国产模型在总分上已接近国际水平,但在“硬核”推理能力上仍需积淀。未来,随着训练数据的丰富和算法架构的优化,预计国内厂商将在视觉推理短板上进行针对性突破,进一步推动人工智能图像生成技术在实际产业中的落地应用。
