豆包大模型1.8：三大能力飞跃，比肩全球顶尖

Rain科技12月18日报道，在今日召开的火山引擎Force原动力大会上，豆包大模型1.8正式对外发布，该版本在多模态Agent能力上取得了显著进展，据称已达到或接近全球顶尖模型的水平。

此次发布的豆包大模型1.8，将优化重点聚焦于多模态Agent场景。通过在工具调用能力、复杂指令遵循能力以及OS Agent能力上的重点增强，该模型在处理复杂任务时的规划和执行水平得到了大幅提升。这意味着豆包大模型1.8在理解和执行人类提出的复杂指令，并在不同工具和系统之间进行协调以完成任务方面，将表现得更加出色。

根据评测数据显示，在视觉推理、通用视觉问答、空间理解和视频理解等一系列多模态任务中，豆包大模型1.8均取得了最佳或接近最佳的成绩。尤其在通用智能体测评集BrowseComp上的表现，更是展现出全球领先的实力。这表明该模型在理解和处理包含图像、视频等多种信息模态的任务时，具备了高度的智能化和准确性，这对于未来的AI应用，如智能客服、内容创作和辅助决策等领域，具有重要的实际意义。

与此同时，在语言模型的核心能力维度，例如数学和推理方面，豆包大模型1.8的整体水平也达到了与全球顶尖通用模型相媲美的程度。这进一步巩固了其作为一款综合性强大AI模型的地位，能够同时胜任语言理解和多模态信息处理等多种复杂任务。

目前，豆包1.8模型已正式上线火山引擎平台，并面向广大企业和开发者开放API接口。这意味着企业和开发者可以利用豆包大模型1.8强大的AI能力，将其集成到自己的产品和服务中，加速创新和业务发展。

此外，同场的还有豆包音视频创作模型Seedance 1.5 pro。该模型原生支持音视频联合生成，并在视听协同、视觉张力和叙事协调性等方面实现了技术突破，能够生成更具吸引力和连贯性的音视频内容。Seedance 1.5 pro目前已在豆包App（灰度测试）、即梦AI及火山引擎体验中心上线，预示着AI在多媒体内容创作领域正迈入新的发展阶段。

文章内容举报

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行审核删除。

一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

豆包大模型1.8：三大能力飞跃，比肩全球顶尖

相关推荐

发表回复