Rain科技12月18日报道,在今日召开的火山引擎Force原动力大会上,豆包大模型1.8正式对外发布,该版本在多模态Agent能力上取得了显著进展,据称已达到或接近全球顶尖模型的水平。
此次发布的豆包大模型1.8,将优化重点聚焦于多模态Agent场景。通过在工具调用能力、复杂指令遵循能力以及OS Agent能力上的重点增强,该模型在处理复杂任务时的规划和执行水平得到了大幅提升。这意味着豆包大模型1.8在理解和执行人类提出的复杂指令,并在不同工具和系统之间进行协调以完成任务方面,将表现得更加出色。
根据评测数据显示,在视觉推理、通用视觉问答、空间理解和视频理解等一系列多模态任务中,豆包大模型1.8均取得了最佳或接近最佳的成绩。尤其在通用智能体测评集BrowseComp上的表现,更是展现出全球领先的实力。这表明该模型在理解和处理包含图像、视频等多种信息模态的任务时,具备了高度的智能化和准确性,这对于未来的AI应用,如智能客服、内容创作和辅助决策等领域,具有重要的实际意义。
与此同时,在语言模型的核心能力维度,例如数学和推理方面,豆包大模型1.8的整体水平也达到了与全球顶尖通用模型相媲美的程度。这进一步巩固了其作为一款综合性强大AI模型的地位,能够同时胜任语言理解和多模态信息处理等多种复杂任务。
目前,豆包1.8模型已正式上线火山引擎平台,并面向广大企业和开发者开放API接口。这意味着企业和开发者可以利用豆包大模型1.8强大的AI能力,将其集成到自己的产品和服务中,加速创新和业务发展。
此外,同场的还有豆包音视频创作模型Seedance 1.5 pro。该模型原生支持音视频联合生成,并在视听协同、视觉张力和叙事协调性等方面实现了技术突破,能够生成更具吸引力和连贯性的音视频内容。Seedance 1.5 pro目前已在豆包App(灰度测试)、即梦AI及火山引擎体验中心上线,预示着AI在多媒体内容创作领域正迈入新的发展阶段。

