在近日备受瞩目的 FORCE 原动力大会上,火山引擎正式对外展示了其在人工智能领域取得的最新进展,并推出了一系列创新 AI 产品与服务。这一举动不仅彰显了字节跳动持续深耕 AI 技术的决心,同时也预示着其在市场竞争中将更具优势。
本次火山引擎发布的重磅产品非豆包大模型 1.6 系列莫属。该系列包含 doubao-seed-1.6、1.6-thinking 及 1.6-flash 三个版本,均支持高达 256K 的上下文处理能力。尤其值得关注的是,1.6-thinking 版本在推理能力和指令执行方面表现突出,性能已经超越了 DeepSeek-R1-0528 模型,并且正在逐步缩小与 OpenAI-03-high 模型的差距。这意味着豆包大模型在解决复杂问题和理解用户意图方面取得了显著进步。
更具吸引力的是,豆包 1.6 系列采用了创新的定价策略,按“输入长度”区间进行定价,让原本价格高昂的深度思考、多模态能力与基础语言模型的价格实现了统一。对于企业常用的 0-32K 输入区间,豆包 1.6 的输入价格仅为 0.8 元/百万 tokens,输出价格为 8 元/百万 tokens。据火山引擎官方数据,该定价策略将综合成本降低至豆包 1.5 深度思考模型或 DeepSeek R1 的三分之一。这种极具竞争力的价格无疑将大大降低 AI 技术的应用门槛,吸引更多企业尝试和采用。
除了大语言模型,火山引擎还在视频生成领域发力,推出了豆包·视频生成模型 Seedance 1.0 pro。该模型在 Artificial Analysis 的评测榜单上表现出色,在文生视频和图生视频两项任务中均位列榜首,超越了 Veo3、可灵 2.0 等多模态模型。更令人惊喜的是,Seedance 1.0 pro 的性价比极高,每千 tokens 仅需 0.015 元,生成一条 5 秒的 1080P 视频的成本仅为 3.67 元。这意味着企业只需 1 万元预算,即可制作超过 2700 条此类视频,因此被火山引擎誉为“业界最低成本”。这无疑为短视频营销、内容创作等领域带来了新的可能性。
为了构建更完整的 AI 生态,火山引擎还对 AI 云原生服务进行了全面升级,并推出了一系列面向 Agent 开发和应用的工具产品,包括火山引擎 MCP 服务、PromptPilot 智能提示工具、AI 知识管理系统、veRL 强化学习框架等。此外,还推出了多模态数据湖、AICC 私密计算、大模型应用防火墙,以及一系列 AI Infra 套件,进一步丰富了其 AI 服务生态。这些工具和服务旨在降低 AI 应用开发的复杂性,帮助企业更高效地构建和部署 AI 应用。
数据显示,豆包大模型自去年 5 月首次发布以来,日均 tokens 使用量已增长 137 倍,突破 16.4 万亿。根据知名行研机构 IDC 的报告,豆包大模型在中国公有云大模型市场份额中排名第一,占比高达 46.4%,充分展现了其市场竞争力。
豆包大模型 1.6 系列不仅在推理能力上有所提升,还支持多模态理解和图形界面操作,能够更好地理解和处理真实世界中的复杂问题。 例如,已应用于豆包 APP 的实时视频通话功能,并在电商商品审核、自动驾驶标注、安全巡检等企业场景中展现出广泛应用潜力。现在,用户可以通过 1.6 系列的图形界面 (GUI) 操作能力,跨平台执行一系列智能体任务,例如自动操作浏览器完成酒店预定、识别购物小票并整理成 Excel 表格等。
火山引擎在本次大会上宣布,豆包视频生成模型 Seedance 1.0 pro 和豆包·实时语音模型已全面上线,并对企业客户开放使用。Seedance 1.0 pro 具备无缝多镜头叙事、多动作随心运镜、稳定运动与真实美感三大特性,支持文字与图片输入,可生成高品质 1080P 视频。而豆包·实时语音模型则支持高级自然语言指令控制,具备唱歌表演、声线模仿、方言演绎等多种能力,更为拟人化,为语音交互提供了更丰富的可能性。
火山引擎智能算法负责人吴迪强调,构建高生产力的 Agent 需要既“用好 AI”,整合高质量应用,又“做好 AI”,关注底层技术的优化和创新。为此,火山引擎推出了 12 款Agent 开发工具产品,旨在提升开发效率和 AI 应用的质量。这些工具产品包括 TRAE、MCP 服务、PromptPilot、AI 知识管理产品、veRL 强化学习框架等,为企业提供了从开发到部署的全流程支持,预示着其将持续发力,为构建更高效智能的应用生态提供有力支撑。