
在今天召开的火山引擎Force原动力大会上,字节跳动正式发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro。
评测数据显示,豆包模型家族在多模态理解和生成能力、Agent能力上,已达到业界领先水平。
01.
豆包大模型1.8
多模态Agent能力媲美全球顶尖模型
豆包大模型1.8(Doubao-Seed-1.8)面向多模态Agent场景进行了定向优化。其工具调用能力、复杂指令遵循能力及OS Agent能力显著增强,大幅提升了模型在处理复杂任务时的规划与执行水平。
在多项公开评测中,豆包1.8展现出极具竞争力的全面表现:在视觉推理、通用视觉问答、空间理解及视频理解等任务中,均获得最佳或接近最佳成绩;在通用智能体测评集BrowseComp上表现全球领先;在数学与推理等语言模型基础能力维度上,整体水平接近全球顶尖的通用模型。


目前豆包1.8模型已在火山引擎上线,面向企业和开发者开放API。关于模型的更多技术细节,详见项目主页:
https://seed.bytedance.com/zh/seed1_8
02.
Seedance 1.5 pro
视频生成不仅要画面美,声音更要对味
全新的音视频生成模型Seedance 1.5 pro来了!原生支持音视频联合生成,在视听协同、视觉张力和叙事协调性等方面实现突破。
音画高精同步:采用创新的原生音视频联合生成架构,支持环境音、动作音、合成音效、乐器、背景音乐、人声等多种元素,实现毫秒级音画同步输出。
多人多语言对白:支持独白与多人对话,口型毫秒级精准对齐,并覆盖中文、方言(四川话、粤语、陕西话、上海话等)、英文及小语种,全方位还原真实自然的对话质感,实现全球化创作。
影视级叙事张力:运动幅度自然、节奏感强,能够精准捕捉运动细节;画面感知力强,人物情绪与表情呈现细腻,大幅提升生动性,实现影视级创作质感。
目前,Seedance 1.5 pro已在豆包APP(灰度测试)、即梦、火山引擎体验中心上线,用户可以试用体验。关于模型的更多技术细节,详见项目主页:
https://seed.bytedance.com/zh/seedance1_5_pro


VIP复盘网