
豆包·图像编辑模型3.0上线火山方舟
AI修图“听得懂、改得对、足够美”
AI图像编辑能大幅提升P图效率,但在实际应用中常面临三类典型难题:难以理解用户真实需求,指令执行不到位;误改了不该修改的地方;输出图像美感不够,AI痕迹重。
为此,火山引擎正式发布豆包·图像编辑模型SeedEdit 3.0,具备更强的指令遵循能力、图像保持能力和更强的图像生成质量。



豆包·图像编辑模型3.0可广泛应用于影像创作、广告营销、游戏宣传等领域,企业用户可在火山方舟平台调用该模型API,个人用户可使用即梦或豆包app的“豆包P图”功能体验。
豆包·同声传译模型2.0发布
3秒极低延迟,0样本声音复刻
传统的翻译系统通常依赖于“级联模型”——多个模块相互串联,依次处理语音识别、翻译、声音复刻和语音合成等任务,翻译结果不够连贯、处理速度慢。
此次全新发布的豆包·同声传译模型Seed-LiveInterpret 2.0,支持全双工语音理解和生成框架,将传统机器同传的语音延迟从8-10秒降低到2-3秒,实现文本与语音的同步生成;无需提前录制,一边说话一边采样,实现0样本声音复刻,让同一个人同音色开口说外语,带来更沉浸的体验。
豆包大模型1.6系列再升级
极速版延迟低至10ms
今年6月,豆包大模型1.6系列多个模型正式发布,为企业提供多样化选择。此次,极速版Doubao-Seed-1.6-flash模型在保持出色的视觉理解能力的同时,升级了代码、推理、数学等大语言模型能力。
Doubao-Seed-1.6-flash模型,非常适合智能巡检、手机助手、智能硬件等对模型效果、速度和成本都有要求的大规模商业化场景。该模型具有业界领先的极低延迟,TPOT仅10ms,并依然具备强大的视觉理解能力。
价格上,Doubao-Seed-1.6-flash在输入文本长度0-32k的区间中(企业使用量最大),每百万tokens输入仅需0.15元,输出仅1.5元。在真实的客户案例中,该模型帮助客户延迟下降60%,成本降低70%。
此外,火山引擎发布全模态向量化模型Seed1.6-Embedding,首次实现了“文本+图像+视频”混合模态的融合检索,帮助企业构建更强大的多模态知识库。在权威测评榜单中,该模型包揽了多模态全面任务、中文文本的 SOTA 成绩。
AI云原生全栈服务持续优化
助力Agent开发落地
除了更好的基础模型,Agent开发平台和工具、支撑推理的算力基础设施,同样对构建AI应用至关重要。火山引擎持续优化AI云原生全栈服务,帮助企业实现端到端的Agent开发和落地。
扣子核心能力开源:在火山引擎可自动化部署
为加速AI落地、构建繁荣的AI生态,7月26日,Al Agent 开发平台扣子将核心能力正式开源。
本次开源覆盖扣子平台最核心的两个项目: 扣子开发平台(Coze Studio)、 扣子罗盘(Coze Loop),并采用没有任何附加条件的Apache 2.0许可证开源,用户可在GitHub下载。
扣子开发平台,是一站式的 AI Agent 可视化开发工具,可快速实现AI Agent 的创建、调试和部署。扣子罗盘,可以帮助开发者实现 Agent 从开发到运维的全链路管理。开源仅三天,Coze Studio在GitHub的stars数已经破万, Coze Loop也有3000+ stars。
火山引擎也为Coze开源版提供了全面支持。企业AI平台产品HiAgent,可调用Coze开源版提供的智能体搭建和运维能力,并通过共享Agent标准,支持扣子开源版智能体的纳管。
火山引擎的云基础产品,也将为扣子开源版提供高效、稳定、可靠的基础设施支持,开发者可以一键拉起资源,完成部署。
企业自有模型托管方案发布:通过火山方舟模型单元部署
针对有模型定制需求的企业客户,火山引擎发布企业自有模型托管方案:依托火山方舟模型单元,企业无需运维底层GPU资源,也不用进行复杂的网络和调度配置,就能在火山方舟上实现自研模型的全托管,并在推理服务中享受火山方舟极致的弹性算力资源,大幅降本增效。
在算力成本上,企业可以自主选择部署方式、机型、并设置弹性规则,更精细的控制首Token时延、模型吐字延迟,且无需为业务低谷期付费,实现更高的资源利用效率。
此外,全托管的企业自有模型,还能享受火山方舟上的全套开发工具、MCP服务等生态配套。目前,火山方舟模型单元已在火山方舟上开放邀测。
Responses API上线:支持多模态Agent高效开发
多模态模型统一、多模态模型API的统一,是当前大模型发展的重要趋势。为此,火山方舟平台升级了API体系,推出Responses API。
它具备原生上下文管理能力,支持多轮对话的链式管理,可以无缝衔接文本、图像、混合模态数据。结合 cache 能力后,能降大幅低延迟和成本,在很多典型应用里,整体成本下降幅度可达80%。
此外,Responses API支持自主选择调用工具,用户发起单次请求,即可联动多个内置工具、自定义函数及多轮模型组合响应,解决复杂Agent任务,让Agent开发更加省时省力。