6月11日,字节跳动旗下的火山引擎召开了2025 Force原动力大会,推出了豆包大模型1.6、视频生成模型Seedance 1.0 pro等一系列新产品,并对AI云原生服务进行了升级。字节跳动首席执行官梁汝波表示,火山引擎将继续向产业应用开放新模型和技术。
豆包大模型1.6在多个领域表现出色,覆盖了众多行业头部客户。会议透露,该模型在复杂推理、高级数学以及多轮对话测试中成绩显著。火山引擎总裁谭待提到,这一模型能够处理多模态信息并支持图形化操作,能有效应对实际问题。此前,豆包1.5已在60个公开评估基准中获得38项最佳成绩,广泛应用于电商图像识别、自动驾驶数据标注以及店铺巡查等领域。
此次更新增加了图形化操作功能,使豆包1.6不仅能分析数据还能主动执行任务。演示表明,它能够自动完成网页上的酒店预订,还能通过识别购物清单生成Excel表格。同时发布的Seedance 1.0 pro支持文字和图片输入,生成高质量1080P视频,在国际Artificial Analysis评测榜单的文生视频和图生视频任务中排名第一。
豆包大模型现已扩展至多种类型,包括多模态、视频、图像、语音和音乐等,服务了全球十大手机制造商中的九家、八成主流汽车品牌、七成系统重要银行以及超过半数的985高校。据统计,其每日tokens使用量超过16.4万亿,相比2023年5月增长了137倍。根据IDC报告,豆包大模型在中国公有云大模型市场占据领先地位,份额达46.4%。
为了缓解Agent规模化应用的成本压力,豆包1.6采用了按输入长度区间的定价方式,简化了不同能力的价格体系。在企业常用的小于32K的输入范围内,输入费用为每百万tokens 0.8元,输出费用为每百万tokens 8元,整体成本仅为豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro的每千tokens费用仅为0.015元,生成一条5秒1080P视频的成本仅需3.67元,处于行业较低水平。
为了促进Agent的开发与应用,火山引擎升级了AI云原生全栈服务,发布了MCP服务、PromptPilot智能提示工具、AI知识管理系统、veRL强化学习框架等产品,并推出了多模态数据湖、AICC隐私计算、大模型应用防火墙以及AI Infra套件。
字节跳动技术副总裁洪定坤表示,豆包1.6的编程能力已经集成到字节AI编程工具TRAE的内测版本中,字节内部超过80%的工程师正在使用TRAE辅助开发,月活跃用户超过100万。他相信,AI未来可以作为调度工具,通过调用Agent和各类工具来简化开发流程,提高工作效率。
谭待强调,随着AI时代的到来,开发模式将从PC时代的网页、移动时代的应用程序,转变为由Agent主导的自主执行模式。火山引擎希望通过豆包大模型和AI云原生服务,帮助企业构建并广泛应用Agent,推动智能技术在产业场景中的落地。(心月)