当前位置:中国企业报道>> 科技>> 人工智能>>正文内容

豆包大模型多模态深度思考解锁复杂场景 火山引擎目标“做AI时代最好的云”

2025年04月24日 来源:中国网财经

在国外旅游时面对陌生的外语菜单,除了翻译菜名可以借助AI大模型做什么?换算汇率控制预算,考虑个人口味、喜好,避开过敏原……这是豆包深度思考模型掌握的新技能:基于多模态深度思考能力,能够人性化地帮忙点菜。

火山引擎总裁谭待表示,随着企业不断深化AI应用,对AI技术也提出了新的要求,不仅仅满足于信息感知、处理和生成,而是深入到解决更复杂、更完整的问题,端到端处理任务。

近日火山引擎在FORCE LINK AI创新巡展·杭州站发布了豆包1.5·深度思考模型,并升级了豆包·文生图模型Seedream3.0、豆包·视觉理解模型。新模型支持深度思考和多模态,扩张了应用边界,除了解决出国游问题,还可以看懂复杂的企业项目管理流程图表,综合分析航拍图和地貌特征判断开发可行性,利用Agent(智能体)对iPhone进行比价……

新推出的OS Agent解决方案及AI云原生推理套件则进一步完善火山引擎的AI基础设施,助力企业更快、更省地构建和部署Agent应用,解锁更多智能化场景。

深度思考新模型效果好、低延迟、支持多模态,泛化能力提高

豆包1.5·深度思考模型具有效果好、低延迟和支持多模态三大亮点。

谭待介绍,豆包深度思考模型在专业领域推理任务中表现出色,数学推理AIME 2024 测试得分追平OpenAI o3-mini-high、编程竞赛Codeforces pass@8得分接近OpenAI o1、科学推理GPQA得分接近o3-mini,均达到或接近全球第一梯队。在创意写作等非推理任务中,模型也展示出优秀的泛化能力,能胜任更广泛和复杂的使用场景。

为了提升模型的通用能力,火山引擎通过融合处理可验证数据与创意性数据,来满足各类任务的需求。此外,大规模强化学习是训练推理模型的关键技术,火山引擎通过采用创新的双轨奖励机制,兼顾“对错分明”和“见仁见智”的任务,有效实现了算法的可靠优化。

豆包深度思考模型采用MoE架构(混合专家模型),总参数为200B,激活参数仅20B,具备显著的训练和推理成本优势。基于高效算法和高性能推理系统,豆包模型API服务在保障高并发的同时,延迟低至20毫秒。

除了实现“边搜边想”,豆包深度思考模型还被赋予了视觉推理能力。

谭待称,借助更好的效果,更低的延迟,加上视觉推理能力,豆包1.5 深度思考模型打开了更加广泛的大模型应用空间,能够解决更加复杂的问题,帮助企业在更多商业场景中发现智能化升级的新机会。

文生图模型Seedream3.0支持2K分辨率直出,在生图结构准确性、小字生成与排版、美感、真实度等方面具有优势。升级后的视觉理解模型视觉定位更精准,对视频的理解更智能。

完善AI云原生基础设施,火山引擎目标“做AI时代最好的云”

科技创新最终的落脚点是场景应用。谭待判断,随着 AI发展,聊天和信息处理只是其中一小部分,要真正为各行各业带来变革,Agent是必经之路。业内普遍认为2025年是“Agent智能体元年”。

火山引擎提出Agent全栈解决方案,通过开放OS Agent的产品和工具,助力开发者和企业构建专属的通用Agent。

在垂直类 Agent领域,火山引擎打造了智能编程助手Trae以及数据产品Data Agent。作为中国首个AI原生集成开发环境工具,Trae率先将AI与IDE深度融合,具有交付化、智能化、协作化三个核心特质,帮助开发者和企业更快、更好、更准确地开发软件。在通用型Agent层面,火山引擎侧重于搭建基础框架、提供好用的工具,推出了OS Agent 解决方案,借助新的AI云原生组件、SandBox沙箱环境和新模型,让开发者和企业能更轻松地打造自己的通用Agent。

谭待表示,Agent智能体应用发展将带动大模型进一步普及。“深度思考模型是构建Agent的基础,模型要有能力做好思考、计划和反思,并且一定要支持多模态,就像人类具备视觉和听觉一样,Agent才能更好地处理复杂任务。”

好的模型和工具能够加速Agent的落地,但Agent也会带来更大量的推理消耗,因此需要更好的云原生架构来支持。面对大规模推理需求,火山引擎推出ServingKit推理套件,让模型部署更快、推理成本更低,GPU 消耗相比传统方案降低80%。

智能时代AI突破传统软件和硬件限制,从生产要素转变为生产力,完成各类任务。谭待在接受采访时强调,火山引擎作为云厂商,目标是做AI时代最好的云。“我们要把最好的模型提供给大家,核心在于两点:一是做好基础设施AI云原生;二是提供最好的模型以及模型上的各种应用。”

责任编辑:蔡伊静
相关推荐
豆包大模型多模态深度思考解锁复杂场景 火山引擎目标“做AI时代最好的云”

智能时代AI突破传统软件和硬件限制,从生产要素转变为生产力,完成各类任务。谭待在接受采访时强调,火山引擎作为云厂商,目标是做AI时代最好的云。“我们要把最好的模型提供给大家,核心在...[详细]

人形机器人半马“大练兵”:天工2小时40分钟完赛夺冠

正如梁靓在采访中坦言,本次马拉松比赛“只是一个起点,是人形机器人产业发展这个‘马拉松’的起点”。随着人工智能相关技术的进步与突破,人形机器人产业发展正在提速,但需要注意的是,人...[详细]

AI如何赋能实体商业?

作为目前国内管理规模最大的商业管理集团,珠海万达商管集团在营万达广场已超过510个,遍布全国228个城市,通过实体规模优势叠加数字技术能力,其正在重塑商业空间的运营逻辑。​记者从万达...[详细]

返回顶部