当前位置:中国企业报道>> 科技>> 人工智能>>正文内容

通义千问开源32B模型“以小博大”性能比肩DeepSeek

2025年03月07日 来源:新京报

北京时间3月6日凌晨,通义千问在官方公号上发文称,推出最新的推理模型 QwQ-32B。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的 DeepSeek-R1媲美。

通义千问表示,强化学习可以显著提高模型的推理能力。例如,DeepSeek-R1 通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思考和复杂推理。而QwQ-32B突显了将强化学习应用于经过大规模预训练的强大基础模型的有效性。

其在文章中展示了在一系列基准测试中与DeepSeek-R1、o1-mini等模型的功能对比,如在测试数学能力的 AIME24 评测集上,以及评估代码能力的LiveCodeBench 中,千问 QwQ-32B 表现与DeepSeek-R1相当,胜于 o1-mini 及相同尺寸的R1 蒸馏模型。

目前,QwQ-32B 已在 Hugging Face 和 ModelScope 开源,并采用了 Apache 2.0 开源协议。

责任编辑:蔡伊静
相关推荐
重庆宇羿科技有限公司成立

天眼查工商信息显示,近日,重庆宇羿科技有限公司成立,注册资本10万元,经营范围含软件开发、软件销售、智能机器人的研发、智能机器人销售、工业机器人制造、工业机器人销售、机械设备研发...[详细]

2026人形机器人产业展望:10万级量产将至 商业化元年开启

预计2026年,头部的人形机器人公司整体产销规模将达到1000台以上,会有越来越多的人形机器人应用于制造业场景。我们认为落地制造业场景的机器人基本上都会是轮式加双臂的形态,因为在制造业...[详细]

中国电信经营范围新增多项人工智能业务

天眼查工商信息显示,近日,中国电信发生工商变更,经营范围新增人工智能行业应用系统集成服务、人工智能通用应用系统、人工智能基础软件开发等,同时多位主要人员发生变更。[详细]

返回顶部