阿里千问3系列发布并开源：称成本大幅下降，性能超越DeepSeek-R1

时间：2025-04-29 11:07:07 栏目：新闻资讯浏览：3

备受期待的千问3.0在五一节前面世。

4月29日凌晨，阿里巴巴宣布开源新一代通义千问模型Qwen3（简称千问3），包含2款参数规模分别为30B和235B的混合专家（MoE）模型，以及大小从0.6B到32B的6款密集模型。据介绍，千问3模型家族是国内首个混合推理模型系列，235B模型的参数量仅为DeepSeek-R1的三分之一，成本大幅下降，性能全面超越R1、OpenAI-o1等全球顶尖模型，登顶全球最强开源模型。

在本次开源的系列模型中，旗舰模型Qwen3-235B-A22B的总参数量为235B，激活仅需22B。千问3预训练数据量达到36T，和千问2.5相比翻了两倍，并在后训练阶段进行多轮强化学习，将非思考模式整合到思考模型中。同时，千问3的部署成本大幅下降，仅需4张H20即可部署千问3满血版，显存占用仅为性能相近模型的三分之一。

在推理、指令遵循、工具调用、多语言能力等方面，千问3的性能均大幅增强：在奥数水平的AIME25测评中，千问3以81.5分的成绩刷新开源纪录；在考察代码能力的LiveCodeBench评测中，千问3的表现甚至超过Grok3；在评估模型人类偏好对齐的ArenaHard测评中，千问3的分数超越了OpenAI-o1和DeepSeek-R1。

千问3旗舰版和32B版本在部分基准测试中的得分。来源：通义千问

为了迎接智能体Agent和大模型应用的集中爆发，千问3也在这方面提供了支持。在评估模型Agent能力的BFCL评测中，千问3创下70.8的新高，超越Gemini2.5-Pro、OpenAI-o1等顶尖模型。同时，千问3原生支持MCP（模型上下文协议），并具备强大的工具调用（function calling）能力，将大大降低编码复杂性。

对于开发者而言，千问3酝酿已久的发布为开源领域带来新的动力。和前代一样，千问3系列模型依旧采用宽松的Apache2.0协议开源，首次支持119多种语言，全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用，或通过阿里云百炼调用千问3的API服务。个人用户可立即通过通义APP直接体验，夸克也即将全线接入千问3。

有业内人士在经过实测后指出，千问3在逻辑推理、写作等方面的表现都不错，在生成复杂代码、数学推理等方面，思考模式的表现明显好于非思考模式。通义千问团队表示，未来计划从多个维度提升模型，以实现几个关键目标，包括扩展数据规模、增加模型大小、延长上下文长度、拓宽模态范围、推进强化学习以进行长周期推理。

今年以来，通义千问团队表现活跃，先后开源发布旗舰模型Qwen2.5-Max、推理模型QwQ-32B和首个全模态大模型Qwen2.5-Omni。目前，阿里通义已开源200余个模型，全球下载量超3亿次；千问衍生模型数超10万个，已超越美国Llama，成为全球之一开源模型。

电视剧《蛮好的人生》里的保单：合规边界与常见误区

国家发改委回应美加征关税：典型的单边主义霸凌做法

黄金“技术性回调”的理由：三大指标都指向“调整” 甚至“幅度不小”？

股市下跌时退休人员面临 “危险区” 如何保护你的投资组合?

新奥之夜，九点三十的奇妙启程

Moneta Markets亿汇:苏里南石油产业迎来重大发展机遇

同源康医药-B拟出资1800万元参设基金重点投资生物制药业务

普京正在会见美特使，多名俄官员参会；特朗普：已设最后期限，届时美国态度将“大不相同”；基辅遭袭，泽连斯基紧急结束非洲之行

迎驾贡酒拟每股派发现金红利1.5元

83岁连丽如每周登台说书，还上了15堂连派评书课