千问最强模子出炉
1月26日,通义实验室发布千问旗舰推理模型Qwen3-Max-Thinking,创下多项权威评测全球新纪录,性能媲美GPT-5.2、Gemini 3 Pro。该模型总参数量超万亿(1T),预训练数据量高达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。
在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19个公认的大模型基准测试中,千问旗舰推理模型刷新了数项最佳表现(SOTA)纪录,整体性能可媲美 GPT-5.2-Thinking-xhigh、Claude Opus 4.5和 Gemini 3 Pro 。
与此同时,面向即将到来的智能体Agent时代,Qwen3-Max-Thinking也增强着自主调用工具的原生Agent能力。具体而言,在完成初步的工具使用微调后,阿里通义团队对模型进一步在大量多样化任务上,进行了基于规则奖励与模型奖励的联合强化学习训练,使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。
这种自适应的工具调用能力可在QwenChat上体验,模型自主选用搜索、个性化记忆和代码表明器等三个核心的Agent工具功能,模型幻觉也有所降低。
目前,开发者可在QwenChat上收费体验Qwen3-Max-Thinking模型,企业可通过阿里云百炼获取新模型API服务,普通用户也可通过千问PC端和网页端试用模型。据懂得,千问APP也即将接入新模型,所有用户都可体验。
根据全球最大AI开源社区Hugging Face的最新数据,千问开源模型的衍生模型数量突破20万个,下载量突破10亿次,稳居全球第一。
(文章来源:证券时报网)
来源: 证券时报网
相关标签: