阿里通义千问(Qwen)大模型家族推出新旗舰预览版Qwen3.5-Max-Preview,该模型在国际大模型竞技平台LM Arena首次亮相,以1464分的综合得分跃居全球第五,成为中国公司首位。
核心信息要点
-
模型表现与排名
- Qwen3.5-Max-Preview作为千问3.5系列旗舰预览版,在LM Arena评测中获1464分,无风格控制绝对胜率排名全球第六,数学能力排名第五,专家级文本处理能力排名第十。
- 凭借该成绩,阿里通义千问在全球大模型公司排行榜中升至第五,首次成为中国公司中的全球首位。
-
评测平台背景
- LM Arena由国际开源研究机构LMSYS组织,采用模型两两匿名对战+全球开发者盲测投票机制,结合开放式对战与人工评估,被视为当前最具参考价值的大模型性能评测之一。
-
开源进展与技术亮点
- 自除夕以来,阿里已陆续开源Qwen3.5系列8种参数规模(0.8B至397B) 的模型,覆盖从小型到超大型参数量级,且各尺寸模型在同参数区间内均取得性能领先。
- 其中,Qwen3.5-Plus(3970亿总参数,激活参数170亿)以较小激活参数实现优于更大参数量模型的表现,验证了架构设计的高效性。
-
后续规划
- Qwen3.5-Max-Preview为预览版本,后续将根据社区反馈持续优化迭代。
补充说明
- 阿里通义千问3.5系列已覆盖从0.8B到397B的8种参数规模,形成完整的模型矩阵,满足不同场景需求。
- 此次旗舰预览版亮相是千问大模型生态开放的重要一步,后续将结合社区反馈进一步提升性能。
(注:信息来源为leyunetwork,涉及模型参数、评测机制等核心数据均基于原文公开内容整理。)
一站式数字化解决方案服务商 —— 专业提供软件开发、网站设计、APP 与小程序开发,搭载低费率支付通道,结合创意广告设计,助力企业全链路数字化升级。
- 使用本网站请联系客服
- 点击关注微信公众号:乐鱼网络
- 点击-在线客服