中国第一:阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场

fmt 阿里通义千问(Qwen)大模型家族推出新旗舰预览版Qwen3.5-Max-Preview,该模型在国际大模型竞技平台LM Arena首次亮相,以1464分的综合得分跃居全球第五,成为中国公司首位。

核心信息要点

  1. 模型表现与排名

    • Qwen3.5-Max-Preview作为千问3.5系列旗舰预览版,在LM Arena评测中获1464分,无风格控制绝对胜率排名全球第六,数学能力排名第五,专家级文本处理能力排名第十。
    • 凭借该成绩,阿里通义千问在全球大模型公司排行榜中升至第五,首次成为中国公司中的全球首位。
  2. 评测平台背景

    • LM Arena由国际开源研究机构LMSYS组织,采用模型两两匿名对战+全球开发者盲测投票机制,结合开放式对战与人工评估,被视为当前最具参考价值的大模型性能评测之一。
  3. 开源进展与技术亮点

    • 自除夕以来,阿里已陆续开源Qwen3.5系列8种参数规模(0.8B至397B) 的模型,覆盖从小型到超大型参数量级,且各尺寸模型在同参数区间内均取得性能领先。
    • 其中,Qwen3.5-Plus(3970亿总参数,激活参数170亿)以较小激活参数实现优于更大参数量模型的表现,验证了架构设计的高效性。
  4. 后续规划

    • Qwen3.5-Max-Preview为预览版本,后续将根据社区反馈持续优化迭代。

补充说明

  • 阿里通义千问3.5系列已覆盖从0.8B到397B的8种参数规模,形成完整的模型矩阵,满足不同场景需求。
  • 此次旗舰预览版亮相是千问大模型生态开放的重要一步,后续将结合社区反馈进一步提升性能。

(注:信息来源为leyunetwork,涉及模型参数、评测机制等核心数据均基于原文公开内容整理。) fmt 一站式数字化解决方案服务商 —— 专业提供软件开发、网站设计、APP 与小程序开发,搭载低费率支付通道,结合创意广告设计,助力企业全链路数字化升级。

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部