Warning: mkdir(): No space left on device in /www/wwwroot/zhenghe1718.com/func.php on line 127

Warning: file_put_contents(./cachefile_yuan/jnsjmc.com/cache/31/576f7/85102.html): failed to open stream: No such file or directory in /www/wwwroot/zhenghe1718.com/func.php on line 115
刚刚，阿里首个超万亿参数新王登基！Qwen3-Max屠榜全SOTA，碾压DeepSeek V3.1 -流落他乡网

奶茶视频APP,奶茶视频下载,奶茶视频app官网,奶茶视频app海纳百川有容乃大

流落他乡网>安康 > 正文

刚刚，阿里首个超万亿参数新王登基！Qwen3-Max屠榜全SOTA，碾压DeepSeek V3.1

来源：流落他乡网-工人日报

2025-09-07 04:27:33

阿里迄今为止，参数最大的模型诞生了！

昨夜，Qwen3-Max-Preview（Instruct）官宣上线，񘜳万亿参数性能爆表。

直接用成绩说话——

在全球主流权威基准测试中，Qwen3-Max-Preview狂揽非推理模型「C」位，直接碾压Claude-Opus 4（Non-Thinking）、Kimi-K2、DeepSeek-V3.1。

甚至，它把自家Qwen3-235B-A22B-Instruct-2507狂甩身后，堪称「AI卷王本王」。

· 知识推理评测（SuperGPQA）拿�.6分· 数学推理评测（AIME25）拿�.6分，断崖式领先· 竞争性编程评测（LiveCodeBench V6）拿�.5分· 复杂问题解决和人类偏好对齐评测（Arena-Hard v2）拿�.1分，优势巨大· 被称为「无法被操控的」评测（LiveBench）拿�.3分

惊艳的性能表现再次证明了，Scaling仍然有效，参数越大模型性能越强。

总的来说，Qwen3-Max-Preview有以下几大亮点：性能更强、知识更广、更擅长对话、任务处理、指令遵循。

新模型可支�+语言，还针对RAG、工具调用进行优化。

模型一出，全网立即开始了实测。

@karminski-牙医实测中，Qwen3-Max-Preview前端能力明显超越DeepSeek-V3.1。

比如，在一个杯子流体模拟中，Gemini 2.5在倾倒前杯子底部有严重bug，DeepSeek-V3.1杯子中物体倒出的状态（最后有一条线）不对，而Qwen3-Max-Preview比较符合物理常识。

Qwen3-Max-Preview还能完美生成一个骑自行车的鹈鹕SVG、一键直出精美前端网页，一张照片做出像素花园。

目前，模型已正式上线阿里云百炼平台，可通过API直接调用。同时，Qwen Chat也同步上线新模型，支持免费使用。

在百炼平台上，最大支�k上下文，依token数阶梯计费：

· 0-32k token：输𲷲.006元/千token；输𳏄.024元/千token· 32k-128k token：输𲷲.01元/千token；输𳏄.04元/千token· 128k-252k token：输𲷲.015元/千token；输𳏄.06元/千token

责任编辑：流落他乡网

媒体矩阵

客户端
微信号
微博号
抖音号

推荐

看点

工会24小时

网评推荐

客户端

亿万职工的网上家园

关于奶茶视频APP|版权声明| 违法和不良信息举报电话：010-84151598 | 网络敲诈和有偿删帖举报电话：010-84151598
Copyright © 2008-2024 by {当前域名}. all rights reserved

扫码关注

流落他乡网微信

流落他乡网微博

流落他乡网抖音

工人日报
客户端

×

分享到微信朋友圈×

打开微信，点击底部的“发现”，
使用“扫一扫”即可将网页分享至朋友圈。