實測阿里萬億參數(shù)大模型：開源路線跑通了嗎？

來源：摧鋒陷堅網(wǎng)-工人日報

2025-09-16 20:28:56

文 | 劃重點KeyPoints

劃重點：

1、阿里發(fā)布史上最大模型，參數(shù)量超過1萬億，編程能力直接反超Claude，證明Scaling Law依舊在奏效。 2、阿里“模+云”的策略形成了從技術(shù)研發(fā)到商業(yè)化落地的最短路徑，是Qwen能夠取得后來者居上成績的關(guān)鍵之一。 3、阿里開源模式的核心挑戰(zhàn)在于如何平衡開放與收益。Qwen未來不僅需要在技術(shù)上持續(xù)突破，更需要在商業(yè)模式和組織能力上證明自己。

昨天Anthropic剛玩了一手“極端措施”，阿里深夜一波大的直接反手一記重拳——推出其史上最大的模型，Qwen3-Max-Preview，參數(shù)量足足超1萬億！

用“通義大模型”微信公眾號官方的標(biāo)題來形容它的能力，就是“強得不止一點”。

因為從基準(zhǔn)測試結(jié)果來看，Qwen3-Max-Preview已經(jīng)超越了此前自家的Qwen3-235B-A22B-2507。

并且官方還放出了與Kimi K2、Claude Opus 4（Non-thinking），以及DeepSeek-V3.1的對比結(jié)果。

從下面的表格中不難看出，Qwen3-Max-Preview已經(jīng)在SuperGPQA、AIME2025、LiveCodeBench V6、Arena-Hard V2和LiveBench等基準(zhǔn)測試中，均超越了其它選手。

尤其是在編程能力方面，此前Claude默認(rèn)是業(yè)內(nèi)最強，這次Qwen3-Max-Preview直接以大力出奇跡的方式實現(xiàn)了反超，也是讓一眾網(wǎng)友驚嘆不已。

Qwen在X上的推文中似乎也是一語道破“玄機”：Scaling works（規(guī)?；瘮U展是有效的）。

01 實測阿里史上最大模型

目前，Qwen3-Max-Preview已經(jīng)可以體驗，只需在模型下拉選項中選擇即可：

體驗地址：https://chat.qwen.ai

并且官方的API服務(wù)也已經(jīng)開放：https://bailian.console.aliyun.com/?tab=model#/model-market（搜索Qwen3-Max-Preview）。

在實際效果方面，已經(jīng)有不少國內(nèi)外的網(wǎng)友們展開了實測；例如X上的知名博主AK，他就在HuggingFace集成了Qwen3-Max-Preview的項目AnyCoder中，輸入了這樣的Prompt：

Design and create a very creative, elaborate, and detailed voxel art scene of a pagoda in a beautiful garden with trees, including some cherry blossoms. Make the scene impressive and varied and use colorful voxels. Use whatever libraries to get this done.

然后，據(jù)AK的描述，Qwen3-Max-Preview一次性就實現(xiàn)了如下的效果：

當(dāng)我們在官網(wǎng)中輸入這樣的Prompt：

Create a beautiful celebratory landing page for the launch of Qwen3 Max.

只需短短幾秒鐘的時間，Qwen3-Max-Preview就生成了一個完整的慶祝頁面，響應(yīng)速度實測是非?？斓模?/p>

接下來，我們加大難度，直接上經(jīng)典的編程問題——彈跳球模擬碰撞。

先小試牛刀一個：

Write a javascript code that shows a ball bouncing inside a spinning hexagon. The ball should be affected by gravity and friction, and it must bounce off the rotating walls realistically, implement it in javascript and html.

可以看到，小球會基于物理規(guī)律在六邊形的框內(nèi)運行；并且在用“向上鍵”去給小球一個力時，它也能立即做出響應(yīng)。

當(dāng)我們把球的數(shù)量設(shè)置到10個，一次性生成的效果也是相當(dāng)自然：

最后，我們再讓Qwen3-Max-Preview生成一個小游戲：

做一個《憤怒的小鳥》的小游戲。

不過雖然是一次性生成成功，但或許因為Prompt過于簡單，這個小游戲還是有一些小瑕疵，例如怪物的位置不是很準(zhǔn)確；感興趣的小伙伴可以多次嘗試一下。

02 Qwen憑什么后來者居上？

從這次阿里直接從千億參數(shù)模型飆升到萬億規(guī)模（近四倍提升），并且一舉在眾多評測中拿下第一來看，Qwen已然在全球范圍內(nèi)站穩(wěn)了第一梯隊的位置。

但有一說一，縱觀整場AI大模型的競賽，阿里并不是最早在中國推出對標(biāo)ChatGPT產(chǎn)品的公司，但絕對屬于后來者居上的那一個。

相較于國內(nèi)先行者（如百度），阿里大模型初期可以說是相對低調(diào)，不過它的路徑卻是格外的清晰——用模型開源來構(gòu)建生態(tài)，用自研閉源探索技術(shù)前沿。

例如在開源這件事上，從2023年開始，Qwen就以驚人的速度向全球開發(fā)者開源多個版本模型。從70億參數(shù)的Qwen-7B到140億、720億參數(shù)，再到視覺、音頻等多模態(tài)模型，幾乎覆蓋所有主流尺寸和應(yīng)用場景。更關(guān)鍵的是，阿里不僅開源模型權(quán)重，還開放商業(yè)化授權(quán)，極大激發(fā)了中小企業(yè)和個人開發(fā)者的熱情。

這一系列動作讓它迅速在Hugging Face等全球頂級開源社區(qū)建立廣泛影響力，吸引了大量開發(fā)者圍繞Qwen生態(tài)創(chuàng)新開發(fā)，形成強大社區(qū)驅(qū)動力。這種廣積糧的策略為通義千問贏得了寶貴的開發(fā)者心智和應(yīng)用場景數(shù)據(jù)，這可以說是閉源模型難以企及的優(yōu)勢。

但在開源之外，阿里內(nèi)部也從沒有停止對模型能力上限的探索。正如官方發(fā)布萬億參數(shù)模型時所言，Scaling works（規(guī)?；瘮U展有效）。這背后是對Scaling Law的一種篤信——隨著模型參數(shù)、數(shù)據(jù)量和計算量指數(shù)級增長，模型能力會涌現(xiàn)質(zhì)的飛躍。

訓(xùn)練Qwen3 Max Preview這樣的萬億參數(shù)模型，不僅是資源堆砌，更要求在超大規(guī)模計算集群穩(wěn)定性、分布式訓(xùn)練算法效率、數(shù)據(jù)處理精細(xì)度以及工程優(yōu)化的每個細(xì)節(jié)上都做到極致。

這背后是阿里數(shù)年來在算力基礎(chǔ)設(shè)施上的巨大投入，以及在AI工程化領(lǐng)域的深厚積累。正是這種大力出奇跡式的飽和投入，讓Qwen在編程、推理等核心能力上實現(xiàn)了對Claude Opus等頂級模型的反超。

在開源模型和能力探索之外，阿里云，也是Qwen能夠后來者居上的關(guān)鍵一環(huán)。

畢竟大模型訓(xùn)練推理是名副其實的算力吞金獸，阿里云為Qwen研發(fā)提供了穩(wěn)定高效的算力基礎(chǔ)設(shè)施，整合了從數(shù)據(jù)標(biāo)注、模型開發(fā)、分布式訓(xùn)練到部署推理的全鏈路工具，極大降低了研發(fā)團隊工程負(fù)擔(dān)，使其專注算法和模型創(chuàng)新。

并且在模型的應(yīng)用和普及方面，同樣是因為阿里云的MaaS戰(zhàn)略，可以讓Qwen快速在各行各業(yè)中深耕；例如企業(yè)客戶無需從零訓(xùn)練模型，可直接在阿里云調(diào)用Qwen API，或利用平臺工具對開源Qwen模型微調(diào)，快速構(gòu)建AI應(yīng)用。

這種“模+云”的策略形成了從技術(shù)研發(fā)到商業(yè)化落地的最短路徑。

03 但也并非完美

雖然阿里在大模型發(fā)展的戰(zhàn)略和選擇促成了它后來者居上的優(yōu)勢，但這并不意味著現(xiàn)階段的Qwen沒有隱患。

因為阿里選擇的開源模型引流、云服務(wù)變現(xiàn)可以說是一條機遇與挑戰(zhàn)并存的道路；它與Meta的Llama系列相似，目標(biāo)通過開放生態(tài)快速搶占市場份額和開發(fā)者心智，最終將商業(yè)價值導(dǎo)向自家基礎(chǔ)設(shè)施。

這與OpenAI、Anthropic等閉源+API的精英路線形成鮮明對比，它們優(yōu)勢在于更好保護核心技術(shù)，維持技術(shù)代差，通過高價值A(chǔ)PI服務(wù)直接獲得高額利潤。

而阿里開源策略雖能快速普及技術(shù)，但這也意味著其最先進模型很難與競爭對手拉開絕對差距，商業(yè)模式也更加迂回，需要客戶首先認(rèn)可其云平臺價值。

開源模式的核心挑戰(zhàn)在于如何平衡開放與收益，當(dāng)企業(yè)可以免費獲取并私有化部署性能足夠好的開源模型時，他們?yōu)楣俜皆品?wù)付費的意愿又會有多強呢？

換言之，阿里云不僅要提供簡單模型托管，還必須提供遠(yuǎn)超開源版本的性能優(yōu)化、安全保障、以及強大工具鏈和企業(yè)級服務(wù)，才能構(gòu)建足夠深的護城河。如何讓龐大開源用戶群體有效轉(zhuǎn)化為高價值付費云客戶，是這條道路上最關(guān)鍵的商業(yè)驚險一躍。

除了商業(yè)化的挑戰(zhàn)之外，在頂尖AI人才爭奪進入白熱化的今天，任何核心人才流失都可能對團隊造成深遠(yuǎn)影響。

近年來，包括AI框架和基礎(chǔ)設(shè)施領(lǐng)域關(guān)鍵人物賈揚清在內(nèi)的一些核心技術(shù)人才先后離開阿里，投身創(chuàng)業(yè)浪潮或加入其他巨頭。雖然對于阿里這樣體量的公司而言，個別人員離開未必動搖根基，但負(fù)面影響依然存在。

畢竟核心領(lǐng)軍人物離開可能影響團隊士氣，對外傳遞負(fù)面信號，增加后續(xù)吸引頂尖人才的難度；在關(guān)鍵技術(shù)方向上，領(lǐng)軍人物的變動還可能給項目長期戰(zhàn)略延續(xù)性帶來不確定性。

也正像Meta在硅谷持續(xù)上演的搶人大戰(zhàn)，離開的人才往往成為新競爭對手，他們對原有體系優(yōu)劣勢了如指掌，可能在細(xì)分領(lǐng)域構(gòu)成更精準(zhǔn)威脅。

因此，阿里如何在高強度競爭下持續(xù)保持對全球頂尖AI人才的吸引力，并建立穩(wěn)定可持續(xù)的人才梯隊，是它在未來發(fā)展過程中必須面對的嚴(yán)肅課題。

結(jié)語

總體來看，阿里通義千問無疑是中國乃至全球大模型領(lǐng)域的頂級力量。它憑借“開源與自研并行”的清晰戰(zhàn)略、依托阿里云的強大生態(tài)、以及深厚技術(shù)人才積累，成功在激烈競爭中占據(jù)領(lǐng)先地位。萬億參數(shù)模型的發(fā)布更是彰顯了其在Scaling Law上的決心和實力。

然而，成功之路也伴隨著清晰挑戰(zhàn)。以開源換生態(tài)的商業(yè)模式，其盈利能力的持續(xù)性仍需市場檢驗；與OpenAI等閉源巨頭的技術(shù)代差追逐將是長期過程；而頂級人才的保留與吸引，則是維持創(chuàng)新活力的生命線。

Qwen在未來不僅需要在技術(shù)上持續(xù)突破，更需要在商業(yè)模式和組織能力上證明自己的獨特價值。它能否將今天的技術(shù)優(yōu)勢轉(zhuǎn)化為明天不可動搖的市場勝勢，將是整個行業(yè)、包括資本市場關(guān)注的焦點。這也是阿里未來市值能否更上一層樓的關(guān)鍵。

1、https://x.com/Alibaba_Qwen/status/1963991502440562976

2、https://chat.qwen.ai/

3、https://x.com/_akhaliq/status/1964001592710975971

責(zé)任編輯：摧鋒陷堅網(wǎng)