文 | 劃重點KeyPoints
劃重點:
1、阿里發(fā)布史上最大模型,參數(shù)量超過1萬億,編程能力直接反超Claude,證明Scaling Law依舊在奏效。 2、阿里“模+云”的策略形成了從技術(shù)研發(fā)到商業(yè)化落地的最短路徑,是Qwen能夠取得后來者居上成績的關(guān)鍵之一。 3、阿里開源模式的核心挑戰(zhàn)在于如何平衡開放與收益。Qwen未來不僅需要在技術(shù)上持續(xù)突破,更需要在商業(yè)模式和組織能力上證明自己。
昨天Anthropic剛玩了一手“極端措施”,阿里深夜一波大的直接反手一記重拳——推出其史上最大的模型,Qwen3-Max-Preview,參數(shù)量足足超1萬億!
用“通義大模型”微信公眾號官方的標(biāo)題來形容它的能力,就是“強得不止一點”。
因為從基準(zhǔn)測試結(jié)果來看,Qwen3-Max-Preview已經(jīng)超越了此前自家的Qwen3-235B-A22B-2507。
并且官方還放出了與Kimi K2、Claude Opus 4(Non-thinking),以及DeepSeek-V3.1的對比結(jié)果。
從下面的表格中不難看出,Qwen3-Max-Preview已經(jīng)在SuperGPQA、AIME2025、LiveCodeBench V6、Arena-Hard V2和LiveBench等基準(zhǔn)測試中,均超越了其它選手。
尤其是在編程能力方面,此前Claude默認(rèn)是業(yè)內(nèi)最強,這次Qwen3-Max-Preview直接以大力出奇跡的方式實現(xiàn)了反超,也是讓一眾網(wǎng)友驚嘆不已。
Qwen在X上的推文中似乎也是一語道破“玄機”:Scaling works(規(guī)?;瘮U展是有效的)。
01 實測阿里史上最大模型
目前,Qwen3-Max-Preview已經(jīng)可以體驗,只需在模型下拉選項中選擇即可:
體驗地址:https://chat.qwen.ai
并且官方的API服務(wù)也已經(jīng)開放:https://bailian.console.aliyun.com/?tab=model#/model-market(搜索Qwen3-Max-Preview)。
在實際效果方面,已經(jīng)有不少國內(nèi)外的網(wǎng)友們展開了實測;例如X上的知名博主AK,他就在HuggingFace集成了Qwen3-Max-Preview的項目AnyCoder中,輸入了這樣的Prompt:
Design and create a very creative, elaborate, and detailed voxel art scene of a pagoda in a beautiful garden with trees, including some cherry blossoms. Make the scene impressive and varied and use colorful voxels. Use whatever libraries to get this done.
然后,據(jù)AK的描述,Qwen3-Max-Preview一次性就實現(xiàn)了如下的效果:
當(dāng)我們在官網(wǎng)中輸入這樣的Prompt:
Create a beautiful celebratory landing page for the launch of Qwen3 Max.
只需短短幾秒鐘的時間,Qwen3-Max-Preview就生成了一個完整的慶祝頁面,響應(yīng)速度實測是非??斓模?/p>
接下來,我們加大難度,直接上經(jīng)典的編程問題——彈跳球模擬碰撞。
先小試牛刀一個:
Write a javascript code that shows a ball bouncing inside a spinning hexagon. The ball should be affected by gravity and friction, and it must bounce off the rotating walls realistically, implement it in javascript and html.
可以看到,小球會基于物理規(guī)律在六邊形的框內(nèi)運行;并且在用“向上鍵”去給小球一個力時,它也能立即做出響應(yīng)。
當(dāng)我們把球的數(shù)量設(shè)置到10個,一次性生成的效果也是相當(dāng)自然:
最后,我們再讓Qwen3-Max-Preview生成一個小游戲:
做一個《憤怒的小鳥》的小游戲。
不過雖然是一次性生成成功,但或許因為Prompt過于簡單,這個小游戲還是有一些小瑕疵,例如怪物的位置不是很準(zhǔn)確;感興趣的小伙伴可以多次嘗試一下。
02 Qwen憑什么后來者居上?
從這次阿里直接從千億參數(shù)模型飆升到萬億規(guī)模(近四倍提升),并且一舉在眾多評測中拿下第一來看,Qwen已然在全球范圍內(nèi)站穩(wěn)了第一梯隊的位置。
但有一說一,縱觀整場AI大模型的競賽,阿里并不是最早在中國推出對標(biāo)ChatGPT產(chǎn)品的公司,但絕對屬于后來者居上的那一個。
相較于國內(nèi)先行者(如百度),阿里大模型初期可以說是相對低調(diào),不過它的路徑卻是格外的清晰——用模型開源來構(gòu)建生態(tài),用自研閉源探索技術(shù)前沿。
例如在開源這件事上,從2023年開始,Qwen就以驚人的速度向全球開發(fā)者開源多個版本模型。從70億參數(shù)的Qwen-7B到140億、720億參數(shù),再到視覺、音頻等多模態(tài)模型,幾乎覆蓋所有主流尺寸和應(yīng)用場景。更關(guān)鍵的是,阿里不僅開源模型權(quán)重,還開放商業(yè)化授權(quán),極大激發(fā)了中小企業(yè)和個人開發(fā)者的熱情。
這一系列動作讓它迅速在Hugging Face等全球頂級開源社區(qū)建立廣泛影響力,吸引了大量開發(fā)者圍繞Qwen生態(tài)創(chuàng)新開發(fā),形成強大社區(qū)驅(qū)動力。這種廣積糧的策略為通義千問贏得了寶貴的開發(fā)者心智和應(yīng)用場景數(shù)據(jù),這可以說是閉源模型難以企及的優(yōu)勢。
但在開源之外,阿里內(nèi)部也從沒有停止對模型能力上限的探索。正如官方發(fā)布萬億參數(shù)模型時所言,Scaling works(規(guī)?;瘮U展有效)。這背后是對Scaling Law的一種篤信——隨著模型參數(shù)、數(shù)據(jù)量和計算量指數(shù)級增長,模型能力會涌現(xiàn)質(zhì)的飛躍。
訓(xùn)練Qwen3 Max Preview這樣的萬億參數(shù)模型,不僅是資源堆砌,更要求在超大規(guī)模計算集群穩(wěn)定性、分布式訓(xùn)練算法效率、數(shù)據(jù)處理精細(xì)度以及工程優(yōu)化的每個細(xì)節(jié)上都做到極致。
這背后是阿里數(shù)年來在算力基礎(chǔ)設(shè)施上的巨大投入,以及在AI工程化領(lǐng)域的深厚積累。正是這種大力出奇跡式的飽和投入,讓Qwen在編程、推理等核心能力上實現(xiàn)了對Claude Opus等頂級模型的反超。
在開源模型和能力探索之外,阿里云,也是Qwen能夠后來者居上的關(guān)鍵一環(huán)。
畢竟大模型訓(xùn)練推理是名副其實的算力吞金獸,阿里云為Qwen研發(fā)提供了穩(wěn)定高效的算力基礎(chǔ)設(shè)施,整合了從數(shù)據(jù)標(biāo)注、模型開發(fā)、分布式訓(xùn)練到部署推理的全鏈路工具,極大降低了研發(fā)團隊工程負(fù)擔(dān),使其專注算法和模型創(chuàng)新。
并且在模型的應(yīng)用和普及方面,同樣是因為阿里云的MaaS戰(zhàn)略,可以讓Qwen快速在各行各業(yè)中深耕;例如企業(yè)客戶無需從零訓(xùn)練模型,可直接在阿里云調(diào)用Qwen API,或利用平臺工具對開源Qwen模型微調(diào),快速構(gòu)建AI應(yīng)用。
這種“模+云”的策略形成了從技術(shù)研發(fā)到商業(yè)化落地的最短路徑。
03 但也并非完美
雖然阿里在大模型發(fā)展的戰(zhàn)略和選擇促成了它后來者居上的優(yōu)勢,但這并不意味著現(xiàn)階段的Qwen沒有隱患。
因為阿里選擇的開源模型引流、云服務(wù)變現(xiàn)可以說是一條機遇與挑戰(zhàn)并存的道路;它與Meta的Llama系列相似,目標(biāo)通過開放生態(tài)快速搶占市場份額和開發(fā)者心智,最終將商業(yè)價值導(dǎo)向自家基礎(chǔ)設(shè)施。
這與OpenAI、Anthropic等閉源+API的精英路線形成鮮明對比,它們優(yōu)勢在于更好保護核心技術(shù),維持技術(shù)代差,通過高價值A(chǔ)PI服務(wù)直接獲得高額利潤。
而阿里開源策略雖能快速普及技術(shù),但這也意味著其最先進模型很難與競爭對手拉開絕對差距,商業(yè)模式也更加迂回,需要客戶首先認(rèn)可其云平臺價值。
開源模式的核心挑戰(zhàn)在于如何平衡開放與收益,當(dāng)企業(yè)可以免費獲取并私有化部署性能足夠好的開源模型時,他們?yōu)楣俜皆品?wù)付費的意愿又會有多強呢?
換言之,阿里云不僅要提供簡單模型托管,還必須提供遠(yuǎn)超開源版本的性能優(yōu)化、安全保障、以及強大工具鏈和企業(yè)級服務(wù),才能構(gòu)建足夠深的護城河。如何讓龐大開源用戶群體有效轉(zhuǎn)化為高價值付費云客戶,是這條道路上最關(guān)鍵的商業(yè)驚險一躍。
除了商業(yè)化的挑戰(zhàn)之外,在頂尖AI人才爭奪進入白熱化的今天,任何核心人才流失都可能對團隊造成深遠(yuǎn)影響。
近年來,包括AI框架和基礎(chǔ)設(shè)施領(lǐng)域關(guān)鍵人物賈揚清在內(nèi)的一些核心技術(shù)人才先后離開阿里,投身創(chuàng)業(yè)浪潮或加入其他巨頭。雖然對于阿里這樣體量的公司而言,個別人員離開未必動搖根基,但負(fù)面影響依然存在。
畢竟核心領(lǐng)軍人物離開可能影響團隊士氣,對外傳遞負(fù)面信號,增加后續(xù)吸引頂尖人才的難度;在關(guān)鍵技術(shù)方向上,領(lǐng)軍人物的變動還可能給項目長期戰(zhàn)略延續(xù)性帶來不確定性。
也正像Meta在硅谷持續(xù)上演的搶人大戰(zhàn),離開的人才往往成為新競爭對手,他們對原有體系優(yōu)劣勢了如指掌,可能在細(xì)分領(lǐng)域構(gòu)成更精準(zhǔn)威脅。
因此,阿里如何在高強度競爭下持續(xù)保持對全球頂尖AI人才的吸引力,并建立穩(wěn)定可持續(xù)的人才梯隊,是它在未來發(fā)展過程中必須面對的嚴(yán)肅課題。
結(jié)語
總體來看,阿里通義千問無疑是中國乃至全球大模型領(lǐng)域的頂級力量。它憑借“開源與自研并行”的清晰戰(zhàn)略、依托阿里云的強大生態(tài)、以及深厚技術(shù)人才積累,成功在激烈競爭中占據(jù)領(lǐng)先地位。萬億參數(shù)模型的發(fā)布更是彰顯了其在Scaling Law上的決心和實力。
然而,成功之路也伴隨著清晰挑戰(zhàn)。以開源換生態(tài)的商業(yè)模式,其盈利能力的持續(xù)性仍需市場檢驗;與OpenAI等閉源巨頭的技術(shù)代差追逐將是長期過程;而頂級人才的保留與吸引,則是維持創(chuàng)新活力的生命線。
Qwen在未來不僅需要在技術(shù)上持續(xù)突破,更需要在商業(yè)模式和組織能力上證明自己的獨特價值。它能否將今天的技術(shù)優(yōu)勢轉(zhuǎn)化為明天不可動搖的市場勝勢,將是整個行業(yè)、包括資本市場關(guān)注的焦點。這也是阿里未來市值能否更上一層樓的關(guān)鍵。
1、https://x.com/Alibaba_Qwen/status/1963991502440562976
2、https://chat.qwen.ai/
3、https://x.com/_akhaliq/status/1964001592710975971
關(guān)于我們|版權(quán)聲明| 違法和不良信息舉報電話:010-84151598 | 網(wǎng)絡(luò)敲詐和有償刪帖舉報電話:010-84151598
Copyright ? 2008-2024 by {當(dāng)前域名}. all rights reserved