游客發(fā)表
發(fā)帖時間:2025-09-17 01:21:51
智通財經(jīng)APP獲悉,9月12日,阿里巴巴(09988)通義發(fā)布下一代基礎(chǔ)模型架構(gòu)Qwen3-Next,并開源了基于該架構(gòu)的 Qwen3-Next-80B-A3B 系列模型。該模型包含兩個版本:更擅長理解和執(zhí)行指令的指令(Insctruct)模型,以及更擅長多步推理和深度思考的推理(Thinking)模型。
據(jù)介紹,相比Qwen3的MoE(混合專家)模型結(jié)構(gòu),Qwen3-Next進行了以下核心改進:混合注意力機制、高稀疏度MoE結(jié)構(gòu)、一系列訓(xùn)練穩(wěn)定友好的優(yōu)化,以及提升推理效率的多token預(yù)測機制(簡稱MTP,Multiple-Token Prediction)。
具體表現(xiàn)方面,新模型總參數(shù)80B僅激活3B,性能可媲美千問3旗艦版235B模型,模型計算效率大幅提升。Qwen3-Next訓(xùn)練成本較密集模型Qwen3-32B大降超90%,長文本推理吞吐量提升10倍以上,并可支持百萬Tokens(文本處理的最小單位?)超長上下文。
阿里巴巴通義團隊指出,高稀疏MoE架構(gòu)是Qwen3-Next面向下一代模型的最新探索。當(dāng)前,MoE是主流大模型都采用的架構(gòu),通過激活大參數(shù)中的小部分專家完成推理任務(wù)。此前,Qwen3系列的MoE專家激活比約為1比16,而Qwen3-Next通過更精密的高稀疏MoE架構(gòu)設(shè)計,實現(xiàn)了1比50的極致激活比。
{loop type="link" row=1 }{$vo.title} 精品不卡一区二区三区| 亚洲亚洲中文字幕无线码| 97久久亚洲| 国产在线一区二区三区av| 性爱视频波多野结衣在线观看 | 亚洲一区二区经典在线播放| 亚洲日韩欧美一区二区三区在线| 不卡乱辈伦在线看中文字幕| 久爱www人成免费网站| 高清欧美性猛交XXXX黑人猛交| 区二区三区久久综| 亚洲欧洲无码一区二区三区| 99爱爱热视频| 亚洲日韩欧洲无码AV夜夜摸| 人妻少妇久久久久久97人妻| 国产成人免费高清激情视频| 欧美激情丁香五月在线观看| 亚洲日本精品国产一区vr| 尤物视频在线免费观看| 亚洲人妻成年人| 午夜理论电影在线观看亚洲| Av免费在线网址| 成人无码国产| 日韩在线一区二区不卡视频| 免费观看欧美性一级| 国产成人ā片在线观看| 韩国青草无码自慰直播专区| 熟女被干流白浆| 精品肉伦伦影院| 亚洲a∨无码精品色午夜| 老妇熟女裸体乱| 无码精品日韩中文字幕| 国产一区影视在线| 国产成在线观看免费视频| 亚洲熟妇无码另类久久久App| 日韩欧美猛交xxxxx无码| 亚洲熟妇av一区二区三区宅男 | 亚洲精品乱码久久久久久蜜桃不卡果| 亚洲国产欧美在线观看| 丝袜美女视频久久| 亚洲中文字幕无码天然素人在线|