伊人成人在线,超薄丝袜足交,无码无套少妇18p在线直播,亚洲 sss

  • 游客發(fā)表

    螞蟻聯(lián)手人大,發(fā)布MoE擴散模型

    發(fā)帖時間:2025-09-17 18:06:21

    通往AGI的路徑又多了一條。

    9月11日,在2025外灘大會上,螞蟻集團與中國人民大學(xué)聯(lián)合發(fā)布業(yè)界首個原生MoE架構(gòu)的擴散語言模型“LLaDA-MoE”。

    據(jù)了解,雙方在約20T數(shù)據(jù)上完成了從零訓(xùn)練MoE架構(gòu)的擴散語言模型,驗證了工業(yè)級大規(guī)模訓(xùn)練的擴展性和穩(wěn)定性;效果超過此前發(fā)布稠密擴散語言模型LLaDA1.0/1.5和Dream-7B,比肩等效自回歸模型,并保有數(shù)倍的推理速度優(yōu)勢。模型將在近期完全開源。

    這款新模型通過非自回歸的掩碼擴散機制,首次通過原生訓(xùn)練的MoE在大規(guī)模語言模型中實現(xiàn)了與Qwen2.5相當?shù)恼Z言智能(如上下文學(xué)習(xí)、指令遵循、代碼和數(shù)學(xué)推理等),挑戰(zhàn)了“語言模型必須自回歸”的主流認知。

    實現(xiàn)數(shù)據(jù)顯示,LLaDA-MoE模型性能效果在代碼、數(shù)學(xué)、Agent等任務(wù)上領(lǐng)先于LLaDA1.0/1.5和Dream-7B等擴散語言模型,接近或超越了自回歸模型 Qwen2.5-3B-Instruct,僅激活 1.4B 參數(shù)即可實現(xiàn)等效3B稠密模型的性能。

    “LLaDA-MoE模型驗證了工業(yè)級大規(guī)模訓(xùn)練的擴展性和穩(wěn)定性,意味我們在把dLLM訓(xùn)擴到更大規(guī)模的路上又往前走了一步?!彼{振忠在發(fā)布現(xiàn)場表示。

    中國人民大學(xué)高瓴人工智能學(xué)院副教授李崇軒介紹,“兩年過去,AI大模型能力突飛猛進,但存在一些問題始終沒有得到本質(zhì)上的解決。究其原因,這是當前大模型普遍采用的自回歸生成范式所造成的——模型天然是單向建模的,從前往后依次生成下一個token。這導(dǎo)致它們難以捕tokens 之間的雙向依賴關(guān)系?!?/p>

    面對這些問題,一些研究者選擇另辟蹊徑,將目光投向并行解碼的擴散語言模型。然而,現(xiàn)有 dLLM 均基于稠密架構(gòu),難以復(fù)刻 ARM 中 MoE 的“參數(shù)擴展、計算高效”優(yōu)勢。在這樣的行業(yè)背景下,螞蟻和人大聯(lián)合研究團隊,首次在MoE架構(gòu)上推出了原生的擴散語言模型LLaDA-MoE。

    藍振忠還表示,“我們將于近期向全球完全開源模型權(quán)重和自研推理框架,與社區(qū)共同推動 AGI 新一輪突破?!?/p>

    據(jù)了解,螞蟻與人大團隊攻關(guān) 3個月,在LLaDA-1.0基礎(chǔ)上重寫訓(xùn)練代碼,并且基于螞蟻自研分布式框架 ATorch提供EP 并行等一系列并行加速技術(shù),基于螞蟻Ling2.0基礎(chǔ)模型的訓(xùn)練數(shù)據(jù),在負載均衡、噪聲采樣漂移等核心難題上取得突破,最終采用 7B-A1B的MOE架構(gòu)完成約 20T 數(shù)據(jù)的高效訓(xùn)練。

    在螞蟻自研的統(tǒng)一評測框架下,LLaDA-MoE 在 HumanEval、MBPP、GSM8K、MATH、IFEval、BFCL 等 17項基準上平均提升 8.4%,領(lǐng)先 LLaDA-1.5達到13.2%,與 Qwen2.5-3B-Instruct 打平。實驗再次驗證“MoE 放大器”定律在 dLLM 領(lǐng)域同樣成立,為后續(xù) 10B–100B 稀疏模型提供可行路徑。

    據(jù)藍振忠介紹,除模型權(quán)重外,螞蟻還將同步開源針對 dLLM 并行特性深度優(yōu)化的推理引擎。相比 NVIDIA 官方 fast-dLLM,該引擎實現(xiàn)了顯著加速。相關(guān)代碼與技術(shù)報告將于近期在 GitHub 及 Hugging Face 社區(qū)同步發(fā)布。

    藍振忠還透露,螞蟻將持續(xù)投入包括基于dLLM的AGI領(lǐng)域,下一階段將聯(lián)合學(xué)界和全球AI社區(qū)共同推動AGI新的突破。“自回歸不是終點,擴散模型同樣可以成為通向 AGI 的主干道?!彼{振忠如是說。

      {loop type="link" row=1 }{$vo.title}

      久久毛片少妇高潮| 午夜亚洲AV| 你懂的网址精品一区| 欧美牲交a欧美牲交久久精品| 热久久国产欧美一区二区精品 | 亚洲国产初高中女| 大学生疯狂高潮呻吟免费视频 | 精品人妻一区二区三区四区久久| 日日碰狠狠添天天爽无码小说| 日韩A级毛片无码免费| 久成人精品亚洲无码| 国产精品乱码久久久久软件| 黑人巨大挺进亚洲女人| 你懂的在线视频| 亚洲成色www8888| 精品久久久久久中文字幕大豆网| 精品人妻一区二区动漫| 国产欧美另类久久久精品丝瓜| 543wa 亚洲 欧美| 三级人一区二区区网| 日韩少妇引起| av在线更新| 日韩 欧美 日本狠狠干| 日本AAA少妇高潮免费中国| 顶级毛片免费看| 狠狠CAO日日橹夜夜十橹| 精熟妇一区二区三区性色蜜| AV无码中文字幕不卡一二三区| 久久亚洲av无码精品色午夜麻豆| 国产精品99精品无码视频亚瑟| 国产美女在线精品免费观看| “色一区二区| 日本在线a一区视频高清视频| 亚洲精品蜜桃| 久热综合在线亚洲精品| 蜜臀av中文字幕免费| 色妞永久免费视频| 国产线播放免费人成视频播放| 国产福利深夜在线播放| 久久精品国内一区二区三区| 又黄又爽视频好爽视频|