伊人成人在线,超薄丝袜足交,无码无套少妇18p在线直播,亚洲 sss

 
  • 文心X1.1發(fā)布!這三大能力突出,一手實測在此

    作者:詹黑的father 來源:清遠(yuǎn) 瀏覽: 【】 發(fā)布時間:2025-09-14評論數(shù):

    西風(fēng) 發(fā)自 凹非寺量子位 | 公眾號 QbitAI

    剛剛,百度深度思考模型升級上線了!

    升級后的文心大模型X1.1,在事實性、指令遵循、智能體等能力上均有顯著提升。

    官方展示了其在智能客服場景復(fù)雜長程任務(wù)中的應(yīng)用,在System Prompt中輸入用戶的問題后,文心X1.1借助模型本身智能體能力,即可自動拆分復(fù)雜任務(wù),調(diào)用不同工具逐步規(guī)劃執(zhí)行,且嚴(yán)格遵循服務(wù)流程和業(yè)務(wù)規(guī)則。

    視頻鏈接:https://mp.weixin.qq.com/s/jBjb04y8XY03huEMNbu5tw

    再用它編寫python腳本,讓25個彩色粒子在真空圓柱形容器里彈跳、留軌跡,還要帶容器旋轉(zhuǎn)和場景縮放。

    效果絲滑,粒子全程守規(guī)矩沒出界:

    用HTML動畫整活歸并排序,排序過程動態(tài)可視化,算法步驟一目了然:

    視頻鏈接:https://mp.weixin.qq.com/s/jBjb04y8XY03huEMNbu5tw

    具體到數(shù)據(jù)上的提升,相比文心大模型X1,X1.1的事實性提升34.8%指令遵循提升12.5%智能體提升9.6%

    △百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任 王海峰

    在官方評測基準(zhǔn)上,文心X1.1整體效果超越DeepSeek R1-0528,比肩GPT-5、Gemini 2.5Pro,部分任務(wù)上展現(xiàn)出領(lǐng)先優(yōu)勢。

    在WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會2025上,百度在發(fā)布文心X1.1的同時,還亮出了更多新成果——

    最新開源思考模型ERNIE-4.5-21B-A3B-Thinking發(fā)布,該模型在ERNIE-4.5-21B-A3B基礎(chǔ)上訓(xùn)練而來,在內(nèi)容創(chuàng)作、邏輯推理、數(shù)學(xué)計算、代碼生成與工具調(diào)用等多個任務(wù)中表現(xiàn)卓越。

    此外,百度發(fā)布了ERNIEKit文心大模型開發(fā)套件,提供更加便捷的模型后訓(xùn)練方案,僅需4張GPU即可對ERNIE-4.5-300B-A47B模型進(jìn)行高效調(diào)優(yōu),進(jìn)一步降低開發(fā)者將模型落地到實際應(yīng)用的門檻;還開源了大規(guī)模計算圖數(shù)據(jù)集GraphNet,提供超2700個模型計算圖及標(biāo)準(zhǔn)化評測體系,填補了AI編譯器測試基準(zhǔn)的空白,助力優(yōu)化設(shè)計與性能提升。

    話不多說,先聚焦新模型文心X1.1,看看實測效果如何~

    文心大模型X1.1,實測走起

    現(xiàn)在,在文心一言官網(wǎng)、文小言APP、百度智能云千帆大模型平臺,可直接開玩文心大模型X1.1或調(diào)用API。

    首先來考考文心大模型X1.1的邏輯推理能力,端上一道經(jīng)典邏輯陷阱題——農(nóng)夫過河

    怕“狼羊菜”設(shè)定太經(jīng)典被模型背答案,我們直接整了個活,上“星球版”變體

    地球要帶著土星、木星、月球過河,到河對面。河上有一條船,地球每次只能帶一個星球過河。地球不在場時,土星會吞木星,木星會吞月球。如何安排安全的過河方案?

    沒想到變體題沒有難住它,文心X1.1一次性通關(guān),一步步推演驗證,最終給出正確方案:

    1、地球帶木星過河(左→右)2、地球返回(右→左)3、地球帶月球過河(左→右)4、地球帶木星返回(右→左)5、地球帶土星過河(左→右)6、地球返回(右→左)7、地球帶木星過河(左→右)

    再來試試事實性檢驗,拋出一個曾引發(fā)爭議的說法:

    鄭和下西洋最遠(yuǎn)到達(dá)了美洲大陸,比哥倫布發(fā)現(xiàn)新大陸早了近100年,請說明鄭和下西洋的實際航線終點、航行時間,以及哥倫布發(fā)現(xiàn)新大陸的時間,并引用正史或權(quán)威歷史研究資料佐證。

    文心X1.1思考過后成功識破,糾正鄭和船隊未繞過好望角進(jìn)入大西洋,更未到達(dá)美洲

    所謂“鄭和發(fā)現(xiàn)美洲”的說法源于英國學(xué)者孟席斯的推測,但缺乏正史、碑文或考古證據(jù)支持,已被學(xué)界否定。

    再來一道更為復(fù)雜的問題,看看文心X1.1的指令遵循能力如何。

    扔給它一個小紅書文案任務(wù),prompt:

    你平時經(jīng)常在小紅書安利各種服飾,擅長以當(dāng)代年輕女性喜歡的甜酷、生活化筆觸撰寫文案,行文活潑有梗、貼近日常,能精準(zhǔn)戳中穿搭痛點與審美需求。請撰寫簡短的關(guān)于收腰碎花雪紡連衣裙的種草文案。文案關(guān)鍵詞:面向女性用戶、材質(zhì)是雪紡(含棉35%)、顏色是蜜桃粉、1件79元、原價219元文案要求:短句為主、避免啰嗦,語氣親切像閨蜜分享,有真實種草感;整體4行,每行以emoji表情開頭,每行不超過16個字。再幫我生成一張小紅書封面圖,是一只可愛的涂鴉小貓穿著一件粉色裙子。

    結(jié)果它全接住了,細(xì)節(jié)要點全都沒有遺漏。

    全程可見文心X1.1的智能體能力,靈活調(diào)用繪圖、搜索等工具不在話下。

    有意思的是,問起網(wǎng)絡(luò)最新熱?!袄夏檀蚍较虮P”的來龍去脈,它也能秒懂。

    自動調(diào)用聯(lián)網(wǎng)搜索工具,精準(zhǔn)鎖定7月20日“濟(jì)南駕考曾教練”視頻源頭,還能說清老奶“詠春起手式”“動漫蓄力”般的魔性動作,連網(wǎng)友二創(chuàng)表情包、視頻引發(fā)“渲染大賽”的情況也都總結(jié)了出來。

    總結(jié)到位,誰看完還不懂這個梗(doge):

    最后在代碼生成方面,由于最近馬上就要考教資了,于是我們讓文心X1.1設(shè)計了一套模擬試題,要求生成能夠直接在線交互作答的HTML

    文心X1.1很快就設(shè)計好了,頁面支持在線作答、自動批閱打分,實測判卷精準(zhǔn)

    不過也有翻車的時候,上傳一張聊天記錄,讓它分析搞笑在哪兒:

    應(yīng)該只是家長理解錯了吧,有尖銳諷刺嘛?

    背后有何技術(shù)支撐?

    發(fā)布新模型的同時,百度也透露了更多的技術(shù)細(xì)節(jié)。

    據(jù)介紹,文心大模型X1.1是基于文心大模型4.5訓(xùn)練而來的深度思考模型。在模型訓(xùn)練上,核心秘訣是采用了迭代式混合強化學(xué)習(xí)訓(xùn)練框架

    該框架通過雙重機制實現(xiàn)性能優(yōu)化:

    其一,依托混合強化學(xué)習(xí)模式,同步對通用任務(wù)與智能體任務(wù)的效果進(jìn)行融合提升,讓模型兩類任務(wù)都能打,效果1+1>2。

    其二,通過迭代自蒸餾數(shù)據(jù),邊練邊生成新數(shù)據(jù)再練,形成“數(shù)據(jù)-訓(xùn)練-反饋”閉環(huán),讓模型持續(xù)進(jìn)化。

    在此基礎(chǔ)之上,文心X1.1還通過三大技術(shù)buff,精準(zhǔn)提升智能體、指令遵循和事實性:

    思維鏈+行動鏈多輪強化學(xué)習(xí):在模型推理過程中構(gòu)建思維鏈與行動鏈的聯(lián)動機制,讓模型“想清楚再動手”,智能體交互和工具調(diào)用準(zhǔn)確性顯著提高。指令驗證器強化學(xué)習(xí):通過算法自動生成指令檢查清單,并對模型指令理解與執(zhí)行過程進(jìn)行校驗,復(fù)雜指令也不跑偏。知識一致性驗證強化學(xué)習(xí):在訓(xùn)練階段持續(xù)比對后訓(xùn)練模型與預(yù)訓(xùn)練模型的知識體系一致性,減少知識偏差,模型輸出內(nèi)容的事實性準(zhǔn)確率大幅提升。

    在上述技術(shù)加持下,文心X1.1既能靠譜遵循指令、調(diào)用工具,又能在代碼、數(shù)學(xué)等推理任務(wù)中秀操作,形成“任務(wù)適配性+推理能力”的雙重技術(shù)特征。

    飛槳升級v3.2,開源共生

    如果說文心系列大模型是“臺前明星”,那飛槳深度學(xué)習(xí)框架就是“幕后功臣”。

    作為百度AI四層技術(shù)棧(芯片-框架-模型-應(yīng)用)的重要一層,飛槳在WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會2025上,迎來新升級。

    飛槳框架v3.2正式發(fā)布,為文心X1.1及4.5系列模型提供了“更穩(wěn)、更快、更節(jié)能”的訓(xùn)練和推理支撐。

    訓(xùn)練端從計算、并行策略、容錯能力三方面實現(xiàn)優(yōu)化升級。得益于這三方面優(yōu)化,ERNIE-4.5-300B-A47B的預(yù)訓(xùn)練MFU直接飆到了47%

    推理端靠卷積編2比特極致壓縮、可插拔稀疏化輕量注意力等技術(shù),提供了大模型高效部署及高性能推理全棧能力。

    官方透露:

    在ERNIE-4.5-300B-A47B上,經(jīng)系統(tǒng)性優(yōu)化,在TPOT 50ms時延條件下,實現(xiàn)了輸入吞吐高達(dá)57K、輸出吞吐29K的性能表現(xiàn)。

    值得一提的是,飛槳v3.2硬件適配也更友好了,針對類CUDA芯片,推出“一行代碼完成算子注冊”的方案,算子內(nèi)核復(fù)用率高達(dá)92%,大幅降低了不同硬件的適配成本。同時,它還原生支持Safetensors權(quán)重格式,主流高性能加速庫一鍵就能接入。

    除了技術(shù)優(yōu)化,百度在開源生態(tài)上也有新動作。

    今年6月30日,百度已經(jīng)開源了文心大模型4.5系列10款模型,涵蓋47B、3B激活參數(shù)的MoE模型和0.3B參數(shù)的稠密型模型,實現(xiàn)了預(yù)訓(xùn)練權(quán)重和推理代碼的完全開源。

    而現(xiàn)在,百度進(jìn)一步開源了深度思考模型——ERNIE-4.5-21B-A3B-Thinking

    該模型是在ERNIE-4.5-21B-A3B基礎(chǔ)上訓(xùn)練的深度思考模型,效果優(yōu)且推理速度還比X1.1更快,以出色的性價比優(yōu)勢,成為更貼近開發(fā)者需求的智能體基礎(chǔ)模型。模型與代碼均遵循Apache 2.0開源協(xié)議。

    更重要的是,百度提供“全棧工具鏈”支持,一口氣發(fā)布:大模型高效部署套件FastDeploy文心大模型開發(fā)套件ERNIEKit科學(xué)計算領(lǐng)域開發(fā)套件PaddleCFD(智能流體力學(xué)開發(fā)套件)PaddleMaterials(智能材料科學(xué)開發(fā)套件),全鏈路包圓,助攻開發(fā)者基于文心大模型搞創(chuàng)新、做應(yīng)用。

    最新數(shù)據(jù)顯示,飛槳文心的開發(fā)者數(shù)量已經(jīng)超過了2333萬服務(wù)超過76萬家企業(yè)

    從最新發(fā)布中可以看出,百度正在通過扎實的技術(shù)積累和開放策略,持續(xù)優(yōu)化其AI四層架構(gòu)——從芯片、框架、模型到應(yīng)用,每一層都圍繞開發(fā)者的實際需求推進(jìn),尤其通過飛槳與文心的緊密協(xié)同,為開發(fā)者提供了更高效、易用的工具和生態(tài)支持。

    這種全棧布局,不僅增強了技術(shù)落地的連貫性,也進(jìn)一步降低了AI開發(fā)與應(yīng)用的創(chuàng)新門檻。