英偉達(dá)推出通用深度研究系統(tǒng),可接入任何LLM,支持個(gè)人定制
免费视频在线观看一区二区三区,少妇高潮一区二区三区69

伊人成人在线,超薄丝袜足交,无码无套少妇18p在线直播,亚洲 sss

  • 2025-09-14 11:27:30
    來源:筆墨官司網(wǎng)

    英偉達(dá)推出通用深度研究系統(tǒng),可接入任何LLM,支持個(gè)人定制

    字體:

    不圓 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI

    英偉達(dá)也做深度研究智能體了。

    最新論文介紹了英偉達(dá)的通用深度研究(UDR)系統(tǒng),該系統(tǒng)支持個(gè)人定制,可接入任何大語言模型(LLM)。

    這意味著它能夠圍繞任何語言模型運(yùn)行,用戶可以完全自定義深度研究策略,并交給智能體實(shí)現(xiàn)。

    為展示其通用性,英偉達(dá)還為UDR配備了帶用戶界面的研究演示原型,可在GitHub上下載。

    網(wǎng)友認(rèn)為,它使智能體的自主性得到了突破,非常適合企業(yè)工作。

    自帶模型和策略

    論文介紹,以往推出的所有深度研究智能體,都采用硬編碼方式,僅能通過固定的工具選擇來執(zhí)行特定研究策略。

    而英偉達(dá)的UDR系統(tǒng)能夠圍繞任何LLM運(yùn)行。

    還能使用戶能夠在無需額外訓(xùn)練或微調(diào)的情況下,創(chuàng)建、編輯和優(yōu)化他們完全自定義的深度研究策略。

    上圖呈現(xiàn)的是一個(gè)典型深度研究工具(DRT)的組成部分,與普通的對(duì)話式LLMs不同,DRTs在生成報(bào)告之前傾向于持續(xù)向用戶更新其進(jìn)度。

    一個(gè)DRT由兩部分組成:

    一個(gè)簡(jiǎn)單的用戶界面:用于接收研究提示,持續(xù)向用戶更新研究進(jìn)度,并顯示研究報(bào)告;代理邏輯:代碼代理(通過代碼協(xié)調(diào)大語言模型與工具的組合運(yùn)用)或LLM代理(直接利用模型自身的推理和工具調(diào)用能力)。

    無論是Gemini、Perplexity還是OpenAI,現(xiàn)有的DRTs主要采用僵化的研究策略,除研究提示詞外幾乎不留用戶定制空間;而在具有LLM代理的DRTs中,往往存在底層模型選擇單一、或僅使用訓(xùn)練后行為特征相同的同系列模型的問題。

    雖然這個(gè)問題并不是阻礙DRTs廣泛流行的障礙,但它從三個(gè)方面限制了它們的實(shí)用性:

    1、用戶既不能自主設(shè)置資源優(yōu)先級(jí),也無法自動(dòng)驗(yàn)證信息的權(quán)威性,更無法控制搜索成本。2、現(xiàn)有的DRTs做不出高價(jià)值行業(yè)需要的專業(yè)文檔分析方案。3、現(xiàn)有的DRTs使用的模型是不可換的——用戶不能隨意將最新或最強(qiáng)大的模型與深度研究智能體組合起來,以產(chǎn)生一個(gè)更強(qiáng)大的DRT。

    而英偉達(dá)的UDR系統(tǒng)提出了一種通用的解決方案來解決上述問題。

    簡(jiǎn)單地說,與專門的DRT不同,UDR從用戶那里接收研究策略和研究提示,允許更高的定制程度。

    UDR能夠?qū)⒉呗詮淖匀徽Z言編譯成可執(zhí)行的研究編排代碼片段,然后執(zhí)行策略,并將最終報(bào)告交付給用戶。

    其最顯著的創(chuàng)新特性包括:

    通過自然語言定制研究策略。UDR支持用戶用自然語言定義和編程自己的研究工作流,系統(tǒng)會(huì)將其轉(zhuǎn)換為可執(zhí)行、可審計(jì)的代碼。

    這意味著用戶自己設(shè)計(jì)的智能操作流程,不需要重新訓(xùn)練AI模型或進(jìn)行復(fù)雜調(diào)試,就能直接投入實(shí)際使用。

    與模型無關(guān)的研究工具架構(gòu)。UDR將研究邏輯與語言模型解耦,使開發(fā)者能夠?qū)⑷魏未笳Z言模型——無論供應(yīng)商或架構(gòu)如何——封裝成功能完整的深度研究工具。

    這樣一來,產(chǎn)品設(shè)計(jì)就有了更大發(fā)揮空間:既能選用最先進(jìn)的AI模型,又能搭配量身定制的研究方案,實(shí)現(xiàn)靈活組合的創(chuàng)新應(yīng)用。

    用戶可控的策略驅(qū)動(dòng)研究界面。下圖的原型展示了四大實(shí)用功能:實(shí)時(shí)修改研究策略、選擇預(yù)設(shè)策略庫、接收進(jìn)度通知、查看分析報(bào)告。

    UDR通過區(qū)分控制邏輯和語言模型推理來提升計(jì)算效率:整個(gè)深度研究流程的調(diào)度由生成的代碼全權(quán)負(fù)責(zé),這些代碼直接在CPU上運(yùn)行,避免了成本高出數(shù)十倍的語言模型推理開銷。

    系統(tǒng)僅在用戶自定義研究策略明確要求時(shí)才會(huì)調(diào)用LLM,且每次調(diào)用僅處理代碼變量中存儲(chǔ)的精簡(jiǎn)定向文本片段。

    這種雙重高效設(shè)計(jì)——將流程調(diào)度交給CPU執(zhí)行邏輯,同時(shí)將LLM的使用嚴(yán)格限定在精準(zhǔn)高效的調(diào)用中——不僅能夠降低GPU資源消耗,還可以顯著減少深度研究任務(wù)的總體執(zhí)行延遲和成本。

    仍需進(jìn)一步探索

    不過,這項(xiàng)工作目前還存在一定的局限性。

    一方面,UDR系統(tǒng)執(zhí)行研究策略的準(zhǔn)確度,完全取決于底層AI模型生成代碼的質(zhì)量。雖然研究人員通過強(qiáng)制要求代碼添加注釋來減少錯(cuò)誤,但當(dāng)策略表述模糊或不夠具體時(shí),系統(tǒng)偶爾還是會(huì)產(chǎn)生理解偏差或邏輯錯(cuò)誤。

    另一方面,UDR默認(rèn)用戶設(shè)計(jì)的研究策略本身是合理且可執(zhí)行的。系統(tǒng)只會(huì)做基礎(chǔ)檢查,不會(huì)判斷策略步驟是否真正有效。如果策略設(shè)計(jì)得不好,最終生成的報(bào)告可能質(zhì)量低下、內(nèi)容不全,或者根本生成不出報(bào)告。

    此外, 還有一點(diǎn)在于,雖然UDR會(huì)實(shí)時(shí)顯示研究進(jìn)度,但當(dāng)前版本在執(zhí)行過程中不支持用戶干預(yù)(只能停止任務(wù)),也無法根據(jù)實(shí)時(shí)反饋調(diào)整研究方向。

    所有決策都需要在研究開始前就預(yù)先設(shè)定好,這使得長(zhǎng)時(shí)間或探索性的研究任務(wù)缺乏靈活性。

    針對(duì)上述問題,研究人員也提出了進(jìn)一步的解決方案——或者說改進(jìn)方案:

    比如配備可修改定制的研究策略庫、進(jìn)一步探索如何讓用戶控制語言模型的自由推理過程、將大量用戶提示自動(dòng)轉(zhuǎn)化為確定性控制的智能體等。

    目前英偉達(dá)的UDR系統(tǒng)還只是原型階段,并未正式推出,但或許可以期待一下。

    期待一個(gè)功能完整的正式版本。

    參考鏈接:[1]https://x.com/rohanpaul_ai/status/1964689864244203596[2]https://research.nvidia.com/labs/lpr/udr/[3]https://github.com/NVlabs/UniversalDeepResearch

    【糾錯(cuò)】【責(zé)任編輯:\ue42aJH-no.13\ue42a_Oa2X】
    国产偷国产偷亚洲高清日韩 | 无码人妻少妇一区二区三区波多| 国产黄在线免费观看| 无码人妻精品一区二区三区东京热| 91麻豆久久久| 一本色综合网久久| 国产精品不卡一区二区在线| 沈阳45岁高潮女| 欧美性白人极品1819hd| 久久天堂成人av电影| 久久发布国产伦子伦精品| 欧美日韩中文国产一区发布 | 在国产线视频A在线视频| 欧美日韩性爱网站| 淑女AV一区二区| 被灌满精子的少妇视频| yyyyyy111111少妇影院| 国产精品一二三线| 亚洲日产精品一二三四区| 淫荡人妻系列| 国产无码精品影视| 亚洲爆乳无码一区二区三区| 午夜理论电影在线观看亚洲| 中文字幕一区二区三区无码视频| 夜色福利站WWW国产在线视频| 中文字幕精品久久久久人妻宅男| 婷婷色色日韩| 国产在线视频不卡一区二区 | 亚洲线精品一区二区三区八戒| 亚洲成a人片在线观看久| 欲色一区二区| 色爱区区域综合网| 国产极品视觉盛宴| 亚洲无码精品一区二区三区| 性欧美69式xxxx| 337p日本大胆人体噜噜噜| 国产精品高潮呻吟久久AV无码舒淇| 亚洲AV无码一区二区三区乱子仑 | 久久亚洲国产精品五月天| 狂C一区二区乱说精品无码| 男人j桶进女人p无遮挡全过程|