伊人成人在线,超薄丝袜足交,无码无套少妇18p在线直播,亚洲 sss

  • 游客發(fā)表

    復旦大學張謐:大模型工具本無善惡,向善引導是關鍵

    發(fā)帖時間:2025-09-18 19:15:51

    9月12日,2025外灘大會“規(guī)范AI內容 共筑清朗生態(tài)”見解論壇上,復旦大學計算與智能創(chuàng)新學院教授、白澤智能團隊負責人張謐以“大模型的安全風險與治理”為主題展開分享,從技術基礎視角切入,結合團隊實踐經(jīng)驗與成果,深入剖析大模型安全風險與治理,提出創(chuàng)新性解決方案。她認為,大模型作為工具本身沒有善惡之分,其發(fā)展方向取決于人類如何利用和引導它向善發(fā)展。

    本次論壇由南方都市報社、南都大數(shù)據(jù)研究院、中國互聯(lián)網(wǎng)協(xié)會人工智能工作委員會、復旦大學傳播與國家治理研究中心聯(lián)合主辦。

    9月12日,復旦大學計算與智能創(chuàng)新學院教授、白澤智能團隊負責人張謐在2025外灘大會上進行主題分享。

    隨著大模型能力的迅速提升,其安全治理問題已成為不容忽視的全球性挑戰(zhàn)。張謐將大模型安全問題分為兩個方面,一是大模型自身的安全問題,包括內容合規(guī)、隱私泄露和生成內容追溯等;二是以大模型為中心的全環(huán)節(jié)安全。作為“智能大腦”,大模型與外部系統(tǒng)交互時,會在任務規(guī)劃、記憶模塊、外部資源獲取、工具調用等環(huán)節(jié)暴露風險,尤其在多智能體協(xié)同場景下,行為可控性進一步降低。

    “當前大模型已具備AGI雛形,自主性是其核心特征,也是風險根源?!睆堉k通過多個案例印證這一觀點。如AgentGPT能從零開始設計游戲、PaLM-E基于多模態(tài)大模型的具身智能、GPT-4驅動的機器人化學家能夠自主設計并執(zhí)行復雜實驗,甚至DeepMind用谷歌大模型突破60年數(shù)學難題,解法超出人類已有認知……

    然而,這種自主性也帶來了前所未有的風險。張謐團隊研究發(fā)現(xiàn),大模型已經(jīng)涌現(xiàn)出多種負面能力,如阿諛奉承(為符合用戶而忽視安全)、自我保全(拒絕關機指令)、偽裝人類(誘騙他人完成任務),甚至能夠輸出危險價值觀、學習危險知識,輔助合成成癮性藥物和病毒等。

    面對大模型的安全治理挑戰(zhàn),張謐團隊開發(fā)了JADE大模型安全風險分析治理平臺,該平臺目前已實現(xiàn)文本、多模態(tài)、文生圖、長推理模型和Agent安全等多個維度的風險與分析全面覆蓋?,F(xiàn)場展示的案例中,經(jīng)過安全微調的模型不僅拒絕回答危險問題,還會給出正向引導和建議。張謐說道:“器無大小善惡在人,人有妍媸巧拙在器?!彼J為,大模型作為工具本身沒有善惡之分,關鍵在于人類如何利用和引導它向善發(fā)展。

    采寫:南都研究員 麥潔瑩p>

      {loop type="link" row=1 }{$vo.title}

      成在线人免费视频| 国产日韩在线| 午夜福利麻豆国产精品| 国产成A人片在线观看| 强姧伦久久久久久久| 久久精品国产亚洲AV麻豆仙踪林 | 人人人妻人人澡人人爽欧美一区| 亚洲AⅤ免费在线观看| 亚洲国产日产无码精品| 一区二区看片| 97人妻熟女成人免费视频| 蜜桃AV无码| а√天堂资源地址在线官网下载 | 欧美成人性爱电影网址| 99久久久无码国产精品动漫| 日韩在线精品蜜桃| 亚洲一区二区三区啪啪| 国产丰满老熟女| 亚洲桃色AV| 蘑菇欧美午夜| 综合久久/av| 成人激情片段一区二区三区| 91高清国产视频| 中文字幕在线免费看线人| 亚洲精品一区二区三区四区五区| 人人揉人人摸人人扣人人操人人骑人人舔人人操 | 中文 在线 日韩 亚洲 欧美| 超级内射视频| 精品国产一区二区三区国产区| 乱伦的一区二区| 把老熟妇日出白浆16p| 色婷婷免费观看| www婷婷六月| 99re2.com| 国产无套护士在线观看| 奇米777影视一区二区三区| 中文人妻无码一区二区三区在线| 在线影视一区| 午夜精品久久久久9999| 高潮好爽视频在线观看| 国产96精品久久久久久|