亚人成色7777777,人人玩人人干人人操,www.99在线

當前位置：首頁>平頂山>復旦大學張謐：大模型工具本無善惡，向善引導是關鍵

游客發(fā)表

復旦大學張謐：大模型工具本無善惡，向善引導是關鍵

發(fā)帖時間：2025-09-18 19:15:51

[{$vo.typename}]來源：安心落意網(wǎng)

9月12日，2025外灘大會“規(guī)范AI內容共筑清朗生態(tài)”見解論壇上，復旦大學計算與智能創(chuàng)新學院教授、白澤智能團隊負責人張謐以“大模型的安全風險與治理”為主題展開分享，從技術基礎視角切入，結合團隊實踐經(jīng)驗與成果，深入剖析大模型安全風險與治理，提出創(chuàng)新性解決方案。她認為，大模型作為工具本身沒有善惡之分，其發(fā)展方向取決于人類如何利用和引導它向善發(fā)展。

本次論壇由南方都市報社、南都大數(shù)據(jù)研究院、中國互聯(lián)網(wǎng)協(xié)會人工智能工作委員會、復旦大學傳播與國家治理研究中心聯(lián)合主辦。

9月12日，復旦大學計算與智能創(chuàng)新學院教授、白澤智能團隊負責人張謐在2025外灘大會上進行主題分享。

隨著大模型能力的迅速提升，其安全治理問題已成為不容忽視的全球性挑戰(zhàn)。張謐將大模型安全問題分為兩個方面，一是大模型自身的安全問題，包括內容合規(guī)、隱私泄露和生成內容追溯等；二是以大模型為中心的全環(huán)節(jié)安全。作為“智能大腦”，大模型與外部系統(tǒng)交互時，會在任務規(guī)劃、記憶模塊、外部資源獲取、工具調用等環(huán)節(jié)暴露風險，尤其在多智能體協(xié)同場景下，行為可控性進一步降低。

“當前大模型已具備AGI雛形，自主性是其核心特征，也是風險根源?！睆堉k通過多個案例印證這一觀點。如AgentGPT能從零開始設計游戲、PaLM-E基于多模態(tài)大模型的具身智能、GPT-4驅動的機器人化學家能夠自主設計并執(zhí)行復雜實驗，甚至DeepMind用谷歌大模型突破60年數(shù)學難題，解法超出人類已有認知……

然而，這種自主性也帶來了前所未有的風險。張謐團隊研究發(fā)現(xiàn)，大模型已經(jīng)涌現(xiàn)出多種負面能力，如阿諛奉承（為符合用戶而忽視安全）、自我保全（拒絕關機指令）、偽裝人類（誘騙他人完成任務），甚至能夠輸出危險價值觀、學習危險知識，輔助合成成癮性藥物和病毒等。

面對大模型的安全治理挑戰(zhàn)，張謐團隊開發(fā)了JADE大模型安全風險分析治理平臺，該平臺目前已實現(xiàn)文本、多模態(tài)、文生圖、長推理模型和Agent安全等多個維度的風險與分析全面覆蓋?，F(xiàn)場展示的案例中，經(jīng)過安全微調的模型不僅拒絕回答危險問題，還會給出正向引導和建議。張謐說道：“器無大小善惡在人，人有妍媸巧拙在器?！彼J為，大模型作為工具本身沒有善惡之分，關鍵在于人類如何利用和引導它向善發(fā)展。

采寫：南都研究員麥潔瑩p>

{loop type="link" row=1 }{$vo.title}

伊人成人在线,超薄丝袜足交,无码无套少妇18p在线直播,亚洲 sss

復旦大學張謐：大模型工具本無善惡，向善引導是關鍵

復旦大學張謐：大模型工具本無善惡，向善引導是關鍵