期待打造AI倫理研究與實(shí)踐國(guó)際高地

中山大學(xué)哲學(xué)系(珠海)主任、博雅學(xué)院院長(zhǎng)、聯(lián)合實(shí)驗(yàn)室專家陳建洪

“聯(lián)合實(shí)驗(yàn)室將成為國(guó)際合作的重要窗口，積極參與全球AI治理對(duì)話，提升區(qū)域在全球的影響力?！敝猩酱髮W(xué)哲學(xué)系(珠海)主任、博雅學(xué)院院長(zhǎng)、聯(lián)合實(shí)驗(yàn)室專家陳建洪接受南都采訪表示，哲學(xué)研究能為AI倫理規(guī)范提供深層基礎(chǔ)，哲學(xué)視角能提醒技術(shù)團(tuán)隊(duì)堅(jiān)守增進(jìn)人類福祉原則，而非取代人類價(jià)值。

哲學(xué)與AI

　　哲學(xué)能深入理解AI風(fēng)險(xiǎn)本質(zhì)

南方都市報(bào)（以下簡(jiǎn)稱“南都”）：本次粵港澳大灣區(qū)生成式人工智能安全發(fā)展聯(lián)合實(shí)驗(yàn)室會(huì)聚了各學(xué)術(shù)領(lǐng)域、學(xué)科的專家，您作為哲學(xué)領(lǐng)域的專家，覺得哲學(xué)相關(guān)的研究能為實(shí)驗(yàn)室的治理體系建設(shè)提供哪些獨(dú)特支撐？

陳建洪：首先是價(jià)值觀與倫理原則的構(gòu)建。哲學(xué)研究能夠深入探討人類社會(huì)的根本價(jià)值觀，如公平、正義、尊嚴(yán)、自由等，為AI倫理規(guī)范提供深層基礎(chǔ)。它將有助于聯(lián)合實(shí)驗(yàn)室明確生成式AI發(fā)展的終極目的和應(yīng)遵循的基本原則，避免技術(shù)盲目發(fā)展，例如思考“公平”的AI模型應(yīng)具備哪些屬性。

其次是風(fēng)險(xiǎn)的本質(zhì)與邊界界定。哲學(xué)能幫助我們超越技術(shù)層面，深入理解AI風(fēng)險(xiǎn)的本質(zhì)（如是技術(shù)缺陷、使用方式問題還是社會(huì)結(jié)構(gòu)互動(dòng)結(jié)果），并界定可接受的風(fēng)險(xiǎn)邊界，以及如何在創(chuàng)新與風(fēng)險(xiǎn)之間進(jìn)行權(quán)衡取舍。例如，對(duì)“可解釋性”的哲學(xué)探討可避免過度約束技術(shù)發(fā)展。

最后是責(zé)任分配與主體思考：隨著AI能力增強(qiáng)，傳統(tǒng)責(zé)任概念面臨挑戰(zhàn)。哲學(xué)研究能深入探討“誰(shuí)該負(fù)責(zé)”的問題，包括開發(fā)者、使用者、管理者乃至AI系統(tǒng)自身（作為有限主體性），并強(qiáng)調(diào)人類在AI發(fā)展中的主體地位，確保AI始終服務(wù)于人類福祉。

南都：在您看來，哲學(xué)視角可在哪些維度和技術(shù)治理互相補(bǔ)充？

陳建洪：第一，超越技術(shù)可行性的倫理審查。技術(shù)團(tuán)隊(duì)常關(guān)注“能否做到”，哲學(xué)視角則引入“應(yīng)不應(yīng)該做”的考量。在AI模型迭代、內(nèi)容審核等環(huán)節(jié)，哲學(xué)倫理審查節(jié)點(diǎn)可引導(dǎo)技術(shù)團(tuán)隊(duì)預(yù)判社會(huì)危害和倫理風(fēng)險(xiǎn)，在研發(fā)初期就進(jìn)行規(guī)避或設(shè)計(jì)限制。

第二，社會(huì)影響的預(yù)判與評(píng)估。技術(shù)治理側(cè)重技術(shù)指標(biāo)，哲學(xué)視角引導(dǎo)技術(shù)團(tuán)隊(duì)更全面思考AI對(duì)社會(huì)、文化、經(jīng)濟(jì)乃至個(gè)人心理健康的深遠(yuǎn)影響，促使其在設(shè)計(jì)之初就融入社會(huì)影響評(píng)估，并通過技術(shù)設(shè)計(jì)促進(jìn)積極社會(huì)效應(yīng)。

除此之外，公平與公正的價(jià)值嵌入也很重要。技術(shù)團(tuán)隊(duì)難以直接在代碼層面體現(xiàn)抽象公平概念。哲學(xué)視角可將公平、無偏見等倫理原則轉(zhuǎn)化為具體的研發(fā)規(guī)范和設(shè)計(jì)策略，例如在數(shù)據(jù)選擇時(shí)強(qiáng)調(diào)多樣性和代表性，在算法設(shè)計(jì)時(shí)鼓勵(lì)偏見檢測(cè)和緩解機(jī)制。

最后就是增進(jìn)人類福祉的堅(jiān)守。哲學(xué)視角能提醒技術(shù)團(tuán)隊(duì)堅(jiān)守增進(jìn)人類福祉原則，確保AI工具服務(wù)于人類尊嚴(yán)、自主和福祉，而非取代人類價(jià)值。這意味著在技術(shù)設(shè)計(jì)中，要保留人類的最終控制權(quán)和決策權(quán)，強(qiáng)調(diào)AI作為人類輔助的角色。

體系與機(jī)制

建立系統(tǒng)性偏見檢測(cè)與緩解流程

南都：據(jù)了解，聯(lián)合實(shí)驗(yàn)室將制定行業(yè)安全發(fā)展標(biāo)準(zhǔn)，形成屬地化安全標(biāo)準(zhǔn)體系。如何平衡標(biāo)準(zhǔn)的嚴(yán)謹(jǐn)性與產(chǎn)業(yè)發(fā)展的靈活性，滿足大灣區(qū)多元產(chǎn)業(yè)結(jié)構(gòu)的需求？

陳建洪：為平衡標(biāo)準(zhǔn)的嚴(yán)謹(jǐn)性與產(chǎn)業(yè)發(fā)展的靈活性，實(shí)驗(yàn)室可采取以下策略：首先，實(shí)施分級(jí)分類管理，依據(jù)風(fēng)險(xiǎn)等級(jí)和應(yīng)用場(chǎng)景差異，對(duì)高風(fēng)險(xiǎn)領(lǐng)域制定強(qiáng)制性標(biāo)準(zhǔn)，對(duì)低風(fēng)險(xiǎn)領(lǐng)域采用靈活指導(dǎo)原則。其次，設(shè)立“監(jiān)管沙盒”機(jī)制，允許企業(yè)在受控環(huán)境中測(cè)試創(chuàng)新應(yīng)用，為標(biāo)準(zhǔn)完善提供實(shí)踐依據(jù)。再次，推進(jìn)行業(yè)自律與最佳實(shí)踐，鼓勵(lì)行業(yè)協(xié)會(huì)制定快速響應(yīng)市場(chǎng)的專業(yè)指引，作為官方標(biāo)準(zhǔn)的有益補(bǔ)充。最后，建立動(dòng)態(tài)更新與迭代機(jī)制，通過常態(tài)化評(píng)估和修訂，確保標(biāo)準(zhǔn)體系具備前瞻性和適用性，適應(yīng)技術(shù)快速發(fā)展。

南都：語(yǔ)料庫(kù)作為生成式AI的“知識(shí)基礎(chǔ)”，其價(jià)值導(dǎo)向直接影響AI生成內(nèi)容的倫理邊界。您認(rèn)為聯(lián)合實(shí)驗(yàn)室應(yīng)建立怎樣的語(yǔ)料庫(kù)篩選與審核機(jī)制？

陳建洪：聯(lián)合實(shí)驗(yàn)室應(yīng)建立多層次的語(yǔ)料庫(kù)篩選與審核機(jī)制，其核心原則包括：確保語(yǔ)料庫(kù)的多元性與代表性；建立系統(tǒng)性偏見檢測(cè)與緩解流程；實(shí)現(xiàn)價(jià)值觀對(duì)齊；并嚴(yán)格遵守?cái)?shù)據(jù)安全與隱私保護(hù)法規(guī)。具體機(jī)制涵蓋：實(shí)施數(shù)據(jù)來源嚴(yán)格審查與白名單準(zhǔn)入制度；采用自動(dòng)化技術(shù)與人工審核相結(jié)合的雙重篩選流程，由多學(xué)科專家團(tuán)隊(duì)對(duì)高風(fēng)險(xiǎn)內(nèi)容進(jìn)行復(fù)審；開發(fā)科學(xué)的偏見評(píng)估指標(biāo)與度量體系，并定期發(fā)布審計(jì)報(bào)告；引入“紅隊(duì)”測(cè)試進(jìn)行價(jià)值觀對(duì)齊的壓力測(cè)試與持續(xù)迭代；整合用戶反饋與眾包機(jī)制；并特別注重大灣區(qū)地域文化與行業(yè)特點(diǎn)的融入，邀請(qǐng)領(lǐng)域?qū)＜覅⑴c審核，確保AI的適應(yīng)性與準(zhǔn)確性。

未來方向

　　期待形成“大灣區(qū)AI倫理范式”

南都：在您看來，聯(lián)合實(shí)驗(yàn)室接下來的建設(shè)運(yùn)行還有哪些方向？

陳建洪：對(duì)聯(lián)合實(shí)驗(yàn)室的建設(shè)運(yùn)行主要有四方面期待。一是將其打造為AI倫理研究與實(shí)踐的國(guó)際高地，通過設(shè)立專項(xiàng)，系統(tǒng)研究并輸出可操作的倫理準(zhǔn)則與治理框架，形成具有國(guó)際影響力的“大灣區(qū)AI倫理范式”。二是構(gòu)建深度融合的“產(chǎn)學(xué)研用”生態(tài)圈，與頂尖高校及產(chǎn)業(yè)界緊密合作，開展科研、人才培養(yǎng)及行業(yè)應(yīng)用示范，推動(dòng)AI安全與倫理的落地實(shí)踐。三是賦能區(qū)域并影響全球，通過輸出高標(biāo)準(zhǔn)的安全解決方案和可推廣的“大灣區(qū)經(jīng)驗(yàn)”，助力企業(yè)提升競(jìng)爭(zhēng)力，并積極參與全球AI治理框架制定，貢獻(xiàn)中國(guó)智慧。四是建設(shè)開放共享的AI安全知識(shí)與資源中心，通過構(gòu)建知識(shí)庫(kù)、測(cè)試平臺(tái)及開源數(shù)據(jù)集，降低研發(fā)門檻，激發(fā)創(chuàng)新活力，提升全球AI系統(tǒng)的安全性與可信度。

　　聚焦

　　聯(lián)合實(shí)驗(yàn)室能發(fā)揮哪些獨(dú)特作用

粵港澳大灣區(qū)生成式人工智能安全發(fā)展聯(lián)合實(shí)驗(yàn)室將作為技術(shù)創(chuàng)新的核心引擎，通過匯聚頂尖科研資源，致力于生成式AI的前沿突破與應(yīng)用轉(zhuǎn)化。聯(lián)合實(shí)驗(yàn)室聚焦安全標(biāo)準(zhǔn)制定，構(gòu)建符合國(guó)際水平且適應(yīng)本地實(shí)際的安全規(guī)范體系。同時(shí)充當(dāng)產(chǎn)學(xué)研用協(xié)同交叉的橋梁，促進(jìn)知識(shí)共享與技術(shù)轉(zhuǎn)移，加速AI技術(shù)落地。作為高水平AI人才培養(yǎng)基地，輸送兼具技術(shù)能力與倫理法律視野的專業(yè)力量。依托大灣區(qū)區(qū)位優(yōu)勢(shì)，成為國(guó)際合作窗口，積極參與全球AI治理對(duì)話，提升區(qū)域影響力。

【糾錯(cuò)】【責(zé)任編輯:19990122】

深度觀察

新華全媒頭條丨《漫威蜘蛛俠2》有刪減內(nèi)容：只為給瑪麗簡(jiǎn)騰出任務(wù)

伊人成人在线,超薄丝袜足交,无码无套少妇18p在线直播,亚洲 sss

期待打造AI倫理研究與實(shí)踐國(guó)際高地

期待打造AI倫理研究與實(shí)踐國(guó)際高地