中山大學(xué)哲學(xué)系(珠海)主任、博雅學(xué)院院長(zhǎng)、聯(lián)合實(shí)驗(yàn)室專家陳建洪
“聯(lián)合實(shí)驗(yàn)室將成為國(guó)際合作的重要窗口,積極參與全球AI治理對(duì)話,提升區(qū)域在全球的影響力?!敝猩酱髮W(xué)哲學(xué)系(珠海)主任、博雅學(xué)院院長(zhǎng)、聯(lián)合實(shí)驗(yàn)室專家陳建洪接受南都采訪表示,哲學(xué)研究能為AI倫理規(guī)范提供深層基礎(chǔ),哲學(xué)視角能提醒技術(shù)團(tuán)隊(duì)堅(jiān)守增進(jìn)人類福祉原則,而非取代人類價(jià)值。
哲學(xué)與AI
哲學(xué)能深入理解AI風(fēng)險(xiǎn)本質(zhì)
南方都市報(bào)(以下簡(jiǎn)稱“南都”):本次粵港澳大灣區(qū)生成式人工智能安全發(fā)展聯(lián)合實(shí)驗(yàn)室會(huì)聚了各學(xué)術(shù)領(lǐng)域、學(xué)科的專家,您作為哲學(xué)領(lǐng)域的專家,覺得哲學(xué)相關(guān)的研究能為實(shí)驗(yàn)室的治理體系建設(shè)提供哪些獨(dú)特支撐?
陳建洪:首先是價(jià)值觀與倫理原則的構(gòu)建。哲學(xué)研究能夠深入探討人類社會(huì)的根本價(jià)值觀,如公平、正義、尊嚴(yán)、自由等,為AI倫理規(guī)范提供深層基礎(chǔ)。它將有助于聯(lián)合實(shí)驗(yàn)室明確生成式AI發(fā)展的終極目的和應(yīng)遵循的基本原則,避免技術(shù)盲目發(fā)展,例如思考“公平”的AI模型應(yīng)具備哪些屬性。
其次是風(fēng)險(xiǎn)的本質(zhì)與邊界界定。哲學(xué)能幫助我們超越技術(shù)層面,深入理解AI風(fēng)險(xiǎn)的本質(zhì)(如是技術(shù)缺陷、使用方式問題還是社會(huì)結(jié)構(gòu)互動(dòng)結(jié)果),并界定可接受的風(fēng)險(xiǎn)邊界,以及如何在創(chuàng)新與風(fēng)險(xiǎn)之間進(jìn)行權(quán)衡取舍。例如,對(duì)“可解釋性”的哲學(xué)探討可避免過度約束技術(shù)發(fā)展。
最后是責(zé)任分配與主體思考:隨著AI能力增強(qiáng),傳統(tǒng)責(zé)任概念面臨挑戰(zhàn)。哲學(xué)研究能深入探討“誰(shuí)該負(fù)責(zé)”的問題,包括開發(fā)者、使用者、管理者乃至AI系統(tǒng)自身(作為有限主體性),并強(qiáng)調(diào)人類在AI發(fā)展中的主體地位,確保AI始終服務(wù)于人類福祉。
南都:在您看來,哲學(xué)視角可在哪些維度和技術(shù)治理互相補(bǔ)充?
陳建洪:第一,超越技術(shù)可行性的倫理審查。技術(shù)團(tuán)隊(duì)常關(guān)注“能否做到”,哲學(xué)視角則引入“應(yīng)不應(yīng)該做”的考量。在AI模型迭代、內(nèi)容審核等環(huán)節(jié),哲學(xué)倫理審查節(jié)點(diǎn)可引導(dǎo)技術(shù)團(tuán)隊(duì)預(yù)判社會(huì)危害和倫理風(fēng)險(xiǎn),在研發(fā)初期就進(jìn)行規(guī)避或設(shè)計(jì)限制。
第二,社會(huì)影響的預(yù)判與評(píng)估。技術(shù)治理側(cè)重技術(shù)指標(biāo),哲學(xué)視角引導(dǎo)技術(shù)團(tuán)隊(duì)更全面思考AI對(duì)社會(huì)、文化、經(jīng)濟(jì)乃至個(gè)人心理健康的深遠(yuǎn)影響,促使其在設(shè)計(jì)之初就融入社會(huì)影響評(píng)估,并通過技術(shù)設(shè)計(jì)促進(jìn)積極社會(huì)效應(yīng)。
除此之外,公平與公正的價(jià)值嵌入也很重要。技術(shù)團(tuán)隊(duì)難以直接在代碼層面體現(xiàn)抽象公平概念。哲學(xué)視角可將公平、無偏見等倫理原則轉(zhuǎn)化為具體的研發(fā)規(guī)范和設(shè)計(jì)策略,例如在數(shù)據(jù)選擇時(shí)強(qiáng)調(diào)多樣性和代表性,在算法設(shè)計(jì)時(shí)鼓勵(lì)偏見檢測(cè)和緩解機(jī)制。
最后就是增進(jìn)人類福祉的堅(jiān)守。哲學(xué)視角能提醒技術(shù)團(tuán)隊(duì)堅(jiān)守增進(jìn)人類福祉原則,確保AI工具服務(wù)于人類尊嚴(yán)、自主和福祉,而非取代人類價(jià)值。這意味著在技術(shù)設(shè)計(jì)中,要保留人類的最終控制權(quán)和決策權(quán),強(qiáng)調(diào)AI作為人類輔助的角色。
體系與機(jī)制
建立系統(tǒng)性偏見檢測(cè)與緩解流程
南都:據(jù)了解,聯(lián)合實(shí)驗(yàn)室將制定行業(yè)安全發(fā)展標(biāo)準(zhǔn),形成屬地化安全標(biāo)準(zhǔn)體系。如何平衡標(biāo)準(zhǔn)的嚴(yán)謹(jǐn)性與產(chǎn)業(yè)發(fā)展的靈活性,滿足大灣區(qū)多元產(chǎn)業(yè)結(jié)構(gòu)的需求?
陳建洪:為平衡標(biāo)準(zhǔn)的嚴(yán)謹(jǐn)性與產(chǎn)業(yè)發(fā)展的靈活性,實(shí)驗(yàn)室可采取以下策略:首先,實(shí)施分級(jí)分類管理,依據(jù)風(fēng)險(xiǎn)等級(jí)和應(yīng)用場(chǎng)景差異,對(duì)高風(fēng)險(xiǎn)領(lǐng)域制定強(qiáng)制性標(biāo)準(zhǔn),對(duì)低風(fēng)險(xiǎn)領(lǐng)域采用靈活指導(dǎo)原則。其次,設(shè)立“監(jiān)管沙盒”機(jī)制,允許企業(yè)在受控環(huán)境中測(cè)試創(chuàng)新應(yīng)用,為標(biāo)準(zhǔn)完善提供實(shí)踐依據(jù)。再次,推進(jìn)行業(yè)自律與最佳實(shí)踐,鼓勵(lì)行業(yè)協(xié)會(huì)制定快速響應(yīng)市場(chǎng)的專業(yè)指引,作為官方標(biāo)準(zhǔn)的有益補(bǔ)充。最后,建立動(dòng)態(tài)更新與迭代機(jī)制,通過常態(tài)化評(píng)估和修訂,確保標(biāo)準(zhǔn)體系具備前瞻性和適用性,適應(yīng)技術(shù)快速發(fā)展。
南都:語(yǔ)料庫(kù)作為生成式AI的“知識(shí)基礎(chǔ)”,其價(jià)值導(dǎo)向直接影響AI生成內(nèi)容的倫理邊界。您認(rèn)為聯(lián)合實(shí)驗(yàn)室應(yīng)建立怎樣的語(yǔ)料庫(kù)篩選與審核機(jī)制?
陳建洪:聯(lián)合實(shí)驗(yàn)室應(yīng)建立多層次的語(yǔ)料庫(kù)篩選與審核機(jī)制,其核心原則包括:確保語(yǔ)料庫(kù)的多元性與代表性;建立系統(tǒng)性偏見檢測(cè)與緩解流程;實(shí)現(xiàn)價(jià)值觀對(duì)齊;并嚴(yán)格遵守?cái)?shù)據(jù)安全與隱私保護(hù)法規(guī)。具體機(jī)制涵蓋:實(shí)施數(shù)據(jù)來源嚴(yán)格審查與白名單準(zhǔn)入制度;采用自動(dòng)化技術(shù)與人工審核相結(jié)合的雙重篩選流程,由多學(xué)科專家團(tuán)隊(duì)對(duì)高風(fēng)險(xiǎn)內(nèi)容進(jìn)行復(fù)審;開發(fā)科學(xué)的偏見評(píng)估指標(biāo)與度量體系,并定期發(fā)布審計(jì)報(bào)告;引入“紅隊(duì)”測(cè)試進(jìn)行價(jià)值觀對(duì)齊的壓力測(cè)試與持續(xù)迭代;整合用戶反饋與眾包機(jī)制;并特別注重大灣區(qū)地域文化與行業(yè)特點(diǎn)的融入,邀請(qǐng)領(lǐng)域?qū)<覅⑴c審核,確保AI的適應(yīng)性與準(zhǔn)確性。
未來方向
期待形成“大灣區(qū)AI倫理范式”
南都:在您看來,聯(lián)合實(shí)驗(yàn)室接下來的建設(shè)運(yùn)行還有哪些方向?
陳建洪:對(duì)聯(lián)合實(shí)驗(yàn)室的建設(shè)運(yùn)行主要有四方面期待。一是將其打造為AI倫理研究與實(shí)踐的國(guó)際高地,通過設(shè)立專項(xiàng),系統(tǒng)研究并輸出可操作的倫理準(zhǔn)則與治理框架,形成具有國(guó)際影響力的“大灣區(qū)AI倫理范式”。二是構(gòu)建深度融合的“產(chǎn)學(xué)研用”生態(tài)圈,與頂尖高校及產(chǎn)業(yè)界緊密合作,開展科研、人才培養(yǎng)及行業(yè)應(yīng)用示范,推動(dòng)AI安全與倫理的落地實(shí)踐。三是賦能區(qū)域并影響全球,通過輸出高標(biāo)準(zhǔn)的安全解決方案和可推廣的“大灣區(qū)經(jīng)驗(yàn)”,助力企業(yè)提升競(jìng)爭(zhēng)力,并積極參與全球AI治理框架制定,貢獻(xiàn)中國(guó)智慧。四是建設(shè)開放共享的AI安全知識(shí)與資源中心,通過構(gòu)建知識(shí)庫(kù)、測(cè)試平臺(tái)及開源數(shù)據(jù)集,降低研發(fā)門檻,激發(fā)創(chuàng)新活力,提升全球AI系統(tǒng)的安全性與可信度。
聚焦
聯(lián)合實(shí)驗(yàn)室能發(fā)揮哪些獨(dú)特作用
粵港澳大灣區(qū)生成式人工智能安全發(fā)展聯(lián)合實(shí)驗(yàn)室將作為技術(shù)創(chuàng)新的核心引擎,通過匯聚頂尖科研資源,致力于生成式AI的前沿突破與應(yīng)用轉(zhuǎn)化。聯(lián)合實(shí)驗(yàn)室聚焦安全標(biāo)準(zhǔn)制定,構(gòu)建符合國(guó)際水平且適應(yīng)本地實(shí)際的安全規(guī)范體系。同時(shí)充當(dāng)產(chǎn)學(xué)研用協(xié)同交叉的橋梁,促進(jìn)知識(shí)共享與技術(shù)轉(zhuǎn)移,加速AI技術(shù)落地。作為高水平AI人才培養(yǎng)基地,輸送兼具技術(shù)能力與倫理法律視野的專業(yè)力量。依托大灣區(qū)區(qū)位優(yōu)勢(shì),成為國(guó)際合作窗口,積極參與全球AI治理對(duì)話,提升區(qū)域影響力。