新智元報道
編輯:KingHZ 艾倫
【新智元導(dǎo)讀】諾獎得主哈薩比斯直擊AI痛點:當(dāng)前LLM遠(yuǎn)非博士級智能,僅在特定領(lǐng)域閃光,卻缺乏全面性和一致性。真正的AGI,還需1-2項關(guān)鍵突破,等待有5-10年。
目前的博士級人工智能就是扯淡!
實屬沒想到,諾獎得主、谷歌DeepMind CEO哈薩比斯(Demis Hassabis)竟公然怒懟奧特曼。
在最近的訪談中,哈薩比斯公開表示,把如今的LLM稱作「博士級智能」,純屬無稽之談!
它們并非真正的博士級智能——雖然具備某些博士水平的能力,但整體上并不具備全面性。
而真正的通用智能,應(yīng)該是在所有領(lǐng)域都能達到博士級別的全面能力。
真正的通用人工智能不會犯低級錯誤,現(xiàn)在的AI并不具備持續(xù)推理、適應(yīng)和學(xué)習(xí)的能力。
哈薩比斯認(rèn)為:目前,還大概率還缺失1-2項關(guān)鍵突破,距離真正的「博士級智能」仍有5到10年之遙。
哈薩比斯對「博士級AI」的批評、對AGI本質(zhì)能力的真知灼見,頗有市場:
左右滑動查看
不過,他對 AGI 到來時間的判斷,未必準(zhǔn)確。
除了對AGI路線的探討,在All-In峰會上,哈薩比斯先回憶了諾獎時刻,之后系統(tǒng)闡述了他對世界模型、機器人、科研加速、能耗與效率的最新判斷:
Genie 3把一段文字變成可實時交互的「世界」,Gemini正在成為Alphabet的「AI引擎」,而真正具備創(chuàng)造力與一致性的AGI,仍需關(guān)鍵突破與時間磨礪。
AI天才執(zhí)掌DeepMind
AlphaFold助力摘諾獎
哈薩比斯,4歲成為國際象棋天才,2023年因?qū)I的貢獻被英國皇室冊封為爵,2024年獲得諾貝爾化學(xué)獎。
因蛋白質(zhì)結(jié)構(gòu)預(yù)測,谷歌DeepMind的哈薩比斯、John M.Jumper共享了1/2的諾獎
但是在正式公布前的十分鐘,他本人才得到獲獎通知,根本來不及消化這個消息,整個人都有點懵。
隨后,在瑞典參加為期一周的頒獎典禮,更是精彩絕倫,包括與王室成員的交流,每項安排都讓他驚嘆。
這項延續(xù)120年的榮譽傳統(tǒng)中,最讓人震撼的環(huán)節(jié)是組委會有個特殊安排——他們會從保險庫中取出諾貝爾獎歷史簽名簿。
哈薩比斯體驗了終生難忘的人生高光時刻:
將自己的名字與居里夫人、愛因斯坦等歷史上所有諾獎得主簽在同一本名冊上。
哈薩比斯作為DeepMind的CEO,是谷歌AI的掌舵人。
為了加入發(fā)展AI,谷歌和Alphabet旗下的AI團隊(包括原來的DeepMind)進行了整合,成立了現(xiàn)在的谷歌DeepMind。
哈薩比斯把新DeepMind描述為整個谷歌和Alphabet的「發(fā)動機」。
DeepMind負(fù)責(zé)Gemini、Gemma、Veo等生成式AI模型的開發(fā),同時負(fù)責(zé)以AlphaFold為代表的科學(xué)項目研究。
Gemini是谷歌的核心AI模型,應(yīng)用到谷歌搜索、Gmail等多個產(chǎn)品。
他領(lǐng)導(dǎo)的全部人員大約5000人,超過80%都是工程師或博士研究員。
谷歌開始做Gemini時,就堅持多模態(tài)——能看圖、聽音頻、看視頻,也能輸出多種形式。
要走向通用人工智能,系統(tǒng)不能只懂語言和抽象,還得懂身邊的物理世界;這是機器人之所以難、智能眼鏡類助手之所以關(guān)鍵的原因。
他這次介紹了最新推出的世界模型Genie 3、谷歌「新安卓」Gemini Robotics以及爆火的「Nano Banana」
前兩項落到一個共同方向:讓AI真正理解并操控物理世界。
DeepMind在推進把Gemini Robotics做成跨機器人平臺的「準(zhǔn)操作系統(tǒng)層」,可以把它理解成機器人的「Android」。
哈薩比斯認(rèn)為機器人還處在偏早期的階段,但接下來一兩年里,大概率出現(xiàn)「Aha時刻」。
而未來幾年,通用模型更強、更穩(wěn)健、更懂物理世界的細(xì)節(jié),足以完全支撐機器人在物理世界的操控能力。
關(guān)于未來創(chuàng)意工作將如何發(fā)展,哈薩比斯表示:頂尖的創(chuàng)意者,依然會主導(dǎo)引人入勝的體驗和動態(tài)故事線;他們可能變?yōu)椤甘澜缬^的編輯」,負(fù)責(zé)引導(dǎo)和整合眾人的集體創(chuàng)造力。
AGI路在何方?
AI的科學(xué)應(yīng)用是哈薩比斯最關(guān)心的方向。
他之所以把整段職業(yè)生涯押在AI上,就是為了用它加速科學(xué)發(fā)現(xiàn)、改善人類健康。
如果以正確方式構(gòu)建AGI,它會成為終極的科學(xué)工具。
過去幾年,DeepMind已經(jīng)展示了不少路徑:最出名的是AlphaFold,但谷歌也把AI用在材料設(shè)計、受控核聚變裝置的等離子體控制、天氣預(yù)報、甚至奧數(shù)級別的數(shù)學(xué)問題上。
相同范式的AI系統(tǒng),加上一點任務(wù)定向的微調(diào),就能在很多復(fù)雜領(lǐng)域里起作用。
哈薩比斯認(rèn)為AI加速科學(xué)發(fā)現(xiàn)才剛剛開始。
當(dāng)然,目前還缺一塊:真正的「創(chuàng)造力」。
在給定命題的前提下,今天的AI能去證明、去求解,但還談不上自己提出全新的猜想、假說或理論。什么時候它能自主提出好的問題,那也許才是一項關(guān)鍵的里程碑測試。
什么是「創(chuàng)造力」?
哈薩比斯認(rèn)為:那是我們常為之喝彩的「直覺式躍遷」——歷史上的頂尖科學(xué)家和藝術(shù)家都會做的那種跨越。
也許,創(chuàng)造力靠的是類比,靠把看似無關(guān)的事物勾連起來。
心理學(xué)和神經(jīng)科學(xué)對人類如何做到這一點各有理論,但一個可操作的測試是:
把一套現(xiàn)代AI的知識截斷在1901年,看看它能不能在1905年「自己想出」狹義相對論那樣的理論。
如果能,那就說明人類觸及到了真東西,也許AGI近在眼前。
再舉個例子:十年前,AlphaGo不僅擊敗了圍棋世界冠軍,它還下出「神之一手」——第二局那手著名的「第37手」。
但問題是:AI能不能不僅發(fā)明新策略,而是「發(fā)明一款像圍棋那樣優(yōu)雅、耐玩、審美上同樣動人的游戲」?
答案目前是否定的。這正是距「通用」的短板:真正的AGI,也該能做到這種層面的創(chuàng)造。
那具體還缺什么?
Anthropic的Dario、OpenAI的奧特曼認(rèn)為,AGI不久就能到來。
哈薩比斯更謹(jǐn)慎。他認(rèn)為核心在于:我們能不能復(fù)現(xiàn)人類最優(yōu)秀科學(xué)家那種「直覺式躍遷」,而不只是循序漸進的改良?
偉大科學(xué)家和優(yōu)秀科學(xué)家的差別,不在于基本功,而在于創(chuàng)造力:他們能從別的學(xué)科里捕捉到某種模式,把它類比、遷移到當(dāng)前難題上。
哈薩比斯相信AI終會做到這一點,但如今在推理思維方式上,AI仍欠火候,難以支撐這種突破。
另一個短板是「一致性」。
奧特曼等人稱目前AI已達到「博士級智能」,哈薩比斯認(rèn)為并非如此。
在若干子任務(wù)上,他們已達到「博士水平」,但并不意味著「全面博士級」。
而「通用智能」恰恰意味著在各個維度都能穩(wěn)定地達到那個水準(zhǔn)。事實是,我們都見過:
只要換個提問方式,當(dāng)下的聊天機器人會在高中數(shù)學(xué)、甚至簡單計數(shù)上犯低級錯。
對真正的AGI來說,這種情況不該發(fā)生。距離能完成上述能力的AGI, 哈薩比斯認(rèn)為還有大概5到10年。
除此之外,AI還缺「持續(xù)學(xué)習(xí)」的能力:能在線吸收新知識、及時調(diào)整行為。
也許,Scaling Law會繼續(xù)帶來部分改進。
但如果要下注,哈薩比斯認(rèn)為還需要一兩次關(guān)鍵性的原創(chuàng)突破,而這些突破很可能會在未來五年內(nèi)出現(xiàn)。
破解科研難題,AI4S持續(xù)發(fā)力
除了已經(jīng)取得大量重磅成果摘得諾獎的AlphaFold外,AI也將助力提高能源效率,解決自身需要的海量能源帶來的衍生問題。
AlphaFold這類混合模型,是AI未來發(fā)展方向
AlphaFold是一種混合模型。
所謂混合模型,是指同時使用概率性模型和確定性模型。
概率性模型是目前大模型普遍都在使用的基于概率預(yù)測下一個Token的模式,而引入確定性模型是大模型取得關(guān)鍵進步的下一步方向。
確定性模型遵循固定的邏輯算法,相同的輸入必然得到相同的輸出。
例如在大模型中引入真實世界的物理規(guī)則與化學(xué)規(guī)則,就是確定性模型。
哈薩比斯也在采訪中,詳細(xì)介紹了AlphaFold這個混合模型。
AlphaFold有一個學(xué)習(xí)組件,也就是概率組件,基于神經(jīng)網(wǎng)絡(luò)和Transformer等技術(shù),能從提供的任何可用數(shù)據(jù)中學(xué)習(xí)。
但在生物學(xué)和化學(xué)領(lǐng)域,很多時候數(shù)據(jù)并不充足。因此,必須將一些已知的化學(xué)和物理規(guī)則內(nèi)置到模型中。
在AlphaFold中,需要設(shè)定原子間的鍵角,并確保模型理解原子不能重疊等基本物理約束。
鍵角有約束規(guī)則
理論上,模型可以自己學(xué)會這些,但這會極大浪費模型的學(xué)習(xí)能力。
所以,將這些規(guī)則作為約束條件直接加入,是更高效的做法。
哈薩比斯也表示,無論是AlphaGo還是其他混合系統(tǒng),其關(guān)鍵和難點都在于如何將學(xué)習(xí)系統(tǒng)與一個更偏向于人工設(shè)計的、定制化的系統(tǒng)完美結(jié)合,讓它們協(xié)同工作。這其實相當(dāng)有挑戰(zhàn)性。
他認(rèn)為,最終的目標(biāo)是,當(dāng)通過混合系統(tǒng)取得進展后,應(yīng)將這些經(jīng)驗反哺并整合到學(xué)習(xí)組件中。
為了更具體地說明這點,哈薩比斯舉了從AlphaGo到AlphaZero的例子:
這有點像我們對 AlphaZero 所做的改進。
AlphaZero是AlphaGo的一個更通用的版本,AlphaGo內(nèi)部包含了一些針對圍棋的特定知識。
但在 AlphaZero中,我們移除了這些定制規(guī)則,包括我們用來訓(xùn)練的人類棋譜數(shù)據(jù),而是讓它從零開始,通過自我對弈進行學(xué)習(xí)。
最終的結(jié)果是,它不僅能下圍棋,還能學(xué)會任何其他的棋類游戲。
AI加速藥物發(fā)現(xiàn)
哈薩比斯仍在管理Isomorphic。
這家公司是DeepMind的衍生公司,建立在AlphaFold蛋白質(zhì)折疊預(yù)測的突破之上,致力于革新藥物發(fā)現(xiàn)。
了解蛋白質(zhì)結(jié)構(gòu)只是藥物發(fā)現(xiàn)過程的第一步,以便后續(xù)解決問題,如設(shè)計出能與蛋白質(zhì)靶點精準(zhǔn)結(jié)合且無副作用的化合物。
哈薩比斯表示,在未來十年內(nèi),有望將藥物發(fā)現(xiàn)的周期從數(shù)年甚至十年,縮短到幾周乃至幾天。
Isomorphic正在構(gòu)建平臺,禮來(美國大型跨國醫(yī)藥公司)、諾華(英國大型跨國制藥公司)也將深度參與其中。
Isomorphic自己內(nèi)部也同步開展了藥物研發(fā)項目,預(yù)計明年即可進入臨床前階段。
Isomorphic目前正在把重心放在癌癥和免疫學(xué)等領(lǐng)域,并與美國MD安德森癌癥中心這類全球頂尖機構(gòu)進行科研合作。
與此同時,DeepMind也在著力研究AlphaFold模型的更先進版本,讓模型不僅能夠理解蛋白質(zhì)相互作用,還能理解更多內(nèi)容,從而助力藥物研發(fā)。
AI能源需求龐大,但為優(yōu)化能源效率貢獻更大
隨著大模型參數(shù)不斷膨脹,訓(xùn)練和推理帶來的巨大能源消耗也越來越成為一個萬眾矚目的問題。
面對指數(shù)級增長的能源需求曲線,哈薩比斯解釋了DeepMind是如何應(yīng)對的。
由于背靠谷歌這個全球最龐大的AI應(yīng)用場景,極高的效率、極低的延遲和極低的服務(wù)成本是對模型的迫切要求。
DeepMind使用蒸餾等技術(shù)來提高模型效率,在同等性能下,效率提升了幾十倍。
然而,由于大家仍在探索AGI的路上,節(jié)約下來的能源又被投入到前沿模型研發(fā)上了。
當(dāng)然,哈薩比斯也指出,AI系統(tǒng)為解決能源和氣候變化問題帶來的貢獻,將遠(yuǎn)遠(yuǎn)超過其自身的消耗。
可能的貢獻包括優(yōu)化電網(wǎng)系統(tǒng)、設(shè)計具有新特性的材料,以及提升新能源的效率等。
未來十年,人工智能將在很大程度上幫助我們解決這些重大挑戰(zhàn),其貢獻將遠(yuǎn)超今天的能源消耗。
哈薩比斯認(rèn)為,十年后若AGI降臨,將開啟一場科學(xué)的黃金時代,也將是全新的文藝復(fù)興。
參考資料:
https://www.youtube.com/watch?v=Kr3Sh2PKA8Y
https://x.com/vitrupo/status/1966752552025792739
https://x.com/rohanpaul_ai/status/1966950863685157368