DeepMind科學掌門人首次揭秘:拿完諾獎只是開始,終極目標是打造「科學API」,讓人人都能搞科研
從破解生命密碼、催生諾貝爾獎級成果的 AlphaFold,到為谷歌節(jié)省數(shù)億美元、優(yōu)化千億級別計算資源的 AlphaEvolve,再到找到連頂尖數(shù)學家都未曾發(fā)現(xiàn)的新解法……這些顛覆性成果的背后,并非簡單的模型迭代,而是一套嚴謹?shù)浇蹩量痰膯栴}篩選法則
今天,Google DeepMind 科學負責人 Pushmeet Kohli 首次為我們揭開這套內(nèi)部心法:他們只瞄準三類問題——具有變革性、公認 5 到 10 年內(nèi)無人能解、但 DeepMind 卻有信心在短時間內(nèi)攻克的不可能的任務
DeepMind 的科學框架:如何篩選并攻克變革性挑戰(zhàn)
在訪談的一開始,Pushmeet Kohli 便明確指出,DeepMind 的科學團隊并非尋求漸進式的改進,而是專注于那些能夠帶來變革性影響(transformative impact)的宏大目標。為了系統(tǒng)性地篩選這些項目,他們建立了一套獨特的框架和方法論,確保資源能被投入到最關鍵、最有可能產(chǎn)生顛覆性成果的領域。
首先,Kohli 將智能的能力劃分為三個層次,這為理解 DeepMind 的問題選擇提供了背景:第一層:普遍人類智能 這是大多數(shù)人都具備的基礎能力,例如圖像識別、閱讀手寫文字等。AI 在這個領域已經(jīng)取得了長足的進步
第二層:專家級智能 這類智能需要經(jīng)過專門的訓練和學習,例如醫(yī)生根據(jù)癥狀進行診斷,或程序員根據(jù)需求編寫復雜的代碼
第三層:超人類智能 這是指那些即便是最聰明的人類專家也無法憑直覺或推理解決的問題。一個典型的例子就是蛋白質(zhì)折疊預測:在 AlphaFold 出現(xiàn)之前,即使給一位頂尖生物學家一個蛋白質(zhì)的氨基酸序列,他也無法直接推斷出其復雜的三維結(jié)構(gòu)。解決這類問題往往需要耗費數(shù)年時間和數(shù)百萬美元的實驗成本
DeepMind 的科學項目正是瞄準了第三個層次——那些未知的領域,致力于構(gòu)建能夠解決人類當前無法解決問題的智能系統(tǒng)。為了從眾多可能性中篩選出合適的項目,團隊遵循一個由三條核心原則構(gòu)成的決策算法:
1.變革性與可行性 項目的首要標準是必須具備產(chǎn)生變革性影響的潛力,無論是科學、商業(yè)還是社會層面。同時,它必須是可行的,即在科學規(guī)律的范疇內(nèi),而非像“時間旅行”那樣天馬行空的幻想。社區(qū)需要普遍認同該問題的解決將帶來巨大價值。2.公認的難度 項目必須具有極高的挑戰(zhàn)性,以至于行業(yè)內(nèi)的普遍共識是,在未來 5 到 10 年內(nèi)無人能夠解決它。如果一個問題在 6 個月內(nèi)就可能被其他人攻克,那么它就不屬于 DeepMind 科學團隊的目標范疇。他們專注于那些需要跨學科合作、頂尖 AI 研究、卓越工程能力以及龐大計算或數(shù)據(jù)資源才能解決的硬骨頭
3.顛覆共識的信心 盡管外界普遍認為該問題需要 5 到 10 年才能解決,但 DeepMind 團隊必須有充分的信心,相信自己能夠憑借獨特的方法,在預期時間的一半甚至三分之一內(nèi)取得突破
只有當一個潛在項目同時滿足這三個嚴苛的條件時,團隊才會正式立項。這個框架確保了 DeepMind 能夠持續(xù)地在最具挑戰(zhàn)性的科學前沿取得突破?;谶@個框架,他們產(chǎn)出的成果也根據(jù)其主要影響被分為三類:
科學影響: AlphaFold 是最杰出的代表。它解決了困擾生物學界數(shù)十年的蛋白質(zhì)結(jié)構(gòu)預測問題,將過去耗時數(shù)年、耗資百萬美元的過程縮短到幾秒鐘和幾美分。自 2020 年發(fā)布以來,AlphaFold 已被全球科研人員廣泛應用,成為引用率最高的科學論文之一,其核心貢獻者 Demis Hassabis 和 John Jumper 也因此獲得了諾貝爾獎,其科學影響力不言而喻
商業(yè)影響: AlphaEvolve 是一個很好的例子。它是一個由 Gemini 驅(qū)動的代碼優(yōu)化智能體,旨在解決那些頂尖計算機科學家也難以優(yōu)化的復雜問題。例如,通過優(yōu)化谷歌數(shù)據(jù)中心的作業(yè)調(diào)度算法,AlphaEvolve 成功節(jié)省了整個計算集群約 0.7% 的算力,這在谷歌的龐大規(guī)模下意味著巨大的成本節(jié)約。同時,它還顯著提升了 Gemini 模型自身的訓練速度。有趣的是,AlphaEvolve 在解決公開的數(shù)學難題時也表現(xiàn)出色,對 75% 的問題達到了當前最優(yōu)水平,并對其中 20% 的問題找到了超越人類數(shù)學家的更優(yōu)解
社會影響: SynthID 是一個致力于解決生成式 AI 風險的典范。隨著生成內(nèi)容的質(zhì)量越來越高,區(qū)分真實內(nèi)容和 AI 合成內(nèi)容變得愈發(fā)困難。SynthID 是一種先進的數(shù)字水印技術,它可以在 AI 生成的文本、圖像和視頻中嵌入一種人眼無法察覺但機器可以檢測的信號,且這種信號對常規(guī)的圖像編輯和轉(zhuǎn)換具有魯棒性。谷歌已將該技術應用于所有模態(tài)的生成式 AI 內(nèi)容中,旨在維護信息生態(tài)系統(tǒng)的透明度和可信度,讓用戶能夠清晰地了解內(nèi)容的來源
從專用模型到通用智能:IMO 金牌
國際數(shù)學奧林匹克(International Mathematical Olympiad, IMO)是中學生數(shù)學競賽的巔峰,其問題難度極高,考驗著深刻的邏輯推理和創(chuàng)造力。DeepMind 將其視為衡量和推動 AI 推理能力的重要標尺。訪談中,Pushmeet Kohli 詳細講述了團隊如何從構(gòu)建專用模型,最終發(fā)展到利用通用模型在 IMO 競賽中取得金牌級水平的歷程,這不僅是一個技術上的巨大飛躍,也體現(xiàn)了 DeepMind 科學團隊與 Gemini 團隊之間緊密的合作模式
去年的成果是基于兩個高度專業(yè)化的模型:
AlphaGeometry: 顧名思義,這個模型專門用于解決幾何問題
AlphaProof: 這個模型更為復雜。它的核心是一個大型語言模型(LLM),但其工作方式并非直接給出答案。它首先會將自然語言描述的數(shù)學問題,轉(zhuǎn)換成一種名為 Lean 的領域特定形式化語言。Lean 語言的優(yōu)勢在于,任何通過它生成的證明都是可以被機器驗證的,確保了結(jié)果的絕對正確性。AlphaProof 實質(zhì)上是在所有可能的證明路徑空間中進行智能搜索,一旦找到一條通往結(jié)論的路徑,就意味著它生成了一個形式上完全正確的證明。
這種方法雖然強大,但依賴于專門的模型和形式化語言的轉(zhuǎn)換,使得整個系統(tǒng)較為復雜且不易普及。而今年的突破則標志著一個根本性的轉(zhuǎn)變,其核心是 DeepThink,一個基于 Gemini 2.5 Pro 的模型。這一轉(zhuǎn)變的背后,是兩個團隊之間深度的技術轉(zhuǎn)移和協(xié)同創(chuàng)新。
從 AlphaProof 到 DeepThink 的技術轉(zhuǎn)移路徑非常關鍵:
1.利用專用模型生成高質(zhì)量訓練數(shù)據(jù): AlphaProof 擁有一個獨特的能力——它能生成海量的、經(jīng)過機器驗證的、絕對正確的數(shù)學問題及其證明。團隊利用這個能力,讓 AlphaProof 解決了成千上萬甚至數(shù)百萬個數(shù)學問題
2.反哺通用模型: 這些由 AlphaProof 生成的“問題-正確證明”數(shù)據(jù)對,構(gòu)成了一個規(guī)模龐大且質(zhì)量極高的訓練數(shù)據(jù)集。這些數(shù)據(jù)隨后被用來訓練和微調(diào)下一代的 Gemini 模型。這就像是讓一個初出茅廬的學生(Gemini)學習一位數(shù)學大師(AlphaProof)的所有解題過程和思路,從而極大地提升了 Gemini 在數(shù)學和邏輯推理方面的能力
這一策略帶來了幾個革命性的成果:
從專用走向通用: 最新的 IMO 金牌級成果不再依賴于 AlphaGeometry 和 AlphaProof 這類專用模型。所有的解題能力都被成功地整合進了 DeepThink 這一通用的 Gemini 模型中。這意味著 AI 的頂尖數(shù)學能力不再是孤立的,而是成為了一個更廣泛智能系統(tǒng)的一部分
實現(xiàn)自然語言交互: 新系統(tǒng)不再需要將問題翻譯成 Lean 這樣的形式化語言。用戶可以直接用自然語言(如英語)輸入 IMO 級別的復雜數(shù)學題,模型就能理解并直接給出解答過程。這極大地降低了使用門檻,使其更接近人類的自然思考和交流方式
當被問及這種強大的數(shù)學能力是否能泛化到其他領域時,Kohli 坦言這本身就是一個前沿的研究問題,目前尚無定論。團隊正在通過嚴謹?shù)南趯嶒灒╝blation studies)來系統(tǒng)性地研究,即通過在訓練數(shù)據(jù)中添加或移除這些數(shù)學證明數(shù)據(jù),來觀察模型在其他非數(shù)學任務上的表現(xiàn)變化,從而以經(jīng)驗性的方式來探索數(shù)學推理能力與其他通用智能之間的關聯(lián)
從 AlphaFold 數(shù)據(jù)庫到 AI 協(xié)同科學家
Pushmeet Kohli 強調(diào),DeepMind 的使命不僅在于實現(xiàn)科學突破,更在于將這些突破性的能力交到全世界的科學家手中,從而加速整個人類科學的進步。AI Co-scientist(AI 協(xié)同科學家)則代表了這一理念的未來方向。
其中最成功的案例就是 AlphaFold。團隊并沒有將這個強大的蛋白質(zhì)結(jié)構(gòu)預測系統(tǒng)保留為內(nèi)部工具,而是采取了多種方式使其普惠全球:
開放數(shù)據(jù)庫: 他們利用 AlphaFold 預測了地球上幾乎所有已知蛋白質(zhì)的結(jié)構(gòu),并將這些超過 2 億個預測結(jié)構(gòu)全部免費公開在一個名為 AlphaFold Database 的數(shù)據(jù)庫中。
賦能全球研究者: 這一舉措徹底改變了結(jié)構(gòu)生物學的研究范式。正如 Kohli 所描述的,一位在巴西或非洲研究被忽視的熱帶病的研究者,過去可能因為缺乏資金和設備而無法獲得其研究靶點蛋白質(zhì)的結(jié)構(gòu)。現(xiàn)在,他/她只需訪問一個網(wǎng)頁,輸入蛋白質(zhì)序列,點擊按鈕,就能在幾秒鐘內(nèi)獲得高質(zhì)量的結(jié)構(gòu)預測。這極大地拉平了全球科研資源的差距
提供 API 接口: 除了數(shù)據(jù)庫,他們還通過 API 的形式讓開發(fā)者和研究機構(gòu)能將 AlphaFold 的能力集成到自己的研究流程中。
同樣的理念也體現(xiàn)在其他項目中,例如 AlphaGenome,團隊為其開發(fā)了定制的用戶界面(UI),讓研究者可以方便地探索人類基因組中的變異如何影響基因功能。這些努力的核心思想是,將復雜的 AI 模型封裝成易于使用的工具,讓非 AI 領域的專家也能從中受益。
展望未來,AI Co-scientist 項目將這種理念推向了一個新的高度。它不再僅僅是一個解決特定問題的工具,而是一個模擬并增強整個科學研究過程的智能系統(tǒng)
多智能體協(xié)作系統(tǒng): AI Co-scientist 的核心是一個多智能體(multi-agent)系統(tǒng),其中 Gemini 模型扮演了科學研究生態(tài)中的多個不同角色。它既是“假設生成者(hypothesis generator)”,負責提出新穎的科學想法;又是“審稿人(reviewer)”和“批判者(critique)”,負責嚴格地審視和挑戰(zhàn)這些想法的邏輯和可行性。系統(tǒng)內(nèi)部會進行想法的生成、批判、排序和迭代,模擬了一個高效運轉(zhuǎn)的科研團隊
驚人的洞察力: 這種內(nèi)部的思想碰撞機制讓系統(tǒng)能夠產(chǎn)生出乎意料的深刻見解。Kohli 分享了一個軼事:團隊曾邀請倫敦帝國理工學院的一位教授提供一個他所在領域的前沿難題。當團隊將 AI Co-scientist 生成的幾條核心假設反饋給這位教授時,他驚愕地發(fā)現(xiàn),其中排名第一的假設,正是他自己的團隊耗費數(shù)年心血研究、并且剛剛投稿到頂級期刊的最新成果。他一度懷疑自己的論文被泄露了。這個故事有力地證明了 AI Co-scientist 已經(jīng)能夠獨立地思考,并觸及到人類科學研究的最前沿
AI Co-scientist 的終極愿景:在未來,當谷歌宣布一項由 AI 促成的重大科學突破時,實現(xiàn)這一突破的將不再是傳統(tǒng)的頂尖科研機構(gòu)的博士團隊,而可能是世界某個角落里的一位普通人,他僅僅因為擁有強大的 AI 工具作為伙伴,便得以釋放其創(chuàng)造力,做出了諾貝爾獎級別的貢獻
未來展望:邁向“科學 API”的時代
在訪談的最后,話題轉(zhuǎn)向了對未來的展望,即我們是否會最終擁有一個“科學的 API(API for science)”。這個概念的背后,是 AI 正在逐步降低各領域?qū)I(yè)技能門檻的大趨勢。正如今天編寫軟件已經(jīng)比十年前容易得多,未來從事高水平的科學研究是否也能變得更加普及?
Pushmeet Kohli 對此表示了肯定的看法,但他同時指出了實現(xiàn)這一愿景的核心挑戰(zhàn)——“歸約問題(the specification question)”
無論是編程還是科學研究,最困難的部分之一往往不是執(zhí)行,而是清晰、準確地定義問題本身。一個程序應該做什么?一個科學實驗的目標是什么?這背后需要深刻的洞察力和嚴謹?shù)倪壿?/p>
*因此,通往“科學 API”的道路,關鍵在于構(gòu)建能夠讓用戶(無論是開發(fā)者還是科學家)與 AGI(通用人工智能)進行高效、自然溝通的交互界面。我們需要讓 AI 更好地理解人類模糊、高層次的意圖,并將其轉(zhuǎn)化為精確、可執(zhí)行的步驟。
這不僅是一個技術問題,也是一個產(chǎn)品和設計問題。如何設計接口,如何收集和利用用戶反饋,如何建立一個從人類靈感到 AGI 執(zhí)行的無縫溝通渠道,將是未來幾年 AI 社區(qū)需要重點解決的問題。這恰恰凸顯了像主持人 Logan Kilpatrick 這樣的開發(fā)者關系專家的重要性,他們是連接 AI 技術與實際使用者之間的橋梁
總而言之,從 AlphaFold 到 AI Co-scientist,再到對未來“科學 API”的構(gòu)想,DeepMind 正在系統(tǒng)性地利用 AI 解鎖科學的邊界,并致力于將這些強大的能力賦予每一個人,最終目標是構(gòu)建一個人類智慧與機器智能協(xié)同共進,共同解決人類面臨的最重大挑戰(zhàn)的新時代