點(diǎn)擊右上角微信好友
朋友圈
請使用瀏覽器分享功能進(jìn)行分享
新智元報(bào)道
編輯:KingHZ
【新智元導(dǎo)讀】:騰訊剛辟謠「姚順雨入職」,但行業(yè)并未松口氣:頂尖智能體人才去哪兒,或?qū)Q定AI下半場的走向。27歲、清華姚班、普林斯頓博士、OpenAI智能體核心項(xiàng)目,引用過萬……他提出「評測將比訓(xùn)練更重要」,把研究拉向產(chǎn)品與可度量價(jià)值。
姚順雨昨天被傳加入騰訊,今早「第37手」和騰訊旗下的「鵝廠黑板報(bào)」正式辟謠!
為什么姚順雨能引起行業(yè)如此大的關(guān)注?為什么會傳出來一億人民幣的天價(jià)薪酬傳聞?
自然少不了Meta在硅谷的天價(jià)挖角:
如此看來,一億人民幣絕對不算高;同理,如果他入職國內(nèi)公司,誰給得起1億美元的薪酬包?
他絕對值得Meta給出1億美元的報(bào)價(jià)——他是Deep Research的核心貢獻(xiàn)者。
要知道,作為OpenAI Deep Research的核心貢獻(xiàn)者Hyung Won Chuang已經(jīng)加入了Meta的超級智能實(shí)驗(yàn)室。
自2024年8月加入OpenAI起,姚順雨很快躋身核心團(tuán)隊(duì),深度參與了2025年推出的首批智能體產(chǎn)品:Operator與Deep Research,以及Computer-using Agent的研發(fā)等。
這是OpenAI邁向AGI Levele 3的關(guān)鍵一步,代表著OpenAI將大模型能力落地為可自主執(zhí)行復(fù)雜多步任務(wù)的實(shí)用型產(chǎn)品,開啟從「會聊天」到「會辦事」的關(guān)鍵躍遷。
這次辟謠只能說明姚順雨沒去騰訊,他大概率已開啟新的職業(yè)階段。
目前,姚順雨沒有更新個人職位
姚順雨年僅27歲,從OpenAI離職這一舉動就足以預(yù)示著全球AI人才生態(tài)正在發(fā)生更深層的遷徙與重組。
AI下半場,轉(zhuǎn)做「產(chǎn)品經(jīng)理」?
現(xiàn)有數(shù)據(jù)表明,OpenAI在職的華人人才,本科來源前三為清華、北大、上海交大,各校進(jìn)入人數(shù)均在兩位數(shù)。
而姚順雨本科畢業(yè)于清華大學(xué)。
和其他姚班校友一樣,他在學(xué)習(xí)上也是一路開掛的「學(xué)霸之路」。
初中,姚順雨就讀于合肥45中,初中畢業(yè)后升入合肥市第一中學(xué)。
2014年,他斬獲全國信息學(xué)奧林匹克競賽(NOI)銀牌;次年高考以安徽省理科第三的成績,進(jìn)入清華大學(xué)姚班,主修計(jì)算機(jī)科學(xué),還擔(dān)任過姚班的學(xué)生會主席。
2019年本科畢業(yè)后,他直接進(jìn)入普林斯頓大學(xué)攻讀博士學(xué)位。
他還將博士答辯全程發(fā)布到B站。
2024年畢業(yè)后,他加入了OpenAI,直到最近的消息傳來。
在學(xué)術(shù)上,他主要研究智能體,在OpenAI研究用于數(shù)字自動化(WebShop、SWE-bench、tau-bench)的語言代理(ReAct、Reflexion、思維樹、SWE-agent、CoALA)。
谷歌學(xué)術(shù)顯示,ReAct和思維樹引用次數(shù)已過4千次,個人總引用次數(shù)已過1萬5千次。
早在讀博時,他已開始專注研究智能體。
在博士學(xué)位論文中,他總結(jié)了語言智能體的核心價(jià)值:從下一個token預(yù)測到數(shù)字自動化,針對語言智能體提出了一系列新的基準(zhǔn)測試、新的方法論、新的原則性框架。
傳送門:https://ysymyth.github.io/papers/Dissertation-finalized.pdf
在博士論文中,他還回憶了與博士生導(dǎo)師的和諧關(guān)系。
在2019年,他雖然選擇了普林斯頓研究生院但依然不確定該做什么或去往何處。
這時,他聯(lián)系了Karthik R. Narasimhan并說:
這個語言模型的東西(GPT-2)看起來很有前途,應(yīng)該能直接解決文本游戲吧?
Karthik爽快地答應(yīng)了。
之后,姚順雨開啟了5年美妙的研究和生活。而Karthik也被他稱為「擁有的最好導(dǎo)師」,甚至Karthik是姚順雨婚禮上的伴郎。
另外,值得一提的是,早在2017-2028年,Karthik花了一年在OpenAI做訪問研究員,還是GPT開山論文的作者!
今年4月,姚順雨還提出了對AI發(fā)展的獨(dú)特觀察:
強(qiáng)化學(xué)習(xí)終于奏效了,此后評估將超過訓(xùn)練。
從現(xiàn)在開始,AI進(jìn)入了下半場:將從解題轉(zhuǎn)向命題。
他得出了驚人的結(jié)論:評測會比訓(xùn)練更重要。
長期依賴,評測(Evaluation)雖然和訓(xùn)練(Optimization)一起作為學(xué)習(xí)算法的三大要素,但從來沒有像姚順雨如此重視評測!
在姚順雨看來,現(xiàn)在的問題不是「能不能訓(xùn)練出模型」,而在于「到底要AI做什么」。
他還指出,要在下半場勝出,我們需要及時換擋:
心智與技能更加靠近產(chǎn)品經(jīng)理——定義問題、設(shè)定指標(biāo)、組織迭代,讓能力在真實(shí)世界里轉(zhuǎn)化為可度量的價(jià)值。
而OpenAI最新的論文也指出評測才是模型幻覺的根本原因,只要改變測評方法就能解鎖LLM更多的能力。
或許,姚順雨這次要真正踐行自己的理念:更加靠近產(chǎn)品經(jīng)理,用測評定義真正的AI。
參考資料:
https://www.linkedin.com/in/shunyu-yao-099a41115/
https://ysymyth.github.io/papers/from_language_models_to_language_agents.pdf
https://x.com/ShunyuYao12/with_replies%20
https://www.ctol.digital/news/tencent-recruits-openai-scientist-13-8-million-chinese-tech-talent/