發(fā)布時(shí)間:2025-09-17 來(lái)源:屨賤踴貴網(wǎng)作者:hmhhj
對(duì)于“‘開(kāi)源’這個(gè)詞大家有不同的理解,我們今天正在經(jīng)歷一個(gè)從代碼開(kāi)放、開(kāi)源,到資源開(kāi)放、開(kāi)源的革命性變化?!?月11日,阿里云創(chuàng)始人、之江實(shí)驗(yàn)室主任王堅(jiān)在2025 Inclusion·外灘大會(huì)上表示,“開(kāi)放”已是人工智能背景下一個(gè)繞不開(kāi)的話題。
王堅(jiān)強(qiáng)調(diào),“開(kāi)放資源”的理念并非因“開(kāi)源”概念的興起而產(chǎn)生。事實(shí)上,在科學(xué)探索的漫長(zhǎng)歷程中,諸多先驅(qū)早已踐行過(guò)類似實(shí)踐。但在當(dāng)時(shí),“資源”的概念并未深入人心,核心原因在于數(shù)據(jù)量有限、模型復(fù)雜度不足,算力也遠(yuǎn)未達(dá)到如今的規(guī)?!?,某些標(biāo)志性研究發(fā)表時(shí),僅使用了兩塊普通的游戲GPU,這與當(dāng)前的技術(shù)體量相去甚遠(yuǎn)。
“2017年成為了關(guān)鍵的轉(zhuǎn)折點(diǎn)。彼時(shí),研究者們提出了‘Transformer’架構(gòu)與‘Tokenization’(即如今常說(shuō)的Token技術(shù))?!蓖鯃?jiān)表示,“Tokenization作為一項(xiàng)核心技術(shù),真正實(shí)現(xiàn)了數(shù)據(jù)的資源化,堪稱里程碑式的突破?!?/p>
他進(jìn)一步分析,2012年以來(lái)的數(shù)據(jù)、模型與算力被乘上了一個(gè)更關(guān)鍵的變量——“規(guī)?!?。正是數(shù)據(jù)、模型與算力的千倍乃至萬(wàn)倍級(jí)增長(zhǎng),使得人工智能不僅在理論原理上實(shí)現(xiàn)了突破,更在實(shí)際應(yīng)用中發(fā)生了翻天覆地的變化。當(dāng)技術(shù)規(guī)模達(dá)到這一量級(jí)時(shí),“資源”的重要性便愈發(fā)凸顯。王堅(jiān)舉例說(shuō)明,“如今模型權(quán)重的開(kāi)放,本質(zhì)上是數(shù)據(jù)資源與計(jì)算資源的開(kāi)放。借助開(kāi)放的模型,個(gè)體無(wú)需再投入巨額成本重復(fù)建設(shè)已有成果。”
不過(guò),王堅(jiān)也明確指出,“資源的開(kāi)放并不意味著大規(guī)模計(jì)算失去了價(jià)值,而是個(gè)體無(wú)需再重復(fù)投入基礎(chǔ)資源——這部分成本已由先行者承擔(dān)。反之,若要研發(fā)更先進(jìn)的模型,仍需更多主體投入更大規(guī)模的資源?!?/p>
在他看來(lái),人工智能時(shí)代的“開(kāi)源”已被賦予了全新的內(nèi)涵:“到今天,僅靠開(kāi)放源代碼,已無(wú)法解決軟件時(shí)代曾攻克的問(wèn)題。而開(kāi)放資源(尤其是數(shù)據(jù)與計(jì)算資源),已成為推動(dòng)行業(yè)持續(xù)發(fā)展的不可或缺的環(huán)節(jié)。這正是人工智能時(shí)代‘開(kāi)源’的重要特點(diǎn)。”
王堅(jiān)更傾向于將其定義為“Open Resource”(開(kāi)放資源)。他認(rèn)為,盡管“Open Source”(開(kāi)放源代碼)與“Open Resource”在中文里都可譯作“開(kāi)源”,但前者已無(wú)法涵蓋當(dāng)下的核心內(nèi)涵。