發(fā)布時(shí)間:2025-09-14 來源:急不暇擇網(wǎng)作者:流卡瓦11
新智元報(bào)道
編輯:編輯部
【新智元導(dǎo)讀】在新智元十周年峰會上,昆侖萬維董事長兼CEO方漢分享了企業(yè)三年四代「天工」的演進(jìn)故事。從音樂、視頻到智能體,昆侖萬維在AIGC與AGI浪潮中不斷突破,實(shí)現(xiàn)了從互聯(lián)網(wǎng)平臺到AI原生公司的轉(zhuǎn)型。昆侖萬維憑借全球化布局與持續(xù)創(chuàng)新,正在勾勒「破界·融合·共生」的未來愿景。
通用人工智能(AGI)無疑是科技界最令人向往的理想之一,它代表著人類智慧的極致想象。
這個(gè)愿景令所有人心馳神往,遺憾的是,暫時(shí)我們還難以觸碰。
與之相比,人工智能生成內(nèi)容(AIGC)像流星般劃破夜空驚艷了所有人。
現(xiàn)在每個(gè)人都可以使用AI生成作品!
當(dāng)下,用AIGC來生成文字、圖片、音樂、影視等作品已經(jīng)成為時(shí)代浪潮!
不論是年初ChatGPT引發(fā)的吉卜力熱潮,還是谷歌nano banana發(fā)布后的香蕉革命,都證明一件事:
每個(gè)人都有一顆渴望表達(dá)的心。
有機(jī)構(gòu)統(tǒng)計(jì),AIGC市場規(guī)模在2023年達(dá)到16億美元,預(yù)計(jì)到2030年將增長至187億美元。
2024-2030年預(yù)測期間的復(fù)合年增長率高達(dá)25.39%!
據(jù)Global Market Insights報(bào)告,AIGC市場預(yù)計(jì)從2025年的297億美元增長,2024年已達(dá)270億美元,年復(fù)合增長率為11.6%
在這股浪潮中,國內(nèi)外公司紛紛布局,但有一家中國公司提前就洞察到AIGC的潮流趨勢。
在多模態(tài)領(lǐng)域不斷創(chuàng)新,推出AI智能助手、AI視頻、AI音樂與音頻、AI游戲、AI社交等的產(chǎn)品矩陣。
在「新智元十周年峰會」上,昆侖萬維董事長兼CEO方漢登臺,以「破界·融合·共生」為題,分享了昆侖萬維如何在全球AI浪潮中完成轉(zhuǎn)型,走向AGI產(chǎn)業(yè)實(shí)踐。
2025年,新智元也一同見證了昆侖萬維AI產(chǎn)品的迭代和升級爆發(fā)之路。
讓打工人沸騰的AI版Office,天工超級智能體(Skywork Super Agents),我們進(jìn)行了全面實(shí)測,從此鍵盤鼠標(biāo)徹底退休!
對標(biāo)李飛飛的World Labs,中國自研的世界模型Matrix-3D,只需單張圖就能生成可自由探索的3D世界!
還有中國首個(gè)開源的AI短劇模型SkyReels-V1,也出自昆侖萬維之手,可以4090(單臺顯卡80秒)秒生好萊塢級大片!
以上并不是全部,還有很多的產(chǎn)品和模型。
在AI技術(shù)浪潮席卷全球的今天,如何將前沿的大模型技術(shù)轉(zhuǎn)化為具備商業(yè)價(jià)值的落地應(yīng)用,是所有從業(yè)者面臨的核心課題。
昆侖萬維董事長兼CEO方漢先生在峰會上回顧公司發(fā)展歷程:
昆侖萬維在長達(dá)17年的發(fā)展過程中一直在努力求新求變,不斷尋找第二曲線,也不斷進(jìn)行高速轉(zhuǎn)型。
在此基礎(chǔ)上,他進(jìn)一步分享了對多模態(tài)AGI產(chǎn)業(yè)化的獨(dú)到見解。
他認(rèn)為,通用Agent并非萬能解,垂類行業(yè)的深度推理數(shù)據(jù)是構(gòu)筑技術(shù)壁壘的關(guān)鍵。
同時(shí),他提出了AI商業(yè)落地的核心邏輯:toB在于「增效」,而toC的根本在于「降本」。
方漢還提到一個(gè)有趣的觀點(diǎn),情感陪伴這種看似小眾的需求,反而是最接近C端用戶的真實(shí)痛點(diǎn),這方面的token消耗僅次于編程的需求。
在探索中發(fā)現(xiàn)機(jī)會
昆侖萬維是一家典型的中國互聯(lián)網(wǎng)企業(yè),17年來不斷求新求變、勇于自我轉(zhuǎn)型。
公司成立早期主要在海外實(shí)現(xiàn)增長,之后進(jìn)軍網(wǎng)絡(luò)游戲并成功上市,再到布局互聯(lián)網(wǎng)平臺。
而從2022年起,公司堅(jiān)定轉(zhuǎn)向AGI與AIGC業(yè)務(wù),逐步形成了「三駕馬車」:
AGI與AIGC業(yè)務(wù)(核心增長引擎)
信息分發(fā)與元宇宙業(yè)務(wù)(以O(shè)pera瀏覽器為代表)
投資業(yè)務(wù)
早在2022年12月,昆侖萬維就發(fā)布了國內(nèi)首個(gè)開源13B中文預(yù)訓(xùn)練大模型,走在行業(yè)前列。
事實(shí)上,自2020年起,公司便果斷押注AI,開啟了音樂大模型研發(fā)。
如今,音樂模型已成為昆侖萬維技術(shù)最強(qiáng)、成果最顯著的方向之一。
可在當(dāng)時(shí),創(chuàng)始團(tuán)隊(duì)同樣面臨十字路口:
轉(zhuǎn)型互聯(lián)網(wǎng)平臺五六年,取得了一些成績,下面該選擇什么方向?
當(dāng)時(shí)擺在面前的有四條賽道:Web 3.0、元宇宙、VR、AI。
就在GPT-3帶來震動之時(shí),他們押下了那一注。方漢回憶:
當(dāng)時(shí)我們并不知道什么是AGI,但我們相信,GPT-3給我們帶來了方向,AIGC會大行其道。
事實(shí)印證了選擇的正確。
這一步,不僅改變了昆侖萬維的未來,也讓它在AI浪潮中站上了前排。
昆侖萬維的成長軌跡,幾乎就是中國互聯(lián)網(wǎng)企業(yè)的縮影。
2008年成立,2015年登陸深交所,公司一度憑借頁游、手游出海打開全球市場,業(yè)務(wù)已覆蓋100+ 國家與地區(qū)、全球月活近 4 億;
2025年上半年?duì)I收37億元,海外占比92%。
在發(fā)展的前十余年里,昆侖萬維經(jīng)歷了三次關(guān)鍵轉(zhuǎn)折:
真正的轉(zhuǎn)折點(diǎn),發(fā)生在2022年。
全球AI浪潮驟起之時(shí),昆侖萬維果斷All in AI——從開源中文預(yù)訓(xùn)練模型起步,迅速延展到音樂、視頻、搜索與智能體。
多模態(tài)推理、生成與應(yīng)用「三線并進(jìn)」,公司由互聯(lián)網(wǎng)平臺型企業(yè),加速躍遷為AI原生公司。
如果說轉(zhuǎn)型是方向,那產(chǎn)品就是驗(yàn)證方向的最好證據(jù)。方漢直言:
昆侖萬維在AI上的投入是從2020年開始的,最初的探索就是音樂大模型。
三年時(shí)間,昆侖萬維在語言、音樂、視頻、智能體等多模態(tài)領(lǐng)域全面開花。
昆侖萬維AGI發(fā)展里程碑
多模態(tài)產(chǎn)品矩陣的持續(xù)突破
起點(diǎn)|天工大模型:從1.0 到4.0
天工系列是昆侖萬維進(jìn)入大模型賽道的起點(diǎn)。
2023年,天工1.0發(fā)布,成為中國首個(gè)對標(biāo)ChatGPT的雙千億級語言模型;
2024年,天工2.0和3.0相繼上線,采用混合專家架構(gòu)拉開差距;
2025年,4.0進(jìn)化為多模態(tài),面向C端免費(fèi)開放,實(shí)時(shí)語音對話更順暢。
年四代,主線清晰——以「用」促「研」,把大模型帶到更多人手邊。
Skywork Super Agents:8小時(shí)縮短到8分鐘
演講中,方漢花了最多時(shí)間介紹的,是Skywork Super Agents。
這款產(chǎn)品切入的,正是所有人都離不開的辦公場景。
傳統(tǒng)的office產(chǎn)品:Word、Excel、PPT用起來割裂,來回切換,既耗時(shí)又低效。
哪怕是微軟、Office、谷歌Workspace這樣的全球產(chǎn)品,也沒能真正解決這個(gè)問題。
方漢一針見血地指出:
80%的辦公時(shí)間耗在Office。一個(gè)大會PPT,動輒2萬—10萬才能做出專業(yè)水準(zhǔn)。
過去的AI辦公助手,也只是給出一些模糊的建議,真正落地還得由人進(jìn)行二次加工。
Super Agents想要解決的,就是這種低效。
它走的是一條完全不同的路——不是「問你想做什么」,而是「你最終要什么?」
這個(gè)過程是可以追溯的,為的就是確保產(chǎn)品完全不會出現(xiàn)幻覺,顯著降低「胡說」風(fēng)險(xiǎn)。
就這樣一步步對齊目標(biāo);后一口氣交付文檔、表格、PPT、播客,甚至視頻。
過去幾天的工作量,如今幾分鐘就可以交付。
Skywork Super Agents我們做過非常詳細(xì)的測評,完全就是想象中「智能體」的樣子!
首先是支持的模式非常多,幾乎涵蓋了「打工人」日常能夠想到和用到的所有場景。
而且其中有幾個(gè)場景運(yùn)行起來真的是那種「科幻般」的效果!
你懂嗎,就是鋼鐵俠和賈維斯互動那種感覺。
方漢現(xiàn)場還分享了一個(gè)券商用戶的故事:
剛畢業(yè)三年之內(nèi)的初級研究員應(yīng)該不可能做得比我們這個(gè)產(chǎn)品更好。
只有高級研究員才能做得比我們更好,應(yīng)該來說我們滿足了很多用戶的剛需。
自5月發(fā)布以來,一周內(nèi)社交媒體話題閱讀量破3.5 億;上線首日因訪問量過大限流,一度登頂GAIA榜單全球第一。
它不僅是一款爆款,更成為昆侖萬維全球化戰(zhàn)略的重要支柱。
藝術(shù)與娛樂:Mureka與SkyReels
音樂大模型是昆侖萬維最早的布局,也是最具代表性的成果。
2025年3月,Mureka 01發(fā)布全球首款音樂「推理」大模型,在指標(biāo)上對標(biāo)并超越Suno;
升級至V7.5后,在中文歌曲的音色、演奏技法以及咬字、發(fā)言、情感體現(xiàn)上都已經(jīng)是目前最好的模型。
方漢表示:
昆侖萬維的AI音樂模型MurekaV7.5,可以Suno可以相提并論。
如今,從歌詞、旋律到演唱、MV,全都能由Mureka一鍵生成,真正做到了AI「音樂生產(chǎn)一條龍」。
視頻方向的代表作品是SkyReels。
2025年2月發(fā)布的V1,是國內(nèi)首個(gè)面向短劇創(chuàng)作的生成模型,同年4月迭代到V2。
一張照片 + 一段語音 = 會說話的短劇鏡頭;還能改臺詞仍口型自然。
8月A3進(jìn)一步升級!
方漢笑稱說:
昆侖萬維不光能驅(qū)動人,還能驅(qū)動物。
這句話讓現(xiàn)場觀眾會心一笑。
8月升級版SkyReels-A3更進(jìn)一步,數(shù)字人表演效果逼真,成為AI視頻生成的一個(gè)標(biāo)桿。
持續(xù)拓展的多模態(tài)拼圖:Matrix與其他新品
另一大亮點(diǎn),是Matrix系列世界模型。
首先是Matrix-Game2.0:支持實(shí)時(shí)交互視頻的生成,表情動作符合物理邏輯,可用于虛擬游戲訓(xùn)練。
這一產(chǎn)品打通了從游戲自動生成訓(xùn)練數(shù)據(jù)的管道,從理論上來說可以把所有類型的游戲都變成虛擬世界。
Matrix-3D:能把一張圖片和一句話擴(kuò)展為可探索的3D世界。
Matrix給出另一條路:讓AI直接生成可探索的虛擬世界。
除了重點(diǎn)產(chǎn)品,昆侖萬維還在不斷擴(kuò)展多模態(tài)版圖:
Skywork UniPic 2.0:整合生成、編輯與理解,首次引入漸進(jìn)式雙任務(wù)強(qiáng)化學(xué)習(xí),在復(fù)雜指令下表現(xiàn)更穩(wěn)定;
Skywork Deep Research Agent:打破傳統(tǒng)搜索邊界,不只檢索文本,還能分析小紅書、推特、Instagram上的多模態(tài)內(nèi)容。
它們補(bǔ)齊了昆侖萬維的多模態(tài)拼圖,展現(xiàn)了構(gòu)建完整生態(tài)的野心。
大模型落地應(yīng)用的思考
方漢也分享了他對大模型落地的一些思考。
站在全球市場看趨勢,才能更清晰地理解產(chǎn)業(yè)邏輯。
昆侖萬維如今94%的收入來自海外,AI產(chǎn)品的落地同樣以海外為主。
從Token的消耗看人類情感需求
方漢提到一個(gè)有趣的現(xiàn)象。
美國的OpenRouter作為大模型聚合API,對外統(tǒng)計(jì)過token的消耗情況。
結(jié)果顯示,87%的token被用于代碼相關(guān)任務(wù),這個(gè)也印證了目前以Cursor為主的編程智能體是主流方向。
但排名第二的并不是大家以為的個(gè)人助理或市場營銷,而是——情感聊天與角色扮演。
這背后說明了兩個(gè)事實(shí):
一方面,編程依舊是大模型最強(qiáng)的應(yīng)用場景;另一方面,情感陪伴這種看似小眾的需求,反而是最接近C端用戶的真實(shí)痛點(diǎn)。
通用Agent解決所有問題是偽命題
方漢在介紹Agent時(shí),提出一個(gè)有意思的觀點(diǎn):
通用Agent也許不能解決所有問題。
像過去的Windows+Office、安卓+GMS以及其它的所有行業(yè)軟件都各有巨頭。
從歷史上來看,沒有任何一家公司能夠壟斷所有方向。
一個(gè)通用Agent能解決所有問題嗎?方漢認(rèn)為非常有難度。
原因可以從目前token的消耗比例和大模型發(fā)布時(shí)喜歡「打榜」窺見一二。
現(xiàn)在不管是GPT-5,還是Grok 4,還是最新發(fā)的Claude 4.1,發(fā)布時(shí)的評測榜單以數(shù)學(xué)和編程榜單最多。
現(xiàn)在token消耗最多的是編程,那為什么大家都去打數(shù)學(xué)榜單?
難道所有人用大模型都是為了解數(shù)學(xué)題嗎?
根本原因是,目前人類能夠獲得最好的數(shù)據(jù)其實(shí)還是代碼和數(shù)學(xué)。
尤其在GPT-4o把CoT引入大模型之后,所有大模型要想能力提高,都需要非常好的、非常全的推理數(shù)據(jù),也就是說有解題過程的數(shù)據(jù)。
而很令人幸運(yùn)的是,由于GitHub大規(guī)模版本控制工具中心的出現(xiàn),人類的代碼有史以來過程數(shù)據(jù)最詳盡,每次做代碼提交都要寫原因,都要寫注釋,代碼質(zhì)量是最高的。
而數(shù)學(xué)由于中國、印度的K12教育是全世界發(fā)展最好的,人類積累了將近2億條K12教育的數(shù)據(jù),尤其數(shù)學(xué)題的數(shù)據(jù)。
所以說,數(shù)學(xué)題也能解得很好。
反觀其它領(lǐng)域的數(shù)據(jù)其實(shí)沒有中間過程。
比如法院判決書會寫理由,卻不會告訴你法官的完整思考鏈條。
缺乏推理過程的數(shù)據(jù),就很難支撐模型能力的躍升。
因此,在他看來,通用Agent不是最優(yōu)解。
未來真正的突破口,在于各個(gè)垂直行業(yè)自己去積累和構(gòu)建推理數(shù)據(jù),才能像編程和數(shù)學(xué)一樣,出現(xiàn)質(zhì)變。
未來愿景:破界·融合·共生
在方漢看來,這些產(chǎn)業(yè)觀察并不是和產(chǎn)品割裂的,而是共同勾勒出未來大模型發(fā)展的方向。
科研突破、產(chǎn)品迭代、產(chǎn)業(yè)落地,最終都要匯聚到一個(gè)更宏大的愿景:破界、融合、共生,就像昆侖萬維的產(chǎn)品矩陣一樣。
昆侖萬維多模態(tài)AGI產(chǎn)業(yè)生態(tài)
昆侖萬維在堅(jiān)持「All in AGI & AIGC」 的同時(shí),依托海外收入占比92%的先發(fā)優(yōu)勢,走出「先全球化、再本土化」的產(chǎn)業(yè)落地路徑。
在演講的最后,方漢用一句話點(diǎn)明了大模型落地的邏輯:
ToB是增效,ToC是降本,這是兩個(gè)最基本的邏輯。
無論是Skywork Super Agents提升辦公效率,還是Mureka、SkyReels讓音樂與視頻創(chuàng)作的門檻大幅降低,背后都對應(yīng)著同一個(gè)趨勢——
智能紅利,正在以更低成本、更高效率,觸達(dá)更多人。
站在十周年的新起點(diǎn),新智元與昆侖萬維一起回望過去十年的AI浪潮,更要展望未來的「破界·融合·共生」。
方漢強(qiáng)調(diào)的是:
AGI是一個(gè)理想;
但AIGC讓每個(gè)人更好地表達(dá)自我,這是可以落地的。
這也是昆侖萬維的愿景:實(shí)現(xiàn)通用人工智能,讓每個(gè)人更好地塑造與表達(dá)自我。
今天,中國企業(yè)在AIGC領(lǐng)域迎來了特殊機(jī)遇。
一方面,受限于融資環(huán)境,許多企業(yè)被迫更專注于商業(yè)落地與盈利模式探索;另一方面,這種壓力反而加速了中國廠商在AIGC賽道上的實(shí)踐和創(chuàng)新。
正如「窮人的孩子早當(dāng)家」,昆侖萬維堅(jiān)信中國企業(yè)必將在AIGC這一最接近C端用戶、最具增長潛力的領(lǐng)域,實(shí)現(xiàn)突破和領(lǐng)先。
在破界、融合、共生的過程中,讓我們共同見證并推動AGI產(chǎn)業(yè)的繁榮發(fā)展。