“我們瞄準的是 AI 推理市場——那里才是真正的、萬億美元級別的機會。訓練規(guī)模很大,但推理將被用于所有場景。人們正在耗盡可用的推理算力容量。”甲骨文創(chuàng)始人Larry Ellison在財報會議上的這句話,以及剩余履約義務(RPO)飆升至4550億美元的佐證,幫他在一夜之間登頂全球首富。
早在2024年AI應用爆發(fā)之時,Larry Ellison就已多次做過“推理會被用于一切”預判。AI訓練需求通常是周期性、高強度的資源消耗,通常在超大 GPU 群上、一次性或周期性發(fā)生。只有AI推理需求才是將模型“產(chǎn)品化、服務化”后的持續(xù)調(diào)用——每天、每秒、在千萬級用戶或千百個自動化系統(tǒng)中被不斷觸發(fā),這種常態(tài)化、大量化的資源占用將帶來AI云服務的持續(xù)增長。
智通財經(jīng)APP獲悉,近期,七牛智能(02567)在財報中公布AI相關(guān)收入達1.84億元,貢獻了總收入的22.2%。相關(guān)業(yè)務負責人則表示,公司AI相關(guān)收入主要集中于AI推理服務和算力資源上,在8月初AI相關(guān)用戶突破萬人的基礎(chǔ)上,近期得益于可調(diào)用的大模型數(shù)量超過50個,涵蓋了LLM推理模型、工具調(diào)用、AI編程、推理接口支持Claude CodeAI等功能,七牛智能AI相關(guān)用戶已達15000人。
要承接AI推理需求并不容易,需要在生產(chǎn)環(huán)境中不斷降低模型推理請求的端到端延遲、提高吞吐率,快速響應用戶或業(yè)務系統(tǒng)的請求,在高請求壓力(QPS——每秒請求數(shù))和TPM吞吐率的要求下,推理算力需求遠超訓練。此外,由于推理模型要給出有用、可操作的答案,需要高質(zhì)量、可連通的企業(yè)數(shù)據(jù),企業(yè)級、垂直行業(yè)級的海量結(jié)構(gòu)化數(shù)據(jù)資產(chǎn)則是進入“推理時代”的關(guān)鍵資源。
得益于七牛智能過去14年以來在音視頻云服務上的積累,七牛智能低延遲、高吞吐的全球?qū)崟r節(jié)點、海量存儲能力,以及將私有的音視頻異構(gòu)數(shù)據(jù)通過向量化、Private LLM 接入等技術(shù),安全地“向推理模型暴露”,這些能力都將反哺七牛智能的AI云服務第二增長曲線,在推理算力的價值鏈中占據(jù)上游數(shù)據(jù)提供與中游算力基礎(chǔ)設施的雙重位置,從而拿到長期可觀的推理算力營收與服務費,實現(xiàn)服務量價的雙重增長。