“我們瞄準(zhǔn)的是 AI 推理市場(chǎng)——那里才是真正的、萬億美元級(jí)別的機(jī)會(huì)。訓(xùn)練規(guī)模很大,但推理將被用于所有場(chǎng)景。人們正在耗盡可用的推理算力容量?!奔坠俏膭?chuàng)始人Larry Ellison在財(cái)報(bào)會(huì)議上的這句話,以及剩余履約義務(wù)(RPO)飆升至4550億美元的佐證,幫他在一夜之間登頂全球首富。
早在2024年AI應(yīng)用爆發(fā)之時(shí),Larry Ellison就已多次做過“推理會(huì)被用于一切”預(yù)判。AI訓(xùn)練需求通常是周期性、高強(qiáng)度的資源消耗,通常在超大 GPU 群上、一次性或周期性發(fā)生。只有AI推理需求才是將模型“產(chǎn)品化、服務(wù)化”后的持續(xù)調(diào)用——每天、每秒、在千萬級(jí)用戶或千百個(gè)自動(dòng)化系統(tǒng)中被不斷觸發(fā),這種常態(tài)化、大量化的資源占用將帶來AI云服務(wù)的持續(xù)增長(zhǎng)。
智通財(cái)經(jīng)APP獲悉,近期,七牛智能(02567)在財(cái)報(bào)中公布AI相關(guān)收入達(dá)1.84億元,貢獻(xiàn)了總收入的22.2%。相關(guān)業(yè)務(wù)負(fù)責(zé)人則表示,公司AI相關(guān)收入主要集中于AI推理服務(wù)和算力資源上,在8月初AI相關(guān)用戶突破萬人的基礎(chǔ)上,近期得益于可調(diào)用的大模型數(shù)量超過50個(gè),涵蓋了LLM推理模型、工具調(diào)用、AI編程、推理接口支持Claude CodeAI等功能,七牛智能AI相關(guān)用戶已達(dá)15000人。
要承接AI推理需求并不容易,需要在生產(chǎn)環(huán)境中不斷降低模型推理請(qǐng)求的端到端延遲、提高吞吐率,快速響應(yīng)用戶或業(yè)務(wù)系統(tǒng)的請(qǐng)求,在高請(qǐng)求壓力(QPS——每秒請(qǐng)求數(shù))和TPM吞吐率的要求下,推理算力需求遠(yuǎn)超訓(xùn)練。此外,由于推理模型要給出有用、可操作的答案,需要高質(zhì)量、可連通的企業(yè)數(shù)據(jù),企業(yè)級(jí)、垂直行業(yè)級(jí)的海量結(jié)構(gòu)化數(shù)據(jù)資產(chǎn)則是進(jìn)入“推理時(shí)代”的關(guān)鍵資源。
得益于七牛智能過去14年以來在音視頻云服務(wù)上的積累,七牛智能低延遲、高吞吐的全球?qū)崟r(shí)節(jié)點(diǎn)、海量存儲(chǔ)能力,以及將私有的音視頻異構(gòu)數(shù)據(jù)通過向量化、Private LLM 接入等技術(shù),安全地“向推理模型暴露”,這些能力都將反哺七牛智能的AI云服務(wù)第二增長(zhǎng)曲線,在推理算力的價(jià)值鏈中占據(jù)上游數(shù)據(jù)提供與中游算力基礎(chǔ)設(shè)施的雙重位置,從而拿到長(zhǎng)期可觀的推理算力營(yíng)收與服務(wù)費(fèi),實(shí)現(xiàn)服務(wù)量?jī)r(jià)的雙重增長(zhǎng)。
關(guān)于我們|版權(quán)聲明| 違法和不良信息舉報(bào)電話:010-84151598 | 網(wǎng)絡(luò)敲詐和有償刪帖舉報(bào)電話:010-84151598
Copyright ? 2008-2024 by {當(dāng)前域名}. all rights reserved