智通財(cái)經(jīng)APP獲悉,國(guó)泰海通發(fā)布研報(bào)稱,英偉達(dá)下一代Rubin CPX在硬件層面上分拆了AI推理的計(jì)算負(fù)載,內(nèi)存升級(jí)提供更高速傳輸。隨著運(yùn)算速度的提升,DRAM及NAND Flash在各類AI延伸應(yīng)用,如智能手機(jī)、服務(wù)器、筆電的單機(jī)平均搭載容量均有成長(zhǎng),又以服務(wù)器領(lǐng)域成長(zhǎng)幅度最高,2024年Server DRAM單機(jī)平均容量年增17.3%。伴隨AI服務(wù)器需求持續(xù)增加,AI高端芯片如英偉達(dá)下一代Rubin及云端服務(wù)業(yè)者(CSP)自研ASIC陸續(xù)推出或開(kāi)始量產(chǎn),有助于高速運(yùn)算的DRAM產(chǎn)品量?jī)r(jià)齊升。建議關(guān)注存儲(chǔ)模組。
國(guó)泰海通主要觀點(diǎn)如下:
英偉達(dá)下一代Rubin CPX在硬件層面上分拆了AI推理的計(jì)算負(fù)載,內(nèi)存升級(jí)提供更高速傳輸。
下一代英偉達(dá)旗艦AI服務(wù)器NVIDIA Vera Rubin NVL144 CPX集成了36個(gè)Vera CPU、144塊Rubin GPU和144塊Rubin CPX GPU。同時(shí),單個(gè)機(jī)架提供100 TB的高速內(nèi)存和1.7 PB/s的內(nèi)存帶寬。搭載Rubin CPX的Rubin機(jī)架在處理大上下文窗口時(shí)的性能,比當(dāng)前旗艦機(jī)架GB300 NVL72高最多6.5倍。
英偉達(dá)新品在硬件層面上分拆了AI推理的計(jì)算負(fù)載:上下文階段屬于計(jì)算受限,需要高吞吐量的處理能力來(lái)攝取并分析大量輸入數(shù)據(jù),從而生成首個(gè)輸出token;相反,生成階段則屬于內(nèi)存帶寬受限,依賴高速的內(nèi)存?zhèn)鬏敽透邘捇ヂ?lián),以維持逐個(gè)token的輸出性能。Rubin CPX專門針對(duì)“數(shù)百萬(wàn)tokens”級(jí)別長(zhǎng)上下文性能進(jìn)行優(yōu)化,具備30peta FLOPs的NVFP4算力、128 GB GDDR7內(nèi)存。
開(kāi)普云收購(gòu)深圳金泰克存儲(chǔ)條線業(yè)務(wù),發(fā)力企業(yè)級(jí)DDR。
開(kāi)普云發(fā)布公告,擬通過(guò)發(fā)行股份的方式,購(gòu)買深圳金泰克持有的南寧泰克30%股權(quán),同時(shí)深圳金泰克將其存儲(chǔ)產(chǎn)品業(yè)務(wù)的經(jīng)營(yíng)性資產(chǎn)轉(zhuǎn)移至南寧泰克。同時(shí)根據(jù)《股權(quán)收購(gòu)框架協(xié)議》約定,公司擬收購(gòu)南寧泰克70%股權(quán),交易對(duì)方深圳金泰克將其存儲(chǔ)產(chǎn)品業(yè)務(wù)的經(jīng)營(yíng)性資產(chǎn)轉(zhuǎn)移至南寧泰克。
供應(yīng)商陸續(xù)推出AI高端芯片,內(nèi)存升級(jí)助力DRAM量?jī)r(jià)齊升。
隨著運(yùn)算速度的提升,DRAM及NAND Flash在各類AI延伸應(yīng)用,如智能手機(jī)、服務(wù)器、筆電的單機(jī)平均搭載容量均有成長(zhǎng),又以服務(wù)器領(lǐng)域成長(zhǎng)幅度最高,2024年Server DRAM單機(jī)平均容量年增17.3%。伴隨AI服務(wù)器需求持續(xù)增加,AI高端芯片如英偉達(dá)下一代Rubin及云端服務(wù)業(yè)者(CSP)自研ASIC陸續(xù)推出或開(kāi)始量產(chǎn),有助于高速運(yùn)算的DRAM產(chǎn)品量?jī)r(jià)齊升。
風(fēng)險(xiǎn)提示:國(guó)產(chǎn)替代進(jìn)程不及預(yù)期;技術(shù)迭代不及預(yù)期。
關(guān)于我們|版權(quán)聲明| 違法和不良信息舉報(bào)電話:010-84151598 | 網(wǎng)絡(luò)敲詐和有償刪帖舉報(bào)電話:010-84151598
Copyright ? 2008-2024 by {當(dāng)前域名}. all rights reserved