這項(xiàng)由悉尼科技大學(xué)的馬守星、湖南大學(xué)的曾雅文、澳門城市大學(xué)的吳世清以及香港教育大學(xué)的許冠東共同完成的研究,發(fā)表在2025年10月的第33屆ACM國際多媒體會(huì)議上。完整論文可通過DOI:https://doi.org/10.1145/3746027.3755779獲取,代碼也已公開發(fā)布供研究者使用。
當(dāng)你在購物網(wǎng)站瀏覽商品時(shí),系統(tǒng)總是能神奇地猜出你可能喜歡什么。這些推薦系統(tǒng)就像是一位貼心的店員,不僅知道商品的外觀,還能讀懂商品描述,然后根據(jù)你的歷史購買記錄為你推薦心儀的物品。然而,現(xiàn)有的推薦系統(tǒng)面臨著一個(gè)關(guān)鍵挑戰(zhàn):如何在理解用戶共同喜好的同時(shí),又不忽略每個(gè)人的獨(dú)特品味?
就如同兩個(gè)人都喜歡某件襯衫,一個(gè)人可能被其時(shí)尚的扭結(jié)設(shè)計(jì)吸引,另一個(gè)人則看重商品描述中提到的口袋功能。傳統(tǒng)的推薦系統(tǒng)往往只關(guān)注兩人的共同點(diǎn),卻忽略了這些重要的個(gè)性化差異。研究團(tuán)隊(duì)發(fā)現(xiàn),現(xiàn)有方法存在兩個(gè)主要問題:簡單的多模態(tài)特征對(duì)比會(huì)產(chǎn)生噪聲并丟失有價(jià)值的獨(dú)特信息;對(duì)用戶興趣和商品共現(xiàn)關(guān)系的挖掘不夠充分。
為了解決這些問題,研究團(tuán)隊(duì)開發(fā)了一個(gè)名為REARM的新框架,這個(gè)名稱來源于"REfining multi-modAl contRastive learning and hoMography relations"。該框架的核心理念是教會(huì)AI系統(tǒng)既要識(shí)別用戶的共同喜好,又要保留每個(gè)人的獨(dú)特品味,同時(shí)更深入地挖掘用戶興趣和商品關(guān)聯(lián)模式。
一、破解多模態(tài)推薦的雙重挑戰(zhàn)
想象你正在為朋友挑選生日禮物,你需要同時(shí)考慮商品的外觀和功能描述。傳統(tǒng)的推薦系統(tǒng)就像是一個(gè)只看表面的購物助手,它會(huì)注意到你和朋友都喜歡某種風(fēng)格的商品,但卻忽略了你們各自的獨(dú)特偏好。
研究團(tuán)隊(duì)深入分析了現(xiàn)有多模態(tài)推薦系統(tǒng)的局限性。第一個(gè)問題類似于"一刀切"的服務(wù)方式。當(dāng)系統(tǒng)發(fā)現(xiàn)兩個(gè)用戶都對(duì)某件商品感興趣時(shí),它會(huì)簡單地認(rèn)為兩人的喜好完全一致,忽略了個(gè)體差異。比如說,兩個(gè)人都購買了同一件女孩襯衫,系統(tǒng)會(huì)重點(diǎn)關(guān)注"女孩襯衫"這個(gè)共同標(biāo)簽,但可能忽略了其中一人真正看重的是圖像中展現(xiàn)的時(shí)尚扭結(jié)設(shè)計(jì),另一人更關(guān)注的是文字描述中的"大童款"標(biāo)識(shí)。
第二個(gè)問題則像是缺乏社交洞察的推薦員?,F(xiàn)有系統(tǒng)雖然會(huì)分析用戶的共同購買行為和商品的語義相似性,但卻忽略了更深層的關(guān)聯(lián)模式。它們沒有充分探索用戶興趣圖譜和商品共現(xiàn)關(guān)系之間的相互作用,就如同一個(gè)推薦員只知道客戶買了什么,卻不理解客戶為什么買,也不知道不同商品之間的潛在聯(lián)系。
為了應(yīng)對(duì)這些挑戰(zhàn),研究團(tuán)隊(duì)提出了一個(gè)創(chuàng)新的解決方案。他們認(rèn)為,理想的推薦系統(tǒng)應(yīng)該像一位經(jīng)驗(yàn)豐富的個(gè)人購物顧問,既能識(shí)別客戶群體的共同趨勢,又能敏銳捕捉每個(gè)人的獨(dú)特需求。這位顧問不僅要看懂商品的外觀和描述,還要深入理解客戶的興趣網(wǎng)絡(luò)和商品之間的復(fù)雜關(guān)聯(lián)。
研究團(tuán)隊(duì)的理論基礎(chǔ)建立在對(duì)多模態(tài)對(duì)比學(xué)習(xí)的深刻理解上。他們發(fā)現(xiàn),傳統(tǒng)方法假設(shè)不同模態(tài)之間存在高度冗余,即大部分有用信息都是共享的,獨(dú)特信息很少。但在實(shí)際的推薦場景中,這個(gè)假設(shè)并不總是成立。每種模態(tài)都可能包含獨(dú)特且有價(jià)值的信息,同時(shí)共享信息中也可能存在與推薦任務(wù)無關(guān)的噪聲。
二、構(gòu)建更智能的特征提取機(jī)制
研究團(tuán)隊(duì)開發(fā)的REARM框架采用了一種類似精密篩選器的工作方式。這個(gè)篩選器不僅能夠過濾掉無關(guān)信息,還能保留對(duì)推薦有價(jià)值的獨(dú)特特征。
整個(gè)框架的工作流程可以比作一個(gè)三步驟的精煉過程。首先是同質(zhì)關(guān)系學(xué)習(xí),就像是構(gòu)建一張?jiān)敿?xì)的關(guān)聯(lián)地圖,展示用戶之間和商品之間的各種聯(lián)系。接著是異質(zhì)關(guān)系學(xué)習(xí),類似于分析用戶與商品之間的互動(dòng)模式。最后是精煉對(duì)比學(xué)習(xí),就像是用高級(jí)過濾器處理信息,保留有價(jià)值的內(nèi)容,去除噪聲。
在同質(zhì)關(guān)系學(xué)習(xí)部分,研究團(tuán)隊(duì)創(chuàng)新性地構(gòu)建了用戶興趣圖和商品共現(xiàn)圖。用戶興趣圖就像是繪制每個(gè)用戶的興趣地圖,不僅記錄用戶購買了什么,還分析用戶的興趣偏好模式。商品共現(xiàn)圖則像是商品之間的關(guān)聯(lián)網(wǎng)絡(luò),記錄哪些商品經(jīng)常被同一用戶購買,反映商品之間的潛在聯(lián)系。
這種方法的巧妙之處在于,它不是簡單地將所有用戶或商品一視同仁,而是根據(jù)不同的關(guān)系類型構(gòu)建不同的連接。比如,兩個(gè)用戶可能因?yàn)橛邢嗨频馁徺I歷史而建立共現(xiàn)關(guān)系,同時(shí)又因?yàn)榕d趣偏好的相似性建立另一種語義關(guān)系。系統(tǒng)會(huì)智能地平衡這兩種關(guān)系,就像一位經(jīng)驗(yàn)豐富的社交網(wǎng)絡(luò)分析師,既關(guān)注表面行為的相似性,又深入挖掘內(nèi)在興趣的一致性。
在處理商品信息時(shí),系統(tǒng)首先會(huì)將不同模態(tài)的原始特征轉(zhuǎn)換為統(tǒng)一的表示空間,就像是將不同語言的描述翻譯成同一種語言。然后通過圖神經(jīng)網(wǎng)絡(luò)進(jìn)行信息傳播,讓每個(gè)節(jié)點(diǎn)不僅包含自身信息,還融合了鄰居節(jié)點(diǎn)的相關(guān)信息。這個(gè)過程就像是讓每個(gè)商品不僅了解自己,還了解與自己相關(guān)的其他商品的特點(diǎn)。
為了進(jìn)一步提升特征質(zhì)量,研究團(tuán)隊(duì)引入了注意力機(jī)制。自注意力模塊就像是一個(gè)內(nèi)部調(diào)節(jié)器,幫助系統(tǒng)調(diào)整各個(gè)維度特征的重要性權(quán)重。交叉注意力模塊則像是一個(gè)跨模態(tài)的溝通橋梁,讓圖像特征和文本特征能夠相互影響和補(bǔ)充。這種設(shè)計(jì)確保了系統(tǒng)不會(huì)簡單地將不同模態(tài)的信息機(jī)械式地組合,而是讓它們進(jìn)行更深層的交流和整合。
三、精煉對(duì)比學(xué)習(xí)的創(chuàng)新突破
研究團(tuán)隊(duì)在對(duì)比學(xué)習(xí)方面的創(chuàng)新可以比作開發(fā)一套精密的質(zhì)量控制系統(tǒng)。傳統(tǒng)的對(duì)比學(xué)習(xí)就像是用粗糙的篩子過濾信息,容易讓有價(jià)值的獨(dú)特信息流失,同時(shí)讓無關(guān)噪聲混入結(jié)果中。而REARM的精煉對(duì)比學(xué)習(xí)則像是配備了兩套精密過濾器的高級(jí)處理系統(tǒng)。
第一套過濾器是元網(wǎng)絡(luò)系統(tǒng),專門處理模態(tài)共享特征中的噪聲問題。這個(gè)元網(wǎng)絡(luò)就像是一位經(jīng)驗(yàn)豐富的質(zhì)檢員,能夠從共享特征中識(shí)別出哪些信息真正與推薦任務(wù)相關(guān),哪些只是表面的巧合。比如,當(dāng)系統(tǒng)發(fā)現(xiàn)某件商品的圖像和文字都提到"女孩"時(shí),元網(wǎng)絡(luò)會(huì)進(jìn)一步分析這個(gè)共同特征是否真的對(duì)推薦有幫助,還是只是一個(gè)可能誤導(dǎo)系統(tǒng)的標(biāo)簽。
元網(wǎng)絡(luò)的工作原理類似于一個(gè)智能的知識(shí)提取器。它不是簡單地接受所有共享信息,而是學(xué)習(xí)如何從這些信息中提取真正有價(jià)值的知識(shí)。系統(tǒng)會(huì)根據(jù)具體的推薦上下文,動(dòng)態(tài)生成定制化的變換矩陣,就像是為每種情況量身定制一套處理規(guī)則。這種自適應(yīng)的處理方式確保了系統(tǒng)能夠根據(jù)不同的商品和用戶特點(diǎn),靈活調(diào)整信息處理策略。
第二套過濾器是正交約束機(jī)制,專門負(fù)責(zé)保護(hù)模態(tài)獨(dú)特特征。這個(gè)機(jī)制就像是一個(gè)獨(dú)特性保護(hù)器,確保每種模態(tài)的獨(dú)特價(jià)值信息不會(huì)在融合過程中丟失。正交約束的數(shù)學(xué)原理是通過限制不同模態(tài)特征之間的重疊度,鼓勵(lì)每種模態(tài)保持自己的獨(dú)特貢獻(xiàn)。
這種設(shè)計(jì)的智慧在于它認(rèn)識(shí)到,真正優(yōu)秀的推薦系統(tǒng)不應(yīng)該試圖將所有信息都標(biāo)準(zhǔn)化為相同的形式,而應(yīng)該讓不同類型的信息在保持各自特色的同時(shí)協(xié)同工作。就像一個(gè)優(yōu)秀的團(tuán)隊(duì),每個(gè)成員都有自己的專長,團(tuán)隊(duì)的力量來自于這些專長的互補(bǔ),而不是所有人都變得完全相同。
在實(shí)際應(yīng)用中,這兩套過濾器協(xié)同工作。當(dāng)系統(tǒng)處理一個(gè)用戶對(duì)商品的偏好時(shí),元網(wǎng)絡(luò)會(huì)從共享特征中提取可靠的共同偏好信息,過濾掉可能的噪聲干擾。同時(shí),正交約束確保每種模態(tài)的獨(dú)特貢獻(xiàn)得到保留,讓系統(tǒng)能夠捕捉到用戶可能被商品的某個(gè)特定方面吸引的細(xì)微差別。
四、實(shí)驗(yàn)驗(yàn)證與性能表現(xiàn)
研究團(tuán)隊(duì)在三個(gè)真實(shí)的電商數(shù)據(jù)集上進(jìn)行了全面的性能測試,這些數(shù)據(jù)集分別來自嬰兒用品、體育用品和服裝類別。這種選擇很有代表性,因?yàn)檫@三個(gè)類別的商品都具有豐富的視覺和文字信息,同時(shí)用戶的購買決策往往受到多種因素的影響。
實(shí)驗(yàn)結(jié)果就像是一場令人驚喜的性能提升展示。在所有測試的數(shù)據(jù)集和評(píng)估指標(biāo)上,REARM都顯著超越了現(xiàn)有的最先進(jìn)方法。以Recall@20指標(biāo)為例,REARM在嬰兒用品數(shù)據(jù)集上達(dá)到了0.1105,相比之前最好的方法MIG-GT的0.1021有了明顯提升。在體育用品數(shù)據(jù)集上,性能提升更為顯著,從之前最好的0.1139提升到了0.1231。
這些數(shù)字背后的意義可以用一個(gè)具體的例子來理解。假設(shè)傳統(tǒng)方法能夠在20個(gè)推薦商品中準(zhǔn)確命中11個(gè)用戶真正感興趣的商品,那么REARM能夠命中12個(gè)以上。這個(gè)看似微小的提升在實(shí)際應(yīng)用中意味著顯著的用戶體驗(yàn)改善和商業(yè)價(jià)值提升。
更有趣的是研究團(tuán)隊(duì)進(jìn)行的消融實(shí)驗(yàn),這就像是逐個(gè)拆解機(jī)器的零件來驗(yàn)證每個(gè)部分的作用。當(dāng)他們移除同質(zhì)關(guān)系學(xué)習(xí)模塊時(shí),系統(tǒng)性能出現(xiàn)了明顯下降,證明了深度挖掘用戶和商品關(guān)系的重要性。當(dāng)移除精煉對(duì)比學(xué)習(xí)的任一組件時(shí),性能同樣下降,驗(yàn)證了噪聲過濾和獨(dú)特特征保護(hù)的必要性。
研究團(tuán)隊(duì)還專門測試了不同模態(tài)的貢獻(xiàn)。他們發(fā)現(xiàn),單獨(dú)使用視覺模態(tài)或文本模態(tài)都無法達(dá)到最佳效果,這證實(shí)了多模態(tài)融合的價(jià)值。同時(shí),文本模態(tài)在服裝類商品上表現(xiàn)更好,這符合常識(shí),因?yàn)榉b的尺寸、材質(zhì)等重要信息往往更多地體現(xiàn)在文字描述中。
為了直觀展示系統(tǒng)的改進(jìn)效果,研究團(tuán)隊(duì)制作了一個(gè)交互概率差異熱力圖。這個(gè)圖像就像是系統(tǒng)決策過程的可視化窗口,顏色越深的區(qū)域表示REARM相比傳統(tǒng)方法預(yù)測出更高的交互可能性。令人興奮的是,這些高預(yù)測區(qū)域中的許多在測試集中確實(shí)被驗(yàn)證為真實(shí)的用戶興趣,證明了系統(tǒng)預(yù)測的準(zhǔn)確性。
五、超參數(shù)調(diào)優(yōu)與模型穩(wěn)健性
研究團(tuán)隊(duì)對(duì)REARM進(jìn)行了細(xì)致的參數(shù)調(diào)優(yōu)分析,這個(gè)過程就像是為一臺(tái)精密儀器尋找最佳工作狀態(tài)。他們測試了多個(gè)關(guān)鍵參數(shù)對(duì)系統(tǒng)性能的影響,發(fā)現(xiàn)了一些有趣的規(guī)律。
用戶共現(xiàn)圖的權(quán)重調(diào)節(jié)就像是平衡兩種不同信息源的重要性。研究發(fā)現(xiàn),純粹的用戶共現(xiàn)信息(權(quán)重為1)并不總是最優(yōu)的,適當(dāng)融入用戶興趣信息往往能帶來更好的效果。這個(gè)發(fā)現(xiàn)符合直覺:僅僅因?yàn)閮蓚€(gè)用戶購買了相同的商品并不意味著他們的興趣完全一致,了解他們的深層興趣偏好能夠提供更準(zhǔn)確的推薦。
商品共現(xiàn)圖的權(quán)重調(diào)節(jié)顯示了類似的模式。不同數(shù)據(jù)集的最優(yōu)權(quán)重設(shè)置有所不同,這反映了不同商品類別的特性差異。體育用品數(shù)據(jù)集需要更高的權(quán)重設(shè)置,可能因?yàn)轶w育用品的搭配購買模式更加明顯,用戶往往會(huì)一次性購買多個(gè)相關(guān)商品。
元網(wǎng)絡(luò)中變換矩陣的秩參數(shù)調(diào)節(jié)就像是控制信息壓縮的程度。研究發(fā)現(xiàn),體育用品數(shù)據(jù)集需要最大的矩陣秩(7),這可能因?yàn)樵摂?shù)據(jù)集擁有最多的交互數(shù)據(jù),需要更大的模型容量來捕捉豐富的用戶行為模式。這個(gè)發(fā)現(xiàn)為實(shí)際應(yīng)用提供了有價(jià)值的指導(dǎo):數(shù)據(jù)越豐富的場景可能需要更復(fù)雜的模型結(jié)構(gòu)。
圖神經(jīng)網(wǎng)絡(luò)的層數(shù)選擇也展現(xiàn)了有趣的特點(diǎn)。與傳統(tǒng)研究中常用的2層設(shè)置不同,REARM在所有數(shù)據(jù)集上都需要3層以上的網(wǎng)絡(luò)深度才能達(dá)到最佳性能。研究團(tuán)隊(duì)認(rèn)為這與注意力機(jī)制的引入有關(guān),注意力機(jī)制保留了更多有價(jià)值的信息,使得更深層的網(wǎng)絡(luò)能夠有效利用這些信息進(jìn)行更復(fù)雜的推理。
六、理論基礎(chǔ)與技術(shù)創(chuàng)新
REARM的理論基礎(chǔ)建立在對(duì)多模態(tài)冗余假設(shè)的深刻反思上。傳統(tǒng)的多模態(tài)對(duì)比學(xué)習(xí)基于這樣的假設(shè):不同模態(tài)之間存在高度冗余,大部分任務(wù)相關(guān)信息都是共享的,獨(dú)特信息很少且不重要。但研究團(tuán)隊(duì)通過理論分析和實(shí)驗(yàn)驗(yàn)證發(fā)現(xiàn),這個(gè)假設(shè)在推薦系統(tǒng)中往往不成立。
他們提出了一個(gè)新的理論框架,將任務(wù)相關(guān)信息分解為共享信息和獨(dú)特信息兩個(gè)部分,并分別進(jìn)行優(yōu)化。這種分解并非簡單的技術(shù)操作,而是基于對(duì)推薦任務(wù)本質(zhì)的深入理解。在真實(shí)的購物場景中,用戶的決策往往既受到商品共同特征的影響(比如品牌聲譽(yù)、基本功能),也受到獨(dú)特特征的驅(qū)動(dòng)(比如特殊的設(shè)計(jì)細(xì)節(jié)、個(gè)性化的功能)。
正交約束的理論基礎(chǔ)來自線性代數(shù)中的正交矩陣性質(zhì)。當(dāng)兩個(gè)矩陣正交時(shí),它們的內(nèi)積為零,這意味著它們包含的信息沒有重疊。研究團(tuán)隊(duì)巧妙地將這個(gè)數(shù)學(xué)概念應(yīng)用到特征學(xué)習(xí)中,通過軟正交約束來鼓勵(lì)不同模態(tài)保持信息的獨(dú)特性,同時(shí)允許一定程度的靈活性以適應(yīng)實(shí)際應(yīng)用的需要。
元網(wǎng)絡(luò)的設(shè)計(jì)靈感來自元學(xué)習(xí)的思想,即"學(xué)會(huì)如何學(xué)習(xí)"。在REARM中,元網(wǎng)絡(luò)不是學(xué)習(xí)固定的特征變換,而是學(xué)習(xí)如何根據(jù)不同的輸入動(dòng)態(tài)生成最適合的變換規(guī)則。這種自適應(yīng)性使得系統(tǒng)能夠處理各種不同類型的商品和用戶,而不需要為每種情況手動(dòng)設(shè)計(jì)特定的處理策略。
七、實(shí)際應(yīng)用價(jià)值與未來展望
REARM的技術(shù)創(chuàng)新在實(shí)際應(yīng)用中具有廣泛的價(jià)值。對(duì)于電商平臺(tái)來說,更準(zhǔn)確的推薦能夠直接轉(zhuǎn)化為更高的用戶參與度和銷售轉(zhuǎn)化率。研究顯示的性能提升意味著用戶能夠更快找到心儀的商品,平臺(tái)能夠更好地匹配用戶需求和商品供給。
從用戶體驗(yàn)角度來看,REARM解決了傳統(tǒng)推薦系統(tǒng)的一個(gè)重要痛點(diǎn):推薦結(jié)果的同質(zhì)化。傳統(tǒng)系統(tǒng)往往傾向于推薦相似的商品,用戶容易感到推薦缺乏新意。而REARM通過保護(hù)模態(tài)獨(dú)特特征,能夠發(fā)現(xiàn)用戶可能感興趣但不太明顯的商品特點(diǎn),從而提供更多樣化和個(gè)性化的推薦。
技術(shù)實(shí)現(xiàn)方面,REARM的計(jì)算復(fù)雜度與傳統(tǒng)的圖神經(jīng)網(wǎng)絡(luò)相當(dāng),這得益于元網(wǎng)絡(luò)中較小的矩陣秩設(shè)置和高效的圖結(jié)構(gòu)處理。這種設(shè)計(jì)使得該方法在保持高性能的同時(shí),具備了實(shí)際部署的可行性。
研究團(tuán)隊(duì)在論文中也誠實(shí)地指出了當(dāng)前方法的局限性。首先,REARM主要針對(duì)視覺和文本兩種模態(tài)進(jìn)行了優(yōu)化,對(duì)于音頻、視頻等其他模態(tài)的擴(kuò)展還需要進(jìn)一步研究。其次,該方法在冷啟動(dòng)場景(新用戶或新商品)下的表現(xiàn)還有待驗(yàn)證,這是推薦系統(tǒng)領(lǐng)域的共同挑戰(zhàn)。
未來的研究方向包括幾個(gè)有趣的方向。一是探索更多模態(tài)的融合,特別是在短視頻電商興起的背景下,如何有效利用視頻信息將成為重要課題。二是研究動(dòng)態(tài)推薦場景,考慮用戶興趣和商品特征隨時(shí)間的演變。三是將REARM的理念擴(kuò)展到其他需要多模態(tài)信息融合的任務(wù)中,如內(nèi)容創(chuàng)作、智能客服等。
從更廣闊的視角來看,REARM代表了AI系統(tǒng)設(shè)計(jì)哲學(xué)的一種演進(jìn)。它不再追求將所有信息標(biāo)準(zhǔn)化為統(tǒng)一形式,而是學(xué)會(huì)在保持多樣性的同時(shí)實(shí)現(xiàn)協(xié)同。這種思路不僅適用于推薦系統(tǒng),也可能為其他AI應(yīng)用領(lǐng)域提供啟發(fā)。
研究團(tuán)隊(duì)已經(jīng)將REARM的代碼開源,這為學(xué)術(shù)界和工業(yè)界的進(jìn)一步研究和應(yīng)用奠定了基礎(chǔ)。開源代碼的發(fā)布也體現(xiàn)了研究團(tuán)隊(duì)對(duì)推動(dòng)整個(gè)領(lǐng)域發(fā)展的責(zé)任感和貢獻(xiàn)精神。
總的來說,REARM不僅在技術(shù)上實(shí)現(xiàn)了突破,更重要的是提供了一種新的思考框架:如何在AI系統(tǒng)中平衡統(tǒng)一性和多樣性,如何在追求共性的同時(shí)保護(hù)個(gè)性。這種平衡藝術(shù)可能正是未來AI系統(tǒng)需要掌握的核心能力之一。對(duì)于希望深入了解這項(xiàng)研究的讀者,完整論文和實(shí)現(xiàn)代碼都可以通過前面提到的鏈接獲取,為進(jìn)一步的學(xué)習(xí)和實(shí)踐提供了寶貴資源。
Q&A
Q1:REARM框架主要解決了推薦系統(tǒng)的什么問題?
A:REARM主要解決了傳統(tǒng)多模態(tài)推薦系統(tǒng)的兩大痛點(diǎn):一是簡單的特征對(duì)比會(huì)引入噪聲并丟失有價(jià)值的獨(dú)特信息,就像只看商品的共同標(biāo)簽而忽略了個(gè)性化特點(diǎn);二是對(duì)用戶興趣和商品關(guān)聯(lián)關(guān)系挖掘不充分,缺乏深層的行為模式分析。
Q2:元網(wǎng)絡(luò)和正交約束在REARM中起什么作用?
A:元網(wǎng)絡(luò)就像一個(gè)智能質(zhì)檢員,專門從模態(tài)共享特征中過濾噪聲,提取真正與推薦相關(guān)的信息。正交約束則像一個(gè)獨(dú)特性保護(hù)器,確保每種模態(tài)(如圖像、文本)的獨(dú)特價(jià)值信息在融合過程中不會(huì)丟失,讓系統(tǒng)既能識(shí)別共同喜好又能保留個(gè)性化偏好。
Q3:REARM相比其他推薦方法有多大的性能提升?
A:實(shí)驗(yàn)顯示REARM在三個(gè)電商數(shù)據(jù)集上都顯著超越了現(xiàn)有最佳方法。例如在體育用品數(shù)據(jù)集上,Recall@20從之前最好的0.1139提升到0.1231,這意味著在20個(gè)推薦商品中,用戶真正感興趣的商品數(shù)量從約11個(gè)提升到超過12個(gè),顯著改善了用戶體驗(yàn)。