SIGIR 24: A Preference-oriented Diversity Model Based on Mutual-information in Re-ranking for E-commerce Search
鏈接:https://dl.acm.org/doi/abs/10.1145/3626772.3661359
摘要:重排是一種通過(guò)考慮商品之間的相互關(guān)系來(lái)重新排列商品順序以更有效地滿足用戶需求的過(guò)程?,F(xiàn)有的方法主要提高商品打分精度,通常以犧牲多樣性為代價(jià),導(dǎo)致結(jié)果可能無(wú)法滿足用戶的多樣化需求。相反,旨在促進(jìn)多樣性的方法可能會(huì)降低結(jié)果的精度,無(wú)法滿足用戶對(duì)準(zhǔn)確性的要求。為了解決上述問(wèn)題,本文提出了一種基于互信息的偏好導(dǎo)向多樣性模型(PODM-MI),在重排過(guò)程中同時(shí)考慮準(zhǔn)確性和多樣性。具體而言,PODM-MI采用基于變分推理的多維高斯分布來(lái)捕捉具有不確定性的用戶多樣性偏好。然后,我們利用最大變分推理下界來(lái)最大化用戶多樣性偏好與候選商品之間的互信息,以增強(qiáng)它們的相關(guān)性。隨后,我們基于相關(guān)性得出一個(gè)效用矩陣,使項(xiàng)目能夠根據(jù)用戶偏好進(jìn)行自適應(yīng)排序,從而在上述目標(biāo)之間建立平衡。在京東主搜上的實(shí)驗(yàn)結(jié)果證明了PODM-MI的顯著提升。
1、背景及現(xiàn)狀
?用戶從搜索到下單過(guò)程中存在不同的決策階段(買、逛等),用戶不同的決策階段對(duì)多樣性也有不同需求,現(xiàn)階段模型沒(méi)有直接建模不同決策階段和多樣性的關(guān)系。
?用戶需求考慮。
?重排階段需要充分考慮用戶需求。通常來(lái)說(shuō),用戶的需求是個(gè)性化的,即部分場(chǎng)景下對(duì)于排序結(jié)果的準(zhǔn)確性要求較高,而另一部分場(chǎng)景下對(duì)于排序結(jié)果的多樣性要求較多。在這種情況下,一個(gè)合適的重排排序算法應(yīng)該自適應(yīng)地根據(jù)用戶需求進(jìn)行結(jié)果調(diào)整,即當(dāng)用戶需要多樣性時(shí),搜索排序結(jié)果應(yīng)當(dāng)包含盡可能不同的商品來(lái)滿足用戶的多種興趣來(lái)滿足用戶的多樣性需求;而當(dāng)用戶需要準(zhǔn)確性時(shí),排序結(jié)果應(yīng)包含最符合用戶或用戶最感興趣的單一類別商品。例如,用戶從搜索“連衣裙”到逐漸縮小范圍到“荷葉邊連衣裙”,這一過(guò)程中,他們的搜索意圖從多樣化逐漸變得明確和具體。要在重排階段平衡效率指標(biāo)和多樣性,我們面臨兩個(gè)主要挑戰(zhàn):
1.準(zhǔn)確建模用戶的決策意圖困難,因?yàn)槠湟鈭D會(huì)在多次搜索中逐漸演變。
2.即使成功建模了用戶的意圖,如何加強(qiáng)搜索結(jié)果與用戶演變意圖的匹配關(guān)系?
為了解決這些挑戰(zhàn),我們提出了PODM-MI(基于互信息的偏好導(dǎo)向多樣性模型)。
2、PODM-MI
PODM-MI模型以排序列表和用戶行為數(shù)據(jù)(如點(diǎn)擊流和加入購(gòu)物車的行為)為輸入。首先,我們使用PON捕捉用戶的多樣性偏好和候選商品的多樣性表示。然后,SAM增強(qiáng)用戶多樣性偏好與候選商品多樣性之間的一致性。從這種增強(qiáng)的一致性中,我們得出一個(gè)效用矩陣,該矩陣會(huì)動(dòng)態(tài)調(diào)整用戶偏好,從而重新排序最終的排名結(jié)果以更好地滿足用戶需求。
2.1 PON 用戶偏好建模
在電商搜索場(chǎng)景中,歷史查詢及其關(guān)聯(lián)商品提供了用戶意圖的有價(jià)值表示。因此,我們的方法不僅包括點(diǎn)擊流和加入購(gòu)物車的行為,還包括查詢軌跡,以更好地捕捉用戶偏好。
傳統(tǒng)模型通常將用戶偏好視為靜態(tài),在潛在空間中創(chuàng)建固定的用戶嵌入。然而,這種方法在捕捉用戶偏好的復(fù)雜和動(dòng)態(tài)特性時(shí)顯得不足。相比之下,分布表示引入了不確定性,提供了比單一固定嵌入更多的靈活性。
我們使用多維高斯分布來(lái)建模用戶偏好的演變趨勢(shì)。該分布由均值向量和對(duì)角協(xié)方差矩陣表征,使我們能夠更好地捕捉用戶偏好的動(dòng)態(tài)特性。此外,高斯分布還可以用于測(cè)量收斂和發(fā)散趨勢(shì)。較大的方差表示更均勻的分布,而較小的方差則表示更集中的分布。這個(gè)方差可以間接反映用戶的偏好趨勢(shì)。
2.2 SAM 利用互信息優(yōu)化排序結(jié)果
在建模用戶偏好和候選商品的多樣性之后,下一步是確保排序結(jié)果與用戶意圖緊密匹配。為此,我們可以使用互信息(一種衡量?jī)蓚€(gè)變量之間共享信息量的方法)來(lái)量化候選商品與用戶偏好之間的相關(guān)性。通過(guò)最大化這兩個(gè)因素(用戶偏好和多樣性)之間的互信息,我們確保候選商品的分布與用戶意圖的分布緊密對(duì)齊。
然而,估計(jì)和最大化互信息通常是不可行的。為了解決這一挑戰(zhàn),我們借鑒了變分推理的文獻(xiàn),引入了一個(gè)變分后驗(yàn)估計(jì)器。該方法允許我們?yōu)榛バ畔⒛繕?biāo)推導(dǎo)出一個(gè)可行的下界。
在增強(qiáng)一致性之后,我們?cè)O(shè)計(jì)了一個(gè)可學(xué)習(xí)的效用矩陣,以進(jìn)一步使最終的排序結(jié)果與用戶偏好對(duì)齊。該矩陣通過(guò)可學(xué)習(xí)權(quán)重矩陣與對(duì)齊特征的點(diǎn)積獲得。然后,我們將效用矩陣與從主干網(wǎng)絡(luò)計(jì)算的分?jǐn)?shù)相乘以得到最終結(jié)果。
2.3 優(yōu)化函數(shù)及最終loss
優(yōu)化函數(shù):
最終loss:
前者是prm分類loss,后者是互信息loss
方案總結(jié):
2.4 實(shí)驗(yàn)結(jié)果及可視化分析
為了驗(yàn)證PODM-MI的有效性,我們?cè)诰〇|電商搜索引擎中進(jìn)行了在線A/B測(cè)試。PODM-MI不僅提高了用戶購(gòu)買的可能性,還增加了搜索結(jié)果中商品的多樣性。需要注意的是,每增加0.10%的UCVR都會(huì)為公司帶來(lái)巨大的收入,因此PODM-MI取得的提升是非常顯著的。
進(jìn)一步的,我們對(duì)用戶query流降維后的趨勢(shì)使用TSNE可視化,同時(shí)降維可視化需要label足夠明顯,所以采用人工分桶的方法,對(duì)排序結(jié)果的多樣性熵進(jìn)行人工分桶,分成多個(gè)label??梢钥闯?,不同發(fā)散收斂趨勢(shì)的query流有著很明顯的分層,query流同對(duì)應(yīng)的熵聚集在了一起,這表明不同的query流的發(fā)散趨勢(shì)對(duì)應(yīng)著不同的結(jié)果的熵。也就是說(shuō),query流越發(fā)散,session的排序結(jié)果越發(fā)散,query流越收斂,session的排序結(jié)果越收斂。
此外,我們還用一個(gè)更具體的案例來(lái)說(shuō)明我們方法的有效性。當(dāng)用戶的歷史搜索查詢非常多樣時(shí),如:Switch,塞爾達(dá),手機(jī)殼,錘子,油煙機(jī),排氣管,在這種情況下,當(dāng)用戶輸入“蔬菜水果脫水機(jī)”后,我們的方法比基線方法產(chǎn)生了更多樣化的結(jié)果。另外,還有一個(gè)收斂趨勢(shì)的案例。當(dāng)用戶搜索“連衣裙”并訪問(wèn)相應(yīng)的店鋪后,再次輸入該店鋪時(shí),我們的方法比基線方法產(chǎn)生的結(jié)果更加集中,并且更好地與用戶的歷史搜索記錄相匹配。
3、未來(lái)迭代方向
? 引入更精細(xì)的特征,更好的建模用戶的逛買意圖
? 用戶意圖建模更新的進(jìn)一步優(yōu)化
? 用戶意圖建模顯式影響
Note:
歡迎大家交流與探討,如有任何問(wèn)題或建議,請(qǐng)隨時(shí)聯(lián)系:{wanghuimu1, limingming65}@jd.com。
我們京東搜索算法部目前有大量的社招和實(shí)習(xí)機(jī)會(huì),誠(chéng)邀有志之士加入。無(wú)論您是技術(shù)專家還是新興人才,我們都期待您的加入,共同推動(dòng)技術(shù)的進(jìn)步和創(chuàng)新。歡迎大家踴躍投遞簡(jiǎn)歷,期待與您在京東相遇!
團(tuán)隊(duì)最近相關(guān)工作:
1. Breaking the Hourglass Phenomenon of Residual Quantization: Enhancing the Upper Bound of Generative Retrieval (arxiv:2407.21488)
2. Generative Retrieval with Preference Optimization for E-commerce Search(arxiv:2407.19829)
3. A Preference-oriented Diversity Model Based on Mutual-information in Re-ranking for E-commerce Search(SIGIR 24 ACCEPTED)
4. MODRL-TA: A Multi-Objective Deep Reinforcement Learning Framework for Traffic Allocation in E-Commerce Search(CIKM 24 ACCEPTED)
5. Optimizing E-commerce Search: Toward a Generalizable and Rank-Consistent Pre-Ranking Model(SIGIR 24 ACCEPTED)
分享嘉賓:
王彗木博士
中科院自動(dòng)化所博士,研究方向?yàn)榇竽P?、?qiáng)化學(xué)習(xí),亦城優(yōu)秀人才,CCF 中國(guó)計(jì)算機(jī)學(xué)會(huì)專業(yè)會(huì)員,目前在京東從事主搜排序及生成式召排工作
李明明博士
資深算法專家中科院信工所博士,研究方向?yàn)榇竽P?、語(yǔ)義檢索,亦城優(yōu)秀人才,CCF 中國(guó)計(jì)算機(jī)學(xué)會(huì)專業(yè)會(huì)員,目前在京東從事主搜召回及生成式召排工作
審核編輯 黃宇
-
算法
+關(guān)注
關(guān)注
23文章
4573瀏覽量
92333 -
模型
+關(guān)注
關(guān)注
1文章
3054瀏覽量
48569 -
可視化
+關(guān)注
關(guān)注
1文章
1154瀏覽量
20812
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論