您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于巴氏系數(shù)的協(xié)同過濾算法

大小:1.16 MB 人氣: 2017-11-29 需要積分:1

  推薦系統(tǒng)成功幫助人們解決了“信息過載”問題,并成功運(yùn)用于商業(yè)領(lǐng)域。推薦系統(tǒng)的核心是推薦算法,協(xié)同過濾算法是其中最為廣泛使用的協(xié)同過濾算法,其優(yōu)點(diǎn)是它與領(lǐng)域知識(shí)無關(guān)并且準(zhǔn)確性也比其他算法高。可分為:基于用戶的的協(xié)同過濾推薦算法和基于項(xiàng)目的協(xié)同過濾推薦算法。協(xié)同過濾推薦算法的基本思想是:與目標(biāo)用戶相似的用戶喜歡的項(xiàng)目目標(biāo)用戶也可能喜歡,其核心是相似度計(jì)算。傳統(tǒng)的相似度計(jì)算方法大都依賴共同評(píng)分項(xiàng)來計(jì)算目標(biāo)用戶的近鄰,而稀疏性使得這些方法失效甚至適得其反。經(jīng)過多年的發(fā)展,出現(xiàn)了各種不同的相似度計(jì)算方法:皮爾森相關(guān)系數(shù)(PC)是衡量?jī)蓚€(gè)用戶(項(xiàng)目)的線性相關(guān)性。皮爾森相關(guān)系數(shù)(PC)在共同評(píng)分項(xiàng)較少的情形下無法判定兩個(gè)用戶的相似性,而且沒有充分利用全局評(píng)分信息;Ahn 提出了PIP (Proximity-lmpact-Popularity)只考慮評(píng)分的片面信息:接近、影響度和普及度,而沒有考慮全局評(píng)分信息的利用;Jaccard相似度計(jì)算方法考慮到使用全局評(píng)分信息,但是沒有考慮評(píng)分的數(shù)值的大小,而是簡(jiǎn)單的處理為0和1;Bobadilla等捉出了多個(gè)相似度計(jì)算方法來克服其之前的相似度計(jì)算方法的缺點(diǎn)。1)結(jié)合了均方差(Mean squared-difference,MSD)和Jaccard提出JMSD計(jì)算方法,讓兩者克服彼此的缺點(diǎn);2)他們提出Mean-Jaccard-Difference (MJD) ,在一定程度上克服了稀疏性問題。但上述的所有相似度計(jì)算方法在共同評(píng)分項(xiàng)較少的時(shí)候性能變得很差。

  由前面的討論可以看出傳統(tǒng)的相似性計(jì)算方法并不適用于稀疏用戶一項(xiàng)目評(píng)分的場(chǎng)景,因?yàn)樗鼈兌家蕾嚬餐u(píng)分項(xiàng)。在此,我們提出一個(gè)基于巴氏系數(shù)的協(xié)同過濾算法(Collaborative Filtering Based on Bhattacharyya Coefficient,CFBC),該算法通過巴氏系數(shù)來度量項(xiàng)目間的相似度,巴氏系數(shù)通過計(jì)算項(xiàng)目的全局評(píng)分信息從而克服對(duì)共同評(píng)分項(xiàng)的依賴問題。CFBC算法有效緩解傳統(tǒng)相似度在用戶一項(xiàng)目評(píng)分?jǐn)?shù)據(jù)非常稀疏場(chǎng)景下推薦質(zhì)量低的問題。
?

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?