您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于檢索結(jié)果排序的偽相關(guān)反饋

大?。?/span>0.76 MB 人氣: 2017-12-13 需要積分:3

  隨著Web的普及,越來越多的用戶希望從互聯(lián)網(wǎng)上獲取信息。對于目前主流的基于關(guān)鍵詞的搜索方式,用戶必須通過構(gòu)造有限的查詢詞來表達信息需求( information need)。Carpineto等在查詢擴展綜述中明確指出,大多數(shù)用戶喜歡構(gòu)造短查詢交給搜索引擎,且構(gòu)造的查詢詞多以1-3個詞居多;并且用戶的查詢構(gòu)造本身就是一個抽象的過程,查詢構(gòu)造結(jié)果具有模糊性、不確定性和描述的多樣性。在這種情況下,由于缺乏上下文語境,搜索引擎很難完全理解用戶的查詢意圖,返回的結(jié)果中經(jīng)常會包含大量無關(guān)或相似的文檔。特別是當查詢詞出現(xiàn)歧義時,返回的文檔集會偏向于某一個主題,而該主題往往并不是用戶潛在查詢意圖。如果搜索引擎能夠?qū)⑴c用戶初始查詢構(gòu)造相關(guān)的信息全部返回給用戶,那么,用戶就可以在多個不同查詢結(jié)果中找到自己最想要的結(jié)果。

  針對傳統(tǒng)偽相關(guān)反饋(PRF)算法擴展源質(zhì)量不高使得檢索效果不佳的問題,提出一種基于檢索結(jié)果的排序模型( REM)。首先,該模型從初檢結(jié)果中選擇排名靠前的文檔怍為偽相關(guān)文檔集;然后,以用戶查詢意圖與偽相關(guān)文檔集中各文檔的相關(guān)度最大化、并且各文檔之間相似性最小化作為排序原則,將偽相關(guān)文檔集中各文檔進行重排序;最后,將排序后排名靠前的文檔作為擴展源進行二次反饋。實驗結(jié)果表明,與兩種傳統(tǒng)偽反饋方法相比,該排序模型能獲得與用戶查詢意圖相關(guān)的反饋文檔,可有效地提高檢索效果。

基于檢索結(jié)果排序的偽相關(guān)反饋

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?