您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

基于差異度的不均衡電信客戶數(shù)據(jù)分類方法

大?。?/span>0.94 MB 人氣: 2017-12-04 需要積分:1

  針對傳統(tǒng)分類技術(shù)對不均衡電信客戶數(shù)據(jù)集中流失客戶識別能力不足的問題,提出一種基于差異度的改進(jìn)型不均衡數(shù)據(jù)分類(IDBC)算法。該算法在基于差異度分類(DBC)算法的基礎(chǔ)上改進(jìn)了原型選擇策略。在原型選擇階段,利用改進(jìn)型的樣本子集優(yōu)化方法從整體數(shù)據(jù)集中選擇最具參考價(jià)值的原型集,從而避免了隨機(jī)選擇所帶來的不確定性;在分類階段,分別利用訓(xùn)練集和原型集、測試集和原型集樣本之間的差異性構(gòu)建相應(yīng)的特征空間,進(jìn)而采用傳統(tǒng)的分類預(yù)測算法對映射到相應(yīng)特征空間內(nèi)的差異度數(shù)據(jù)集進(jìn)行學(xué)習(xí)。最后選用了UCI數(shù)據(jù)庫中的電信客戶數(shù)據(jù)集和另外6個(gè)普通的不均衡數(shù)據(jù)集對該算法進(jìn)行驗(yàn)證,相對于傳統(tǒng)基于特征的不均衡數(shù)據(jù)分類算法,DBC算法對稀有類的識別率平均提高了8. 3%,IDBC算法對稀有類的識別率平均提高了11. 3%。實(shí)驗(yàn)結(jié)果表明,所提IDBC算法不受類別分布的影響,而且對不均衡數(shù)據(jù)集中稀有類的識別能力優(yōu)于已有的先進(jìn)分類技術(shù)。

?

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價(jià):好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?