電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子論文>網(wǎng)絡(luò)協(xié)議論文>基于局部孤立系數(shù)的孤立點挖掘

基于局部孤立系數(shù)的孤立點挖掘

2009-08-11 | rar | 156 | 次下載 | 3積分

資料介紹

提出了一種基于局部孤立系數(shù)(LOC)的孤立點挖掘算法。該算法是對基于局部稀疏系數(shù)(LSC)孤立點挖掘論文中局部稀疏率和局部稀疏系數(shù)計算的一種改進。實驗表明,LOC 算法在發(fā)現(xiàn)孤立點方面比LSC 算法更高效。
孤立點檢測在數(shù)據(jù)挖掘領(lǐng)域是一項重要的挖掘技術(shù)。孤立點檢測的研究對象是數(shù)據(jù)集中
偏離絕大多數(shù)對象的很小一部分數(shù)據(jù)。在許多KDD 應(yīng)用中,研究孤立點比研究聚類更有用、更重要。因為,在某些應(yīng)用領(lǐng)域中研究孤立點的異常行為能發(fā)現(xiàn)隱藏在數(shù)據(jù)集中更有價值的知識。諸如,在欺詐探測中,孤立點可能預(yù)示著欺詐行為;在市場分析中,可用于確定極低或極高的收入的消費行為;在醫(yī)療分析中,用于發(fā)現(xiàn)對多種治療方式的不尋常的反映;因此,孤立點檢測是一個重要的數(shù)據(jù)挖掘任務(wù),稱為孤立點挖掘或異常挖掘。孤立點挖掘可以描述如下:給定一個n 個數(shù)據(jù)點或?qū)ο蟮募?,及預(yù)期的孤立點的數(shù)目k,發(fā)現(xiàn)與剩余的數(shù)據(jù)相比是顯著相異的、異常的或不一致的頭k 個對象[1]。
在數(shù)據(jù)挖掘中,孤立點檢測算法大體上可分為以下幾類:統(tǒng)計學方法,基于距離的方法,基于偏離的方法和基于密度的方法。
基于密度的方法能夠挖掘出比基于距離異常算法所不能識別的一類異常數(shù)據(jù)—局部異
常。局部異常觀點擯棄了以前所有的異常定義中非此即彼的絕對異常觀念,這更加符合現(xiàn)實生活中的應(yīng)用。近年來,一些研究人員提出局部孤立點探測[2,3,4,5],就是對每個對象賦予某個度,這個度決定了這個對象成為孤立點的程度。每個點的孤立程度只與它和周圍點的距離有關(guān),而與數(shù)據(jù)集中其他的點沒有任何關(guān)系,這就體現(xiàn)了“局部”的特性。局部稀疏系數(shù)(LSC)就是其中一種,Malik Agyemang 提出的基于局部稀疏系數(shù) (LSC)孤立點挖掘[4]算法的主要思想是對數(shù)據(jù)集中每個對象,計算出離它最近K 個對象的距離,并從中選出最大的距離作為該點的K-距離,對數(shù)據(jù)集中每個對象計算出與它的距離不大于該對象K-距離的鄰近對象形成一個集合,然后計算每個對象與其對應(yīng)集合的所有對象之間平均距離的反比,即局部稀疏率,最后計算集合內(nèi)所有對象的局部稀疏率之和與該點的局部稀疏率比值的平均比率,即局部稀疏系數(shù)(LSC);根據(jù)每個對象的LSC 值從大到小的順序排列整個數(shù)據(jù)集,并把前n 個對象作為孤立點。
在局部稀疏系數(shù)(LSC)算法中,需要計算數(shù)據(jù)集中每個對象的局部稀疏率和局部稀疏
系數(shù),當數(shù)據(jù)集很大時,計算每個對象的局部稀疏率和局部稀疏系數(shù)耗費很大的計算量。本文提出了基于局部孤立系數(shù)(LOC)孤立點算法,它是對LSC 算法的改進,LOC 算法的主要思想是:對于數(shù)據(jù)集中每個點,計算出離它最近K 個對象的距離并選出其中最大距離作為該點的K-距離,并把最近K 個距離的和作為該點的局部距離之和;然后計算每個點的局部距離之和與它K-距離內(nèi)每個對象的局部距離之和的總和平均值的比率(LOC)作為該點的孤立因子,按LOC 值從大到小的順序選出前n 個作為孤立點。本文給出了LSC 算法和LOC 算法的實驗結(jié)果,實驗結(jié)果表明LOC 算法在發(fā)現(xiàn)孤立點方面比LSC 算法效率高。
下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1電子電路原理第七版PDF電子教材免費下載
  2. 0.00 MB  |  1490次下載  |  免費
  3. 2單片機典型實例介紹
  4. 18.19 MB  |  93次下載  |  1 積分
  5. 3S7-200PLC編程實例詳細資料
  6. 1.17 MB  |  27次下載  |  1 積分
  7. 4筆記本電腦主板的元件識別和講解說明
  8. 4.28 MB  |  18次下載  |  4 積分
  9. 5開關(guān)電源原理及各功能電路詳解
  10. 0.38 MB  |  10次下載  |  免費
  11. 6基于AT89C2051/4051單片機編程器的實驗
  12. 0.11 MB  |  4次下載  |  免費
  13. 7基于單片機和 SG3525的程控開關(guān)電源設(shè)計
  14. 0.23 MB  |  3次下載  |  免費
  15. 8基于單片機的紅外風扇遙控
  16. 0.23 MB  |  3次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234313次下載  |  免費
  3. 2PADS 9.0 2009最新版 -下載
  4. 0.00 MB  |  66304次下載  |  免費
  5. 3protel99下載protel99軟件下載(中文版)
  6. 0.00 MB  |  51209次下載  |  免費
  7. 4LabView 8.0 專業(yè)版下載 (3CD完整版)
  8. 0.00 MB  |  51043次下載  |  免費
  9. 5555集成電路應(yīng)用800例(新編版)
  10. 0.00 MB  |  33562次下載  |  免費
  11. 6接口電路圖大全
  12. 未知  |  30320次下載  |  免費
  13. 7Multisim 10下載Multisim 10 中文版
  14. 0.00 MB  |  28588次下載  |  免費
  15. 8開關(guān)電源設(shè)計實例指南
  16. 未知  |  21539次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935053次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
  4. 78.1 MB  |  537791次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420026次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234313次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191183次下載  |  免費
  13. 7十天學會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183277次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138039次下載  |  免費