常用聚類算法有哪些？六大類聚類算法詳細介紹

　　很難對聚類方法提出一個簡潔的分類，因為這些類別可能重疊，從而使得一種方法具有幾類的特征，盡管如此，對于各種不同的聚類方法提供一個相對有組織的描述依然是有用的，為聚類分析計算方法主要有如下幾種：劃分法、層次法、密度算法、圖論聚類法、網(wǎng)格算法和模型算法。

　　以下對劃分法和層次法等六種聚類算法種類做了詳細的介紹。

　常用聚類算法有哪些

常用聚類算法有哪些？及其詳細的分類介紹

　　1、劃分法

　　劃分法（partitioning methods），給定一個有N個元組或者紀錄的數(shù)據(jù)集，分裂法將構(gòu)造K個分組，每一個分組就代表一個聚類，K《N。而且這K個分組滿足下列條件：

　?。?）每一個分組至少包含一個數(shù)據(jù)紀錄；

　?。?）每一個數(shù)據(jù)紀錄屬于且僅屬于一個分組（注意：這個要求在某些模糊聚類算法中可以放寬）；

　　對于給定的K，算法首先給出一個初始的分組方法，以后通過反復迭代的方法改變分組，使得每一次改進之后的分組方案都較前一次好，而所謂好的標準就是：同一分組中的記錄越近越好，而不同分組中的紀錄越遠越好。

　　大部分劃分方法是基于距離的。給定要構(gòu)建的分區(qū)數(shù)k，劃分方法首先創(chuàng)建一個初始化劃分。然后，它采用一種迭代的重定位技術(shù)，通過把對象從一個組移動到另一個組來進行劃分。一個好的劃分的一般準備是：同一個簇中的對象盡可能相互接近或相關(guān)，而不同的簇中的對象盡可能遠離或不同。還有許多評判劃分質(zhì)量的其他準則。傳統(tǒng)的劃分方法可以擴展到子空間聚類，而不是搜索整個數(shù)據(jù)空間。當存在很多屬性并且數(shù)據(jù)稀疏時，這是有用的。為了達到全局最優(yōu)，基于劃分的聚類可能需要窮舉所有可能的劃分，計算量極大。實際上，大多數(shù)應(yīng)用都采用了流行的啟發(fā)式方法，如k-均值和k-中心算法，漸近的提高聚類質(zhì)量，逼近局部最優(yōu)解。這些啟發(fā)式聚類方法很適合發(fā)現(xiàn)中小規(guī)模的數(shù)據(jù)庫中小規(guī)模的數(shù)據(jù)庫中的球狀簇。為了發(fā)現(xiàn)具有復雜形狀的簇和對超大型數(shù)據(jù)集進行聚類，需要進一步擴展基于劃分的方法。

　　基于這個基本思想的算法有：

　　a.k-means：是一種典型的劃分聚類算法，它用一個聚類的中心來代表一個簇，即在迭代過程中選擇的聚點不一定是聚類中的一個點，該算法只能處理數(shù)值型數(shù)據(jù)。

　　b.k-modes:K-Means：算法的擴展，采用簡單匹配方法來度量分類型數(shù)據(jù)的相似度。

　　c.k-prototypes：結(jié)合了K-Means和K-Modes兩種算法，能夠處理混合型數(shù)據(jù)。

　　d.k-medoids：在迭代過程中選擇簇中的某點作為聚點，PAM是典型的k-medoids算法。

　　e.CLARA:CLARA算法在PAM的基礎(chǔ)上采用了抽樣技術(shù)，能夠處理大規(guī)模數(shù)據(jù)。

　　f.CLARANS:CLARANS算法融合了PAM和CLARA兩者的優(yōu)點，是第一個用于空間數(shù)據(jù)庫的聚類算法。

　　g.Focused CLARAN：采用了空間索引技術(shù)提高了CLARANS算法的效率。

　　h.PCM：模糊集合理論引入聚類分析中并提出了PCM模糊聚類算法。

　　2、層次法

　　層次法（hierarchical methods），這種方法對給定的數(shù)據(jù)集進行層次似的分解，直到某種條件滿足為止。具體又可分為“自底向上”和“自頂向下”兩種方案。

　　例如，在“自底向上”方案中，初始時每一個數(shù)據(jù)紀錄都組成一個單獨的組，在接下來的迭代中，它把那些相互鄰近的組合并成一個組，直到所有的記錄組成一個分組或者某個條件滿足為止。

　　代表算法有：

　　a.CURE：采用抽樣技術(shù)先對數(shù)據(jù)集D隨機抽取樣本，再采用分區(qū)技術(shù)對樣本進行分區(qū)，然后對每個分區(qū)局部聚類，最后對局部聚類進行全局聚類。

　　b.ROCK：也采用了隨機抽樣技術(shù)，該算法在計算兩個對象的相似度時，同時考慮了周圍對象的影響。

　　c.CHEMALOEN：首先由數(shù)據(jù)集構(gòu)造成一個K-最近鄰圖Gk ，再通過一個圖的劃分算法將圖Gk 劃分成大量的子圖，每個子圖代表一個初始子簇，最后用一個凝聚的層次聚類算法反復合并子簇，找到真正的結(jié)果簇。

　　d.SBAC:SBAC算法則在計算對象間相似度時，考慮了屬性特征對于體現(xiàn)對象本質(zhì)的重要程度，對于更能體現(xiàn)對象本質(zhì)的屬性賦予較高的權(quán)值。

　　e.BIRCH:BIRCH算法利用樹結(jié)構(gòu)對數(shù)據(jù)集進行處理，葉結(jié)點存儲一個聚類，用中心和半徑表示，順序處理每一個對象，并把它劃分到距離最近的結(jié)點，該算法也可以作為其他聚類算法的預處理過程。

　　f.BUBBLE:BUBBLE算法則把BIRCH算法的中心和半徑概念推廣到普通的距離空間。

　　g.BUBBLE-FM:BUBBLE-FM算法通過減少距離的計算次數(shù)，提高了BUBBLE算法的效率。

　　3、密度算法

　　基于密度的方法（density-based methods），基于密度的方法與其它方法的一個根本區(qū)別是：它不是基于各種各樣的距離的，而是基于密度的。這樣就能克服基于距離的算法只能發(fā)現(xiàn)“類圓形”的聚類的缺點。

　　這個方法的指導思想就是，只要一個區(qū)域中的點的密度大過某個閾值，就把它加到與之相近的聚類中去。

　　代表算法有：

　　a.DBSCAN:DBSCAN算法是一種典型的基于密度的聚類算法，該算法采用空間索引技術(shù)來搜索對象的鄰域，引入了“核心對象”和“密度可達”等概念，從核心對象出發(fā)，把所有密度可達的對象組成一個簇。

　　b.GDBSCAN：算法通過泛化DBSCAN算法中鄰域的概念，以適應(yīng)空間對象的特點。

　　c.OPTICS:OPTICS算法結(jié)合了聚類的自動性和交互性，先生成聚類的次序，可以對不同的聚類設(shè)置不同的參數(shù)，來得到用戶滿意的結(jié)果。

　　d.FDC:FDC算法通過構(gòu)造k-d tree把整個數(shù)據(jù)空間劃分成若干個矩形空間，當空間維數(shù)較少時可以大大提高DBSCAN的效率。

　　e.DBLASD

　　4、圖論聚類法

　　圖論聚類方法解決的第一步是建立與問題相適應(yīng)的圖，圖的節(jié)點對應(yīng)于被分析數(shù)據(jù)的最小單元，圖的邊（或?。?yīng)于最小處理單元數(shù)據(jù)之間的相似性度量。因此，每一個最小處理單元數(shù)據(jù)之間都會有一個度量表達，這就確保了數(shù)據(jù)的局部特性比較易于處理。圖論聚類法是以樣本數(shù)據(jù)的局域連接特征作為聚類的主要信息源，因而其主要優(yōu)點是易于處理局部數(shù)據(jù)的特性。

　　5、網(wǎng)格算法

　　基于網(wǎng)格的方法（grid-based methods），這種方法首先將數(shù)據(jù)空間劃分成為有限個單元（cell）的網(wǎng)格結(jié)構(gòu)，所有的處理都是以單個的單元為對象的。這么處理的一個突出的優(yōu)點就是處理速度很快，通常這是與目標數(shù)據(jù)庫中記錄的個數(shù)無關(guān)的，它只與把數(shù)據(jù)空間分為多少個單元有關(guān)。

　　代表算法有：

　　a.STING：利用網(wǎng)格單元保存數(shù)據(jù)統(tǒng)計信息，從而實現(xiàn)多分辨率的聚類

　　b.WaveCluster：在聚類分析中引入了小波變換的原理，主要應(yīng)用于信號處理領(lǐng)域。（備注：小波算法在信號處理，圖形圖像，加密解密等領(lǐng)域有重要應(yīng)用。）

　　c.CLIQUE：是一種結(jié)合了網(wǎng)格和密度的聚類算法。

　　d.OPTIGRID

　　6、模型算法

　　基于模型的方法（model-based methods），基于模型的方法給每一個聚類假定一個模型，然后去尋找能夠很好的滿足這個模型的數(shù)據(jù)集。這樣一個模型可能是數(shù)據(jù)點在空間中的密度分布函數(shù)或者其它。它的一個潛在的假定就是：目標數(shù)據(jù)集是由一系列的概率分布所決定的。

　　通常有兩種嘗試方向：統(tǒng)計的方案和神經(jīng)網(wǎng)絡(luò)的方案。

　　其中基于統(tǒng)計方案的聚類算法又有如下幾種：

　　a.COBWeb:COBWeb是一個通用的概念聚類方法，它用分類樹的形式表現(xiàn)層次聚類。

　　b.AutoClass：是以概率混合模型為基礎(chǔ)，利用屬性的概率分布來描述聚類，該方法能夠處理混合型的數(shù)據(jù)，但要求各屬性相互獨立。

　　c.CLASSIT

　　而基于神經(jīng)網(wǎng)絡(luò)方案的聚類算法又有：自組織神經(jīng)網(wǎng)絡(luò)SOM（該方法的基本思想是--由外界輸入不同的樣本到人工的自組織映射網(wǎng)絡(luò)中，一開始時，輸入樣本引起輸出興奮細胞的位置各不相同，但自組織后會形成一些細胞群，它們分別代表了輸入樣本，反映了輸入樣本的特征）。

閱讀全文

算法(90083) 算法(90083)
聚類算法(12037) 聚類算法(12037)

卷積神經(jīng)網(wǎng)絡(luò)算法三大類

卷積神經(jīng)網(wǎng)絡(luò)算法三大類卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Network，簡稱CNN）是一種常用的人工神經(jīng)網(wǎng)絡(luò)，它的主要應(yīng)用領(lǐng)域是圖像識別和計算機視覺方面。CNN通過卷積層、池

2023-08-21 16:50:07

273

介紹一種基于最小化平方誤差的聚類算法

物以類聚，「聚類算法」使用最優(yōu)化的算法來計算數(shù)據(jù)點之間的距離，并將它們分組到最近的簇中。

2023-08-09 16:01:29

243

淺談FPGA的六大應(yīng)用領(lǐng)域

FPGA 所能應(yīng)用的領(lǐng)域大概可以分成六大類，下面聽我一一道來。

2023-08-09 10:14:31

279

如何在 Python 中安裝和使用頂級聚類算法

有許多聚類算法可供選擇，對于所有情況，沒有單一的最佳聚類算法。相反，最好探索一系列聚類算法以及每種算法的不同配置。在本教程中，你將發(fā)現(xiàn)如何在 python 中安裝和使用頂級聚類算法。

2023-05-22 09:13:55

171

深度學習聚類的綜述

作者：凱魯嘎吉來源：博客園這篇文章對現(xiàn)有的深度聚類算法進行全面綜述與總結(jié)?，F(xiàn)有的深度聚類算法大都由聚類損失與網(wǎng)絡(luò)損失兩部分構(gòu)成，博客從兩個視角總結(jié)現(xiàn)有的深度聚類算法，即聚類模型與神經(jīng)網(wǎng)絡(luò)模型。1.

2023-01-13 11:11:52

290

10種頂流聚類算法Python實現(xiàn)（附完整代碼）

分享一篇關(guān)于聚類的文章：10種聚類算法和Python代碼。

2023-01-07 09:33:38

566

K-MEANS聚類算法概述及工作原理

K-means 是一種聚類算法，且對于數(shù)據(jù)科學家而言，是簡單且熱門的無監(jiān)督式機器學習(ML)算法之一。

2022-06-06 11:53:55

2540

基于稀疏高維大數(shù)據(jù)的增量模糊聚類算法

2021-06-25 15:49:57

速騰聚創(chuàng)首次發(fā)布LiDAR算法六大模塊助力自動駕駛

、車道標識線檢測、障礙物檢測、動態(tài)物體跟蹤、障礙物分類識別等六大功能模塊，有助于自動駕駛車輛立刻獲得LiDAR感知能力。今年4月份，速騰聚創(chuàng)宣布啟動“普羅米修斯”計劃，致力于向合作伙伴提供一系列軟硬件

2017-10-13 16:08:29

面向SNP的模糊聚類算法及研究綜述

2021-06-08 15:46:45

基于特征和實例遷移的加權(quán)多任務(wù)聚類算法

2021-06-07 15:18:35

評分矩陣與聯(lián)合聚類的推薦算法

當前推薦系統(tǒng)多數(shù)存在推薦準確性低、受稀疏性影響大且穩(wěn)定性差的問題，因此，在 Collus聚類算法的基礎(chǔ)上，提出一種評分矩陣與聯(lián)合聚類的推薦算法。通過 Collus聯(lián)合聚類，利用圖模塊度最化理論分別

2021-06-03 11:01:20

一種基于分塊集成的圖像聚類算法

基于譜聚類的子空間聚類算法已經(jīng)顯示岀良好的效果，但是傳統(tǒng)的子空間聚類算法需要將圖像進行向量化處理，而這種向量化會導致圖像本身攜帶的二維結(jié)構(gòu)信息的丟失。為了減少這種信息的丟失，文中提出了基于分塊集成

2021-05-29 14:20:06

使用新的距離度量方式的增量式聚類算法

針對含有噪聲的高維數(shù)據(jù)的聚類問題，提岀一種使用新的距離度量方式的増量式聚類算法 ANFCM（cp）。由于傳統(tǒng)的模糊C均值聚類算法對初始化聚類中心比較敏感，所提岀的聚類算法將單程FCM的増量機制（稱為

2021-05-12 15:20:51

基于混合蛙跳算法的K-mediods聚類算法

為了降低K- mediods聚類算法的誤差并提高并行優(yōu)化的性能，將混合蛙跳算法運用于聚類和并行優(yōu)化過程。在Kmediods聚類過程中，將K- mediods與聚類簇思想相結(jié)合，對各個聚類簇進行混合

2021-05-08 16:17:18

基于改進的Canopu和共享最近鄰的聚類算法

為輔助銀行機構(gòu)進行精準的服務(wù)推薦，提出了基于改進的Caηopy和共享最近鄰相似度的聚類算法?；谠?b style="color: red">算法對用戶進行細分，針對用戶群特點進行精準服務(wù)推薦。該算法首先采用最大值和最小值對 Canopy算法

2021-04-28 11:44:35

改進的DBSCAN聚類算法在Spark平臺上的應(yīng)用

針對 DBSCAN（ Density- ba<x>sed Spatial Clustering of Applications with Noise）聚類算法內(nèi)存占用率較高的問題，文中

2021-04-26 15:14:49

基于Jaccard相似度的基礎(chǔ)聚類成員預處理算法

基礎(chǔ)聚類成員預處理是聚類集成算法中的一個重要研究步驟。眾多研究表明，基礎(chǔ)聚類成員集合的差異性會影響聚類集成算法性能。當前聚類集成研究圍繞著生成基礎(chǔ)聚類和優(yōu)化集成策略展開，而針對基礎(chǔ)聚類成員的差異性

2021-04-20 10:53:04

一種頭腦風暴算法優(yōu)化的乳腺MR圖像軟子空間聚類算法

傳統(tǒng)的軟子空間聚類算法在對信息量大、強度不均勻、邊界模糊的乳腺MR圖像進行分割時，易受初始聚類中心和噪聲數(shù)據(jù)的影響，導致算法陷入局部最優(yōu)，造成誤分類。針對該問題，提出一種頭腦風暴算法優(yōu)化的乳腺MR

2021-04-11 11:22:06

一種自適應(yīng)的關(guān)聯(lián)融合聚類算法

為解決傳統(tǒng)聚類算法多數(shù)需要預先設(shè)定聚類參數(shù)且無法有效識別異常點和噪聲點的問題，提出一種自適應(yīng)的關(guān)聯(lián)融合聚類算法。采用自然近鄰搜索算法計算數(shù)據(jù)集的密度分布，篩選出具有數(shù)據(jù)結(jié)構(gòu)信息的代表核點，并排

2021-04-01 16:16:49

一種改進的聚類聯(lián)合相似度推薦算法

協(xié)同過濾算法由于推薦效果良好，而被廣泛應(yīng)用于推薦領(lǐng)域，但其在數(shù)據(jù)稀疏及冷啟動的情況下會導致推薦效果明顯下降。在數(shù)據(jù)稀疏情況下，為充分利用用戶的歷史信息以提髙算法的推薦精度，提出一種改進的聚類聯(lián)合相似

2021-03-18 11:17:11

如何在python中安裝和使用頂級聚類算法?

聚類或聚類分析是無監(jiān)督學習問題。它通常被用作數(shù)據(jù)分析技術(shù)，用于發(fā)現(xiàn)數(shù)據(jù)中的有趣模式，例如基于其行為的客戶群。有許多聚類算法可供選擇，對于所有情況，沒有單一的最佳聚類算法。相反，最好探索一系列聚類算法

2021-03-12 18:23:43

1828

常見的幾種聚類算法

這一最著名的聚類算法主要基于數(shù)據(jù)點之間的均值和與聚類中心的聚類迭代而成。它主要的優(yōu)點是十分的高效，由于只需要計算數(shù)據(jù)點與劇類中心的距離，其計算復雜度只有O（n）。

2020-04-15 15:23:29

14904

正確選擇聚類算法的建議

聚類算法十分容易上手，但是選擇恰當?shù)?b style="color: red">聚類算法并不是一件容易的事。

2020-03-15 17:10:00

1663

如何使用拉普拉斯中心性和密度峰值進行無參數(shù)聚類算法的研究

針對聚類算法的聚類中心選取需要人工參與的問題，提出了一種基于拉普拉斯中心性和密度峰值的無參數(shù)聚類算法（ ALPC）。首先，使用拉普拉斯中心性度量對象的中心性；然后，使用正態(tài)分布概率統(tǒng)計方法確定聚類

2019-01-03 15:36:24

如何將多核模糊聚類算法與屬性加權(quán)核模糊聚類算法相結(jié)合

針對多數(shù)據(jù)源或異構(gòu)數(shù)據(jù)集，采用單個核函數(shù)的聚類效果不理想的問題，以及考慮到不同屬性對不同類別重要性的差異，本文提出了一種屬性加權(quán)多核模糊聚類算法（WMKFCM）。該算法將多核模糊聚類算法與屬性加權(quán)核

2018-12-21 15:03:34

如何使用K-Means聚類算法改進的特征加權(quán)算法詳細資料概述

算法，未考慮各個屬性對于最終聚類結(jié)果的影響差異性，這使得聚類的精度有一定的影響。針對上述問題，本文提出一種改進的特征加權(quán)算法。改進算法通過采用信息熵和ReliefF特征選擇算法對特征進行加權(quán)選擇，修正聚類對象間的距離函數(shù)，使算法達到

2018-12-20 10:28:29

如何使用差分隱私保護進行譜聚類算法

針對傳統(tǒng)的聚類算法存在隱私泄露的風險，提出一種基于差分隱私保護的譜聚類算法。該算法基于差分隱私模型，利用累計分布函數(shù)生成滿足拉普拉斯分布的隨機噪聲，將該噪聲添加到經(jīng)過譜聚類算法計算的樣本相似度的函數(shù)

2018-12-14 10:54:26

如何使用概率模型進行非均勻數(shù)據(jù)聚類算法的設(shè)計介紹

數(shù)據(jù)聚類的目標優(yōu)化函數(shù)，并定義了優(yōu)化該函數(shù)的期望最大化（ EM）型聚類算法。分析結(jié)果表明，所提算法可以進行非均勻數(shù)據(jù)的軟子空間聚類。最后，在合成數(shù)據(jù)集與實際數(shù)據(jù)集上進行的實驗結(jié)果表明，所提算法有較高的聚類精度，與現(xiàn)有

2018-12-13 10:57:59

使用模擬退火與貪心策略的平衡聚類算法的介紹

針對現(xiàn)實應(yīng)用通常要求聚類的結(jié)果相對平衡的問題，提出了一種基于模擬退火與貪心策略的平衡聚類算法（BCSG），該算法包括基于模擬退火的初始點選擇算法（SACI）與基于貪心策略的平衡聚類算法（ BCGS

2018-11-28 09:53:06

Python無監(jiān)督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述

無監(jiān)督學習是機器學習技術(shù)中的一類，用于發(fā)現(xiàn)數(shù)據(jù)中的模式。本文介紹用Python進行無監(jiān)督學習的幾種聚類算法，包括K-Means聚類、分層聚類、t-SNE聚類、DBSCAN聚類等。

2018-05-27 09:59:13

29359

基于密度DBSCAN的聚類算法

本文開始介紹了聚類算法概念，其次闡述了聚類算法的分類，最后詳細介紹了聚類算法中密度DBSCAN的相關(guān)概況。

2018-04-26 10:56:41

21028

大數(shù)據(jù)譜聚類算法

面對結(jié)構(gòu)復雜的數(shù)據(jù)集，譜聚類是一種靈活而有效的聚類方法，它基于譜圖理論，通過將數(shù)據(jù)點映射到一個由特征向量構(gòu)成的低維空間，優(yōu)化數(shù)據(jù)的結(jié)構(gòu)，得到令人滿意的聚類結(jié)果，但在譜聚類的過程中，特征分解的計算復雜度通常為O（n3），限制了譜聚類算法在大數(shù)據(jù)中的應(yīng)用。

2018-03-01 10:10:17

基于離散粒子群優(yōu)化算法的改進圖聚類算法

第四方物流企業(yè)聯(lián)盟建立問題是研究如何將區(qū)域內(nèi)物流企業(yè)以一種高效、低聯(lián)系代價的方式建立合作聯(lián)盟的問題。針對該問題提出一種基于離散粒子群優(yōu)化算法的改進圖聚類算法，有助于降低合作聯(lián)盟之間的聯(lián)系代價。通過

2018-02-24 11:11:45

k means聚類算法實例

與分類不同，分類是示例式學習，要求分類前明確各個類別，并斷言每個元素映射到一個類別，而聚類是觀察式學習，在聚類前可以不知道類別甚至不給定類別數(shù)量，是無監(jiān)督學習的一種。目前聚類廣泛應(yīng)用于統(tǒng)計學、生物學、數(shù)據(jù)庫技術(shù)和市場營銷等領(lǐng)域，相應(yīng)的算法也非常的多。

2018-02-12 16:42:35

14535

關(guān)聯(lián)函數(shù)的數(shù)據(jù)流聚類算法

傳統(tǒng)數(shù)據(jù)流聚類算法大多基于距離或密度，聚類質(zhì)量和處理效率都不高。針對以上問題，提出了一種基于關(guān)聯(lián)函數(shù)的數(shù)據(jù)流聚類算法。首先，將數(shù)據(jù)點以物元的形式模型化，建立解決問題所需要的關(guān)聯(lián)函數(shù)；其次，計算關(guān)聯(lián)

2018-02-10 11:54:34

基于最優(yōu)投影的半監(jiān)督聚類算法

針對譜聚類算法在解決高維、大數(shù)據(jù)量的聚類問題時出現(xiàn)的效率不高和準確率明顯下降的問題進行了研究，并在此研究基礎(chǔ)上結(jié)合最優(yōu)投影理論和Nystrom抽樣提出了基于最優(yōu)投影的半監(jiān)督譜聚類算法

2018-01-14 11:54:58

面向?qū)嶓w識別的聚類算法

識別的聚類算法來彌補這個缺失．利用數(shù)據(jù)對象及其相似度構(gòu)建帶權(quán)重的數(shù)據(jù)對象相似圖，聚類過程中，利用相似圖上重啟式隨機游走來動態(tài)地計算類簇與結(jié)點的相似度．聚類的基本邏輯是，類簇迭代地吸收離它最近的結(jié)點．提出數(shù)

2018-01-09 15:52:51

基于距離最大化和缺失數(shù)據(jù)聚類的填充算法

通過對基于K-means聚類的缺失值填充算法的改進，文中提出了基于距離最大化和缺失數(shù)據(jù)聚類的填充算法。首先，針對原填充算法需要提前輸入聚類個數(shù)這一缺點，設(shè)計了改進的K-means聚類算法：使用數(shù)據(jù)間

2018-01-09 10:56:56

基于近鄰傳播的遷移聚類算法

在目標域可利用數(shù)據(jù)匱乏的場景下，傳統(tǒng)聚類算法的性能往往會下降，在該場景下，通過抽取源域中的有用知識用于指導目標域?qū)W習以得到更為合適的類別信息和聚類性能，是一種有效的學習策略．借此提出一種基于近鄰傳播

2018-01-07 09:34:44

基于相似度的聚類算法

基于相似度的聚類算法，該算法結(jié)合區(qū)間值模糊軟集的特性，著重對給出評價對象的具有相似知識水平的專家進行聚類，同時討論了算法的計算復雜度。最后通過實例說明該算法能有效地處理專家聚類問題。

2018-01-05 16:15:27

中點密度函數(shù)的模糊聚類算法

針對傳統(tǒng)模糊C一均值（ FCM）聚類算法初始聚類中心不確定，且需要人為預先設(shè)定聚類類別數(shù)，從而導致結(jié)果不準確的問題，提出了一種基于中點密度函數(shù)的模糊聚類算法。首先，結(jié)合逐步回歸思想作為初始聚類中心

2017-12-26 15:54:20

基于歐氏距離的加權(quán)低秩子空間聚類算法

針對稀疏子空間聚類和最小二乘回歸子空間聚類求得的表示系數(shù)存在類內(nèi)過于稀疏和類間過于稠密的問題，利用范數(shù)，提出一種基于歐氏距離的且具有組效應(yīng)的加權(quán)低秩子空間聚類算法，該算法通過基于歐氏距離的加權(quán)方式

2017-12-25 14:19:39

基于煙花算法的軟子空間MR圖像聚類算法

現(xiàn)有的軟子空間聚類算法在分割MR圖像時易受隨機噪聲的影響，而且算法因依賴于初始聚類中心的選擇而容易陷入局部最優(yōu)，導致分割效果不理想．針對這一問題，提出一種基于煙花算法的軟子空間MR圖像聚類算法．算法

2017-12-25 11:43:11

一種基于MapReduce的圖結(jié)構(gòu)聚類算法

圖結(jié)構(gòu)聚類（SCAN）是一種著名的基于密度的圖聚類算法。該算法不僅能夠找到圖中的聚類結(jié)構(gòu)，而且還能發(fā)現(xiàn)圖中的Hub節(jié)點和離群節(jié)點。然而，隨著圖數(shù)據(jù)規(guī)模越來越大，傳統(tǒng)的SCAN算法的復雜度為O

2017-12-19 11:05:34

基于密度差分的自動聚類算法

聚類作為無監(jiān)督學習技術(shù)，已在實際中得到了廣泛的應(yīng)用，但是對于帶有噪聲的數(shù)據(jù)集，一些主流算法仍然存在著噪聲去除不徹底和聚類結(jié)果不準確等問題．本文提出了一種基于密度差分的自動聚類算法（CDD

2017-12-18 11:16:57

基于層次劃分的密度優(yōu)化聚類算法

針對傳統(tǒng)的聚類算法對數(shù)據(jù)集反復聚類，且在大型數(shù)據(jù)集上計算效率欠佳的問題，提出一種基于層次劃分的最佳聚類數(shù)和初始聚類中心確定算法基于層次劃分密度的聚類優(yōu)化（ CODHD）。該算法基于層次劃分，對計算

2017-12-17 11:27:40

基于改進核模糊C均值類間極大化聚類MKFCM算法

基于改進核模糊C均值類間極大化聚類（ MKFCM）算法。該算法考慮了類內(nèi)元素和類間元素的聯(lián)系，引入了高維特征空間的類間極大懲罰項和調(diào)控因子，拉大類中心間的距離，使得邊界處的樣本得到了較好的劃分。在各模擬數(shù)據(jù)集的實驗中，該算

2017-12-15 10:52:53

基于布谷鳥搜索的K-means聚類算法

針對原始K-means聚類算法受初始聚類中心影響過大以及容易陷入局部最優(yōu)的不足，提出一種基于改進布谷鳥搜索（cs）的K-means聚類算法（ACS-K-means）。其中，自適應(yīng)CS（ ACS）算法

2017-12-13 17:24:06

一種新的基于流行距離的譜聚類算法

本文提出了一種新的基于流行距離的譜聚類算法，這是一種新型的聚類分析算法。不僅能夠?qū)θ我獾姆且?guī)則形狀的樣本空間進行聚類，而且能獲得全局最優(yōu)解。文章以聚類算法的相似性度量作為切入點，對傳統(tǒng)的相似性測度

2017-12-07 14:53:03

基于像素聚類進行圖像分割的算法

B型心臟超聲圖像分割是計算心功能參數(shù)前重要的一步。針對超聲圖像的低分辨率影響分割精度及基于模型的分割算法需要大樣本訓練集的問題，結(jié)合B型心臟超聲圖像的先驗知識，提出了一種基于像素聚類進行圖像分割

2017-12-06 16:44:11

基于時空模式的軌跡數(shù)據(jù)聚類算法

針對軌跡聚類算法在相似性度量中多以空間特征為度量標準，缺少對時間特征的度量，提出了一種基于時空模式的軌跡數(shù)據(jù)聚類算法。該算法以劃分再聚類框架為基礎(chǔ)，首先利用曲線邊緣檢測方法提取軌跡特征點；然后根據(jù)

2017-12-05 14:07:58

一種新的人工魚群混合聚類算法

人工魚群是一種隨機搜索優(yōu)化算法，具有較快的收斂速度，對問題的機理模型與描述無嚴格要求，具有廣泛的應(yīng)用范圍。本文在該算法的基礎(chǔ)上，結(jié)合傳統(tǒng)的K-means聚類方法，提出了一種新的人工魚群混合聚類算法

2017-12-04 16:18:15

基于Delaunay三角網(wǎng)的聚類算法

Mundur等提出了一種基于Delaunay三角網(wǎng)的聚類算法，并將其應(yīng)用于視頻幀的多維特征數(shù)據(jù)的聚類以生成視頻摘要，取得了較好的效果。但是，該算法計算量太大，導致效率不高。為提高該算法的效率，以

2017-12-04 10:25:41

基于Spark的動態(tài)聚類算法研究

針對數(shù)據(jù)流的聚類算法，近年來取得了有效的進展，出現(xiàn)了許多卓有成效的算法。隨著信息采集技術(shù)的進步，需要處理的數(shù)據(jù)量越來越大，需要研究針對數(shù)據(jù)流的并行聚類算法。本文基于串行的數(shù)據(jù)流聚類算法

2017-12-04 09:22:51

基于人群疏散仿真的折半聚類算法

運用社會力模型（ SFM）模擬人群疏散之前，需要先對人群進行聚類分組；然而，五中心聚類（k-medoids）和統(tǒng)計信息網(wǎng)格聚類（ STING）這兩大傳統(tǒng)聚類算法，在聚類效率和準確率上都不能滿足要求

2017-12-03 10:53:04

K均值聚類算法的MATLAB實現(xiàn)

K-means算法是最簡單的一種聚類算法。算法的目的是使各個樣本與所在類均值的誤差平方和達到最?。ㄟ@也是評價K-means算法最后聚類效果的評價標準）

2017-12-01 14:07:33

19244

基于改進人工蜂群的聚類算法

模糊C均值聚類算法在數(shù)據(jù)挖掘領(lǐng)域有著廣泛的使用背景，而對初始點的敏感和較差的搜索能力，限制了算法的進一步推廣應(yīng)用。人工蜂群算法具有對初始點不敏感、適應(yīng)能力強和搜索能力強等優(yōu)點，并且針對人工蜂群算法

2017-11-29 17:22:21

一種改進的人工蜂群算法與KECM迭代結(jié)合的聚類算法

針對核模糊C均值（ KFCM）算法對初始聚類中心敏感、易陷入局部最優(yōu)的問題，利用人工蜂群（ABC）算法的構(gòu)架簡單、全局收斂速度快的優(yōu)勢，提出了一種改進的人工蜂群算法（ IABC）與KFCM迭代相結(jié)合

2017-11-28 16:14:04

基于密度的K-means算法在聚類數(shù)目中應(yīng)用

針對傳統(tǒng)的K-means算法無法預先明確聚類數(shù)目，對初始聚類中心選取敏感且易受離群孤點影響導致聚類結(jié)果穩(wěn)定性和準確性欠佳的問題，提出一種改進的基于密度的K-means算法。該算法首先基于軌跡數(shù)據(jù)分布

2017-11-25 11:35:38

基于RPCA的預測子空間聚類算法

預測子空間聚類PSC算法由于建立在PCA模型下，無法魯棒地進行主元分析，導致在面對帶有強噪聲的數(shù)據(jù)時，聚類性能受到嚴重影響。為了提高PSC算法對噪聲的魯棒性，利用近年來受到廣泛關(guān)注的RPCA分解技術(shù)

2017-11-22 16:53:37

一種以遺傳模擬退火算法的數(shù)據(jù)流聚類

針對套用傳統(tǒng)的聚類方法對數(shù)據(jù)流的聚類是行不通的這一問題，提出一種以遺傳模擬退火算法為基礎(chǔ)的模糊C均值聚類算法（SACA_FCM）對數(shù)據(jù)流進行聚類。SACAFCM算法有效地避免了傳統(tǒng)的模糊C均值聚類

2017-11-22 11:51:13

基于網(wǎng)格的快速搜尋密度峰值的聚類算法優(yōu)化研究

CFSFDP是基于密度的新型聚類算法，可聚類非球形數(shù)據(jù)集，具有聚類速度快、實現(xiàn)簡單等優(yōu)點。然而該算法在指定全局密度閾值d時未考慮數(shù)據(jù)空間分布特性，導致聚類質(zhì)量下降，且無法對多密度峰值的數(shù)據(jù)集準確聚類

2017-11-21 15:08:57

一種改進的凝聚型層次聚類算法

在比特流未知協(xié)議識別過程中，針對如何將得到的多協(xié)議數(shù)據(jù)幀分為單協(xié)議數(shù)據(jù)幀這一問題，提出了一種改進的凝聚型層次聚類算法。該算法以傳統(tǒng)的凝聚型層次聚類算法思想為基礎(chǔ)，結(jié)合比特流數(shù)據(jù)幀的特征，定義了數(shù)據(jù)幀

2017-11-21 08:58:25

基于離散量改進k-means初始聚類中心選擇的算法

傳統(tǒng)kmeans算法由于初始聚類中心的選擇是隨機的，因此會使聚類結(jié)果不穩(wěn)定。針對這個問題，提出一種基于離散量改進k-means初始聚類中心選擇的算法。算法首先將所有對象作為一個大類，然后不斷從對象

2017-11-20 10:03:23

一種改進的BIRCH算法聚類方法

為解決傳統(tǒng)BIRCH算法對數(shù)據(jù)對象輸入順序敏感、聚類結(jié)果不穩(wěn)定的問題，提出了一種改進的BIRCH算法。該算法將雷達信號偵察數(shù)據(jù)的脈沖載頻、脈沖重復間隔和脈沖寬度分別進行聚類，根據(jù)工程應(yīng)用中各參數(shù)

2017-11-10 15:52:18

基于C均值聚類的定位算法

為了提高WSN節(jié)點定位精度，針對測距誤差對定位結(jié)果的影響，提出基于模糊C均值聚類的定位算法。算法首先利用多邊定位算法得到若干個定位結(jié)果，利用模糊C均值聚類算法對定位結(jié)果進行聚類分析，然后，根據(jù)聚類

2017-11-09 17:47:13

基于MCL與Chameleon的混合聚類算法

馬爾科夫聚類算法（ Markov Cluster Algorithm，MCL）是一種快速且可擴展的無監(jiān)督圖聚類算法，Chameleon是一種新的層次聚類算法。但MCL由于過擬合會產(chǎn)生很多小聚類

2017-10-31 18:58:21

云存儲中大數(shù)據(jù)優(yōu)化粒子群聚類算法（基于模糊C均值聚類）

。提出一種基于優(yōu)化粒子群算法的云存儲中大數(shù)據(jù)優(yōu)化聚類算法，進行了云存儲大數(shù)據(jù)聚類的原理分析，在傳統(tǒng)的模糊C均值聚類的基礎(chǔ)上，采用粒子群聚類算法進行大數(shù)據(jù)聚類算法改進設(shè)計，把數(shù)據(jù)的分割轉(zhuǎn)化為對空間的分割，得到

2017-10-28 12:46:53