數(shù)據(jù)挖掘的功能
1、數(shù)據(jù)分類
數(shù)據(jù)分類為數(shù)據(jù)挖掘中常見的功能之一,顧名思義即是將分析對(duì)象依不同的屬性分類加以定義,建立不同的類組。數(shù)據(jù)挖掘中的分類是指針對(duì)未發(fā)生的結(jié)果進(jìn)行預(yù)測(cè)分類,主要包括歸納和推論兩步驟,其主要目的在于提高分類的準(zhǔn)確度,建立分類規(guī)則,再評(píng)估準(zhǔn)則的優(yōu)劣。常用“判定樹”算法。
2、數(shù)據(jù)估計(jì)
根據(jù)不同相關(guān)屬性數(shù)據(jù)的連續(xù)性數(shù)值,找出各屬性間的關(guān)聯(lián)性,以了解并獲得某一特定屬性未知的連續(xù)性數(shù)值,常用“回歸分析”及“類神經(jīng)網(wǎng)絡(luò)算法”。
3、數(shù)據(jù)預(yù)測(cè)
預(yù)測(cè)工作的目的在于以其他屬性的值為基礎(chǔ)來預(yù)測(cè)特定屬性的值。而這個(gè)被預(yù)測(cè)屬性的值通常稱為目標(biāo)變量或是因變量;而其他屬性則稱為解釋變量或自變量,預(yù)測(cè)的主要方法在于建立數(shù)據(jù)當(dāng)中因變量與自變量間的關(guān)系。常用“回歸分析”“時(shí)間序列分析”及“類神經(jīng)網(wǎng)絡(luò)”算法。
4、數(shù)據(jù)關(guān)聯(lián)分組
數(shù)據(jù)關(guān)聯(lián)分組主要用來發(fā)現(xiàn)數(shù)據(jù)中特征屬性間具有高度關(guān)聯(lián)性的一種模式,其所發(fā)現(xiàn)的模式通常是用規(guī)則來表現(xiàn)。常用“關(guān)聯(lián)規(guī)則(又稱購(gòu)物藍(lán)分析)”算法。
5、數(shù)據(jù)聚類
數(shù)據(jù)聚類主要是利用數(shù)據(jù)中類似或相同的項(xiàng)目,將同構(gòu)型較高的數(shù)據(jù)區(qū)隔為不同的聚類,聚類內(nèi)數(shù)據(jù)相似度越高越好,聚類間差異度越大越好。在一大群的研究對(duì)象中,根據(jù)不同的研究目的必定會(huì)有異質(zhì)化的現(xiàn)象,但異質(zhì)化的現(xiàn)象可能是幾個(gè)同質(zhì)化的群組所造成,數(shù)據(jù)聚類的主要目的便是將不同的同質(zhì)化的組別差異找出來,常用“判別分析”與聚類分析“算法。
-
數(shù)據(jù)挖掘
+關(guān)注
關(guān)注
1文章
406瀏覽量
24179
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論