0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

spss聚類分析步驟

倩倩 ? 來(lái)源:網(wǎng)絡(luò)整理 ? 2018-02-24 08:56 ? 次閱讀

spss是一個(gè)非常好用的統(tǒng)計(jì)分析軟件,spss有一個(gè)聚類分析的功能哦,但是很多人不知道spss聚類分析功能怎么使用?spss聚類分析是一個(gè)將case分析的數(shù)據(jù)的功能哦

spss聚類分析使用步驟教程

1、依次點(diǎn)擊:analyse--classify--hierarchical cluster,打開(kāi)分層聚類對(duì)話框。如圖1所示

spss聚類分析步驟

2、在聚類分析對(duì)話框中,將聚類用到的變量都放到variables中。如圖2所示

spss聚類分析步驟

3、將地區(qū)變量放入case標(biāo)簽中,他的意思是每一個(gè)數(shù)據(jù)都用地區(qū)這個(gè)值來(lái)命名。如圖3所示

spss聚類分析步驟

4、點(diǎn)擊plot按鈕,打開(kāi)對(duì)話框,設(shè)置要輸出的圖。如圖4所示

spss聚類分析步驟

5、在打開(kāi)的對(duì)話框中,勾選dendrogram,然后點(diǎn)擊continue按鈕。這個(gè)dendrogram是層次聚類譜系圖,最后我們還會(huì)分析這個(gè)圖。如圖5所示

spss聚類分析步驟

6、點(diǎn)擊method按鈕,設(shè)置聚類的方法。如圖6所示

spss聚類分析步驟

7、通常我們用到的聚類方法是wards method,接著我們需要把變量轉(zhuǎn)換成z分?jǐn)?shù),點(diǎn)擊continue按鈕。如圖7所示

spss聚類分析步驟

8、點(diǎn)擊save按鈕,填寫(xiě)希望保存的聚類類別數(shù)范圍3--8,據(jù)此選項(xiàng),spss將在數(shù)據(jù)編輯窗口中添加7個(gè)變量,分別標(biāo)明聚類數(shù)位3--8類情況下各省市所屬的類。如圖8所示

spss聚類分析步驟

9、設(shè)置輸出的聚類類別數(shù)范圍3--8,點(diǎn)擊continue按鈕。如圖9所示

spss聚類分析步驟

10、點(diǎn)擊ok按鈕,開(kāi)始輸出數(shù)據(jù)處理的結(jié)果。如圖10所示

spss聚類分析步驟

11、你看到的下面的這個(gè)表格叫做聚類過(guò)程表,其內(nèi)容并不是經(jīng)常被關(guān)注,因?yàn)榇蟛糠謱?shí)際應(yīng)用中,聚類的具體過(guò)程是被忽略的。但是聚類系數(shù)可以幫助我們判斷將數(shù)據(jù)分為幾類最合適,判斷的方法是,相鄰的兩個(gè)數(shù)據(jù)變化的幅度顯著大于前面的系數(shù)的變化范圍,這時(shí)候分類在這里就是最好的。如圖11所示

spss聚類分析步驟

12、最后是層次聚類譜系圖,從這個(gè)圖中可看到聚類的過(guò)程,根據(jù)你的需求選擇分類的組數(shù)。如圖12所示

spss聚類分析步驟

以上就是spss聚類分析功能的使用方法哦,大家安裝步驟一步步來(lái)就會(huì)操作了呢!

案例數(shù)據(jù)源:

有20種12盎司啤酒成分和價(jià)格的數(shù)據(jù),變量包括啤酒名稱、熱量、鈉含量、酒精含量、價(jià)格。數(shù)據(jù)來(lái)自《SPSS for Windows 統(tǒng)計(jì)分析》data11-03。點(diǎn)擊下載

spss聚類分析步驟

【一】問(wèn)題一:選擇那些變量進(jìn)行聚類?——采用“R型聚類”

1、現(xiàn)在我們有4個(gè)變量用來(lái)對(duì)啤酒分類,是否有必要將4個(gè)變量都納入作為分類變量呢?熱量、鈉含量、酒精含量這3個(gè)指標(biāo)是要通過(guò)化驗(yàn)員的辛苦努力來(lái)測(cè)定,而且還有花費(fèi)不少成本,如果都納入分析的話,豈不太麻煩太浪費(fèi)?所以,有必要對(duì)4個(gè)變量進(jìn)行降維處理,這里采用spss R型聚類(變量聚類),對(duì)4個(gè)變量進(jìn)行降維處理。輸出“相似性矩陣”有助于我們理解降維的過(guò)程。

spss聚類分析步驟

2、4個(gè)分類變量量綱各自不同,這一次我們先確定用相似性來(lái)測(cè)度,度量標(biāo)準(zhǔn)選用pearson系數(shù),聚類方法選最遠(yuǎn)元素,此時(shí),涉及到相關(guān),4個(gè)變量可不用標(biāo)準(zhǔn)化處理,將來(lái)的相似性矩陣?yán)锏臄?shù)字為相關(guān)系數(shù)。若果有某兩個(gè)變量的相關(guān)系數(shù)接近1或-1,說(shuō)明兩個(gè)變量可互相替代。

spss聚類分析步驟

3、只輸出“樹(shù)狀圖”就可以了,個(gè)人覺(jué)得冰柱圖很復(fù)雜,看起來(lái)沒(méi)有樹(shù)狀圖清晰明了。從proximity matrix表中可以看出熱量和酒精含量?jī)蓚€(gè)變量相關(guān)系數(shù)0.903,最大,二者選其一即可,沒(méi)有必要都作為聚類變量,導(dǎo)致成本增加。至于熱量和酒精含量選擇哪一個(gè)作為典型指標(biāo)來(lái)代替原來(lái)的兩個(gè)變量,可以根據(jù)專業(yè)知識(shí)或測(cè)定的難易程度決定。(與因子分析不同,是完全踢掉其中一個(gè)變量以達(dá)到降維的目的。)這里選用酒精含量,至此,確定出用于聚類的變量為:酒精含量,鈉含量,價(jià)格。

spss聚類分析步驟

【二】問(wèn)題二:20中啤酒能分為幾類?——采用“Q型聚類”

1、現(xiàn)在開(kāi)始對(duì)20中啤酒進(jìn)行聚類。開(kāi)始不確定應(yīng)該分為幾類,暫時(shí)用一個(gè)3-5類范圍來(lái)試探。Q型聚類要求量綱相同,所以我們需要對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化,這一回用歐式距離平方進(jìn)行測(cè)度。

spss聚類分析步驟

2、主要通過(guò)樹(shù)狀圖和冰柱圖來(lái)理解類別。最終是分為4類還是3類,這是個(gè)復(fù)雜的過(guò)程,需要專業(yè)知識(shí)和最初的目的來(lái)識(shí)別。我這里試著確定分為4類。選擇“保存”,則在數(shù)據(jù)區(qū)域內(nèi)會(huì)自動(dòng)生成聚類結(jié)果。

spss聚類分析步驟

【三】問(wèn)題三:用于聚類的變量對(duì)聚類過(guò)程、結(jié)果又貢獻(xiàn)么,有用么?——采用“單因素方差分析”

1、聚類分析除了對(duì)類別的確定需討論外,還有一個(gè)比較關(guān)鍵的問(wèn)題就是分類變量到底對(duì)聚類有沒(méi)有作用有沒(méi)有貢獻(xiàn),如果有個(gè)別變量對(duì)分類沒(méi)有作用的話,應(yīng)該剔除。

2、這個(gè)過(guò)程一般用單因素方差分析來(lái)判斷。注意此時(shí),因子變量選擇聚為4類的結(jié)果,而將三個(gè)聚類變量作為因變量處理。方差分析結(jié)果顯示,三個(gè)聚類變量sig值均極顯著,我們用于分類的3個(gè)變量對(duì)分類有作用,可以使用,作為聚類變量是比較合理的。

spss聚類分析步驟

【四】問(wèn)題四:聚類結(jié)果的解釋?——采用”均值比較描述統(tǒng)計(jì)“

1、聚類分析最后一步,也是最為困難的就是對(duì)分出的各類進(jìn)行定義解釋,描述各類的特征,即各類別特征描述。這需要專業(yè)知識(shí)作為基礎(chǔ)并結(jié)合分析目的才能得出。

2、我們可以采用spss的means均值比較過(guò)程,或者excel的透視表功能對(duì)各類的各個(gè)指標(biāo)進(jìn)行描述。其中,report報(bào)表用于描述聚類結(jié)果。對(duì)各類指標(biāo)的比較來(lái)初步定義類別,主要根據(jù)專業(yè)知識(shí)來(lái)判定。這里到此為止。

spss聚類分析步驟

以上過(guò)程涉及到spss層次聚類中的Q型聚類和R型聚類,單因素方差分析,means過(guò)程等,是一個(gè)很不錯(cuò)的多種分析方法聯(lián)合使用的案例。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SPSS
    +關(guān)注

    關(guān)注

    1

    文章

    10

    瀏覽量

    9895
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    labview可不可以與SPSS進(jìn)行連接通信呢

    在網(wǎng)上看到LABview可以和origin進(jìn)行通信了,想問(wèn)一下labview能不能喝spss進(jìn)行通信呢,將得到的數(shù)據(jù)直接進(jìn)行聚類分析
    發(fā)表于 09-18 15:49

    LabVIEW與SPSS有接口嗎?

    想用SPSS來(lái)分析數(shù)據(jù),然后利用LabVIEW的顯示界面來(lái)顯示,如何讓他們兩個(gè)建立聯(lián)系啊?求助大神!
    發(fā)表于 10-21 09:07

    Matlab提供的兩種聚類分析

    Matlab提供的兩種聚類分析提供源程序代碼
    發(fā)表于 04-29 11:21

    SPSS統(tǒng)計(jì)分析軟件在氣、水層識(shí)別中的應(yīng)用

    SPSS 統(tǒng)計(jì)分析軟件在氣、水層識(shí)別中的應(yīng)用:本文結(jié)合測(cè)井、錄井、完井測(cè)試等資料的氣、水顯示情況,選取新場(chǎng)地區(qū)某氣藏典型井,使用統(tǒng)計(jì)軟件SPSS進(jìn)行逐步判別分析,建立該地區(qū)
    發(fā)表于 10-19 21:04 ?18次下載

    技術(shù)資料:IBM SPSS Modeler: 強(qiáng)大的預(yù)測(cè)性分析

    技術(shù)資料:IBM SPSS Modeler: 強(qiáng)大的預(yù)測(cè)性分析平臺(tái)
    發(fā)表于 12-28 11:13 ?0次下載

    基于主動(dòng)學(xué)習(xí)的微博聚類分析

    基于主動(dòng)學(xué)習(xí)的微博聚類分析_朱麗
    發(fā)表于 01-07 16:24 ?0次下載

    基于Hadoop與聚類分析的網(wǎng)絡(luò)日志分析模型

    針對(duì)海量web日志數(shù)據(jù)在存儲(chǔ)和計(jì)算方面存在的問(wèn)題,結(jié)合當(dāng)前的大數(shù)據(jù)技術(shù),提出一種基于Hadoop與聚類分析的網(wǎng)絡(luò)日志分析模型。利用Hadoop中的MapReduce編程模型對(duì)海量Web日志進(jìn)行處理
    發(fā)表于 12-07 15:40 ?0次下載
    基于Hadoop與<b class='flag-5'>聚類分析</b>的網(wǎng)絡(luò)日志<b class='flag-5'>分析</b>模型

    R與SPSS、SAS相比較_Python 在數(shù)據(jù)分析工作中的地位與R語(yǔ)言、SAS、SPSS 比較如何?

    能夠用來(lái)做統(tǒng)計(jì)分析的軟件和程序很多,目前應(yīng)用比較廣泛的包括:SPSS, SAS、R語(yǔ)言,Matlab,S-PLUS,S-Miner等。R與SPSS、SAS相比較,擁有非常突出的優(yōu)勢(shì),如下所述
    發(fā)表于 01-05 17:07 ?4.9w次閱讀
    R與<b class='flag-5'>SPSS</b>、SAS相比較_Python 在數(shù)據(jù)<b class='flag-5'>分析</b>工作中的地位與R語(yǔ)言、SAS、<b class='flag-5'>SPSS</b> 比較如何?

    spss聚類分析樹(shù)狀圖

    要的分類效果。SPSS軟件可以在不知道最終類別個(gè)數(shù)的情況下,畫(huà)出完整的聚類分析譜系圖,因此下面用SPSS軟件對(duì)河南省18個(gè)市進(jìn)行聚類分析
    的頭像 發(fā)表于 02-12 15:59 ?4.7w次閱讀

    聚類分析的簡(jiǎn)單案例

    聚類分析經(jīng)常和有監(jiān)督分類相混淆,有監(jiān)督分類是為定義的分類響應(yīng)變量預(yù)測(cè)分組或者類別關(guān)系。而聚類分析,從另一方面考慮,它是一種無(wú)監(jiān)督分類技術(shù)。它能夠在所有輸入變量的基礎(chǔ)上識(shí)別出數(shù)據(jù)集中的分組和類別信息
    的頭像 發(fā)表于 02-23 10:00 ?7.5w次閱讀
    <b class='flag-5'>聚類分析</b>的簡(jiǎn)單案例

    聚類分析方法有什么好處

    近些年來(lái),數(shù)值分類學(xué)逐漸形成了一個(gè)新的分支,稱為聚類分析,聚類分析適用于很多不同類型的數(shù)據(jù)集合,很多研究領(lǐng)域,如工程、生物、醫(yī)藥、語(yǔ)言、人類學(xué)、心理學(xué)和市場(chǎng)學(xué)等,都對(duì)聚類技術(shù)的發(fā)展和應(yīng)用起到了推動(dòng)作用。
    的頭像 發(fā)表于 02-23 11:16 ?3.4w次閱讀

    數(shù)據(jù)挖掘技術(shù)之聚類分析教程資料ppt下載

    數(shù)據(jù)挖掘技術(shù)之聚類分析教程資料ppt下載
    發(fā)表于 04-08 11:41 ?6次下載

    基于Python的聚類分析及其應(yīng)用簡(jiǎn)介

    基于Python的聚類分析及其應(yīng)用簡(jiǎn)介。
    發(fā)表于 05-28 10:54 ?8次下載

    機(jī)器學(xué)習(xí)之分類分析聚類分析

    數(shù)據(jù)挖掘中應(yīng)用較多的技術(shù)機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)主流算法包括三種:關(guān)聯(lián)分析、分類分析、聚類分析
    的頭像 發(fā)表于 03-27 14:13 ?4433次閱讀

    數(shù)據(jù)分析除了spss還有什么

    數(shù)據(jù)分析是當(dāng)今世界中一個(gè)非常重要的領(lǐng)域,它涉及到從大量數(shù)據(jù)中提取有用信息、發(fā)現(xiàn)模式和趨勢(shì),并為決策提供支持。SPSS(Statistical Package for the Social
    的頭像 發(fā)表于 07-05 15:01 ?452次閱讀