您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

Spark分布式下的模糊C均值算法

大?。?/span>0.88 MB 人氣: 2017-12-23 需要積分:2

  針對(duì)聚類算法需要處理數(shù)據(jù)集的規(guī)模越來(lái)越大、時(shí)效性要求越來(lái)越高,對(duì)算法的大數(shù)據(jù)適應(yīng)能力和性能要求更高的問(wèn)題,提出一種在Spark分布式內(nèi)存計(jì)算平臺(tái)下的模糊C均值(FCM)算法Spark-FCM。首先對(duì)矩陣通過(guò)水平分割實(shí)現(xiàn)分布式存儲(chǔ),不同向量存儲(chǔ)在不同節(jié)點(diǎn);然后基于FCM算法的計(jì)算特點(diǎn),設(shè)計(jì)了分布式和緩存敏感的常用矩陣操作,包括乘法、轉(zhuǎn)置和加法等;最后基于矩陣操作和Spark平臺(tái)特點(diǎn),設(shè)計(jì)了Spark-FCM算法,主要數(shù)據(jù)結(jié)構(gòu)采用分布式矩陣存儲(chǔ),具有節(jié)點(diǎn)間數(shù)據(jù)移動(dòng)少和每個(gè)步驟分布式計(jì)算特點(diǎn)。通過(guò)在單機(jī)和集群環(huán)境下測(cè)試,算法具有良好的可擴(kuò)展性,并可以適應(yīng)大規(guī)模數(shù)據(jù)集,算法性能與數(shù)據(jù)量成線性關(guān)系,集群環(huán)境下性能比單機(jī)提高2-3倍。

Spark分布式下的模糊C均值算法

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?