0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)的高級分析算法有哪些

h1654155282.3538 ? 來源:科技世界雜談 ? 作者:科技世界雜談 ? 2021-01-17 10:37 ? 次閱讀

當(dāng)涉及大數(shù)據(jù)和高級分析的話題時(shí),熱鬧非凡。頂級分析公司就這些概念所采取的措施可以為數(shù)字時(shí)代的企業(yè)帶來革命性的變化進(jìn)行了廣泛的撰寫。世界各地的《財(cái)富》 500強(qiáng)公司都在大數(shù)據(jù)和高級分析方面進(jìn)行了大量投資,并從中受益匪淺。問題在于,許多公司也希望取得令人難以置信的成果,但不確定確切的起點(diǎn)。

高級分析通常始于單個(gè)用例。這包括應(yīng)用新的數(shù)據(jù)轉(zhuǎn)換和分析方法來發(fā)現(xiàn)數(shù)據(jù)中以前未知的趨勢和模式。當(dāng)將此新信息應(yīng)用于業(yè)務(wù)流程和操作規(guī)范時(shí),它就有可能改變您的業(yè)務(wù)。

為了從數(shù)據(jù)中獲取更大的價(jià)值,請使用以下五類算法。

線性回歸

線性回歸是高級分析的最基本算法之一。這也使其成為使用最廣泛的之一。人們可以輕松地查看其工作方式以及輸入數(shù)據(jù)與輸出數(shù)據(jù)的關(guān)系。

線性回歸使用兩組連續(xù)定量度量之間的關(guān)系。第一組稱為預(yù)測變量或自變量。另一個(gè)是響應(yīng)或因變量。線性回歸的目標(biāo)是以公式的形式識別關(guān)系,該公式根據(jù)自變量描述因變量。一旦這種關(guān)系被量化,就可以為自變量的任何實(shí)例預(yù)測因變量。

時(shí)間是最常用的自變量之一。無論您的自變量是收入,成本,客戶,使用或生產(chǎn)力,如果您可以定義其與時(shí)間的關(guān)系,那么可以使用線性回歸預(yù)測值。

?邏輯回歸

Logistic回歸聽起來與線性回歸相似,但實(shí)際上專注于涉及分類而不是定量預(yù)測的問題。在這里,輸出變量值是離散且有限的,而不是連續(xù)的,并且具有無限值,就像線性回歸一樣。

邏輯回歸的目標(biāo)是對輸入變量的實(shí)例是否適合類別進(jìn)行分類。Logistic回歸的輸出值為0到1之間的值。結(jié)果接近1表示輸入變量更清楚地適合類別。結(jié)果接近0表示輸入變量可能不適合該類別。

Logistic回歸通常用于回答明確定義的是或否問題??蛻魰俅钨徺I嗎?買家信用值得嗎?潛在客戶會成為客戶嗎?預(yù)測這些問題的答案會在業(yè)務(wù)流程中產(chǎn)生一系列動作,從而有助于增加未來的收入。

分類和回歸樹

分類樹和回歸樹使用決策來對數(shù)據(jù)進(jìn)行分類。每個(gè)決定都是基于與輸入變量之一有關(guān)的問題。有了每個(gè)問題和相應(yīng)的答案,數(shù)據(jù)實(shí)例就變得更接近以特定方式進(jìn)行分類了。這組問題和答案以及隨后的數(shù)據(jù)劃分創(chuàng)建了一個(gè)樹狀結(jié)構(gòu)。每行問題的末尾都有一個(gè)類別。這稱為分類樹的葉節(jié)點(diǎn)。

這些分類樹可能變得非常大和復(fù)雜。控制復(fù)雜性的一種方法是通過修剪樹或有意刪除問題級別以在精確匹配和抽象之間取得平衡。對于輸入值的所有實(shí)例(在訓(xùn)練中已知的值和在訓(xùn)練中未知的值)都適用的模型至關(guān)重要。要防止此模型過度擬合,就需要在精確擬合和抽象之間達(dá)到微妙的平衡。

分類樹和回歸樹的一種變體稱為隨機(jī)森林。隨機(jī)森林不是構(gòu)建具有多個(gè)邏輯分支的單個(gè)樹,而是由許多小的樹和簡單樹組成的頂點(diǎn),每個(gè)樹都評估數(shù)據(jù)實(shí)例并確定分類。一旦所有這些簡單的樹完成了其數(shù)據(jù)評估,該過程將合并單個(gè)結(jié)果,以基于較小類別的組合來創(chuàng)建類別的最終預(yù)測。這通常稱為合奏方法。這些隨機(jī)森林通常在平衡精確匹配和抽象方面做得很好,并且已在許多業(yè)務(wù)案例中成功實(shí)現(xiàn)。

與側(cè)重于是或否分類的邏輯回歸相反,分類和回歸樹可用于預(yù)測多值分類。它們也更容易可視化并查看引導(dǎo)算法進(jìn)行特定分類的確定路徑。

?K最近鄰法?(KNN)

K最近鄰法?也是一種分類算法。它被稱為“懶惰學(xué)習(xí)者”,因?yàn)樵撨^程的培訓(xùn)階段非常有限。學(xué)習(xí)過程由存儲的訓(xùn)練數(shù)據(jù)集組成。在評估新實(shí)例時(shí),將評估到訓(xùn)練集中每個(gè)數(shù)據(jù)點(diǎn)的距離,并且基于新數(shù)據(jù)實(shí)例與訓(xùn)練實(shí)例的接近程度,就該數(shù)據(jù)實(shí)例屬于哪個(gè)類別達(dá)成共識。

根據(jù)訓(xùn)練集的大小和范圍,此算法在計(jì)算上可能會很昂貴。由于必須將每個(gè)新實(shí)例與訓(xùn)練數(shù)據(jù)集的所有實(shí)例進(jìn)行比較并得出距離,因此該過程每次運(yùn)行都可以使用許多計(jì)算資源。

該分類算法允許對數(shù)據(jù)進(jìn)行多值分類。另外,嘈雜的訓(xùn)練數(shù)據(jù)傾向于使分類傾斜。 通常選擇K近鄰,因?yàn)樗子谑褂?,易于?xùn)練并且易于解釋結(jié)果。當(dāng)您嘗試查找相似的項(xiàng)目時(shí),它通常在搜索應(yīng)用程序中使用。

K均值聚類

K-均值聚類專注于創(chuàng)建相關(guān)屬性組。這些組稱為群集。一旦創(chuàng)建了這些集群,就可以針對它們評估其他實(shí)例,以查看它們最適合的位置。

此技術(shù)通常用作數(shù)據(jù)探索的一部分。首先,分析人員指定群集的數(shù)量。K-means群集過程基于在稱為“質(zhì)心”的公共集線器周圍找到具有相似性的數(shù)據(jù)點(diǎn),將數(shù)據(jù)分解為該數(shù)量的群集。這些群集與類別不同,因?yàn)樗鼈冏畛鯖]有業(yè)務(wù)意義。它們只是輸入變量的緊密相關(guān)實(shí)例。一旦識別并分析了這些集群,就可以將它們轉(zhuǎn)換為類別,并提供具有業(yè)務(wù)意義的名稱。

經(jīng)常使用K均值聚類是因?yàn)樗子谑褂煤徒忉?,并且速度很快。要注意的一個(gè)方面是k均值聚類對異常值極為敏感。這些離群值會極大地改變這些聚類的性質(zhì)和定義,并最終改變分析結(jié)果。

#智能制造#, 這些是高級分析計(jì)劃中使用的一些最受歡迎的算法。每種方法都有優(yōu)缺點(diǎn),并且可以有效地利用各種方法來產(chǎn)生業(yè)務(wù)價(jià)值。實(shí)施這些算法的最終目標(biāo)是進(jìn)一步優(yōu)化數(shù)據(jù),使結(jié)果信息可以應(yīng)用于業(yè)務(wù)決策。正是此過程為下游流程提供了更精細(xì)和更高價(jià)值的數(shù)據(jù),這對于公司真正利用其數(shù)據(jù)的價(jià)值并實(shí)現(xiàn)其所需的結(jié)果至關(guān)重要。
責(zé)任編輯人:CC

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 分析算法
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    6762
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8838

    瀏覽量

    137147
收藏 人收藏

    評論

    相關(guān)推薦

    智慧城市與大數(shù)據(jù)的關(guān)系

    的建設(shè)需要對海量的數(shù)據(jù)資源進(jìn)行收集、整合、存儲與分析。大數(shù)據(jù)技術(shù)的應(yīng)用,如智能感知、分布式存儲等,使得這些數(shù)據(jù)能夠被高效地處理和利用。 決策支持 : 在智慧城市的建設(shè)和運(yùn)行過程中,
    的頭像 發(fā)表于 10-24 15:27 ?319次閱讀

    云計(jì)算在大數(shù)據(jù)分析中的應(yīng)用

    云計(jì)算在大數(shù)據(jù)分析中的應(yīng)用廣泛且深入,它為用戶提供了存儲、計(jì)算、分析和預(yù)測的強(qiáng)大能力。以下是對云計(jì)算在大數(shù)據(jù)分析中應(yīng)用的介紹: 一、存儲和處理海量數(shù)據(jù) 云計(jì)算提供了強(qiáng)大的存儲和計(jì)算能力
    的頭像 發(fā)表于 10-24 09:18 ?187次閱讀

    IP 地址大數(shù)據(jù)分析如何進(jìn)行網(wǎng)絡(luò)優(yōu)化?

    一、大數(shù)據(jù)分析在網(wǎng)絡(luò)優(yōu)化中的作用 1.流量分析 大數(shù)據(jù)分析可以對網(wǎng)絡(luò)中的流量進(jìn)行實(shí)時(shí)監(jiān)測和分析,了解網(wǎng)絡(luò)的使用情況和流量趨勢。通過對流量數(shù)據(jù)
    的頭像 發(fā)表于 10-09 15:32 ?105次閱讀
    IP 地址<b class='flag-5'>大數(shù)據(jù)分析</b>如何進(jìn)行網(wǎng)絡(luò)優(yōu)化?

    人員軌跡分析算法哪些?

    人員軌跡分析是一項(xiàng)重要的數(shù)據(jù)分析技術(shù),它可以幫助我們理解和預(yù)測人們的行為模式以及他們在特定時(shí)間和地點(diǎn)的活動。通過分析人員軌跡數(shù)據(jù),我們能夠從中獲取有價(jià)值的信息,例如人們的活動范圍、常去
    的頭像 發(fā)表于 09-26 10:42 ?209次閱讀

    基于大數(shù)據(jù)與深度學(xué)習(xí)的穿戴式運(yùn)動心率算法

    性能的關(guān)鍵手段。然而,在復(fù)雜多變的運(yùn)動環(huán)境中,準(zhǔn)確測量心率數(shù)據(jù)對于傳統(tǒng)算法而言具有較大的技術(shù)瓶頂。本文將探討如何運(yùn)用大數(shù)據(jù)和深度學(xué)習(xí)技術(shù)來開發(fā)創(chuàng)新的穿戴式運(yùn)動心率算
    的頭像 發(fā)表于 09-10 08:03 ?173次閱讀
    基于<b class='flag-5'>大數(shù)據(jù)</b>與深度學(xué)習(xí)的穿戴式運(yùn)動心率<b class='flag-5'>算法</b>

    大數(shù)據(jù)在軍事方面的應(yīng)用

    智慧華盛恒輝大數(shù)據(jù)在軍事方面的應(yīng)用廣泛且深入,涵蓋了戰(zhàn)爭決策、情報(bào)分析、裝備研發(fā)、后勤保障、科研方法、管理水平、作戰(zhàn)能力和信息化建設(shè)等多個(gè)方面。以下是對這些應(yīng)用的詳細(xì)歸納: 智慧華盛恒輝一、戰(zhàn)爭決策
    的頭像 發(fā)表于 07-16 09:44 ?676次閱讀

    大數(shù)據(jù)分析平臺網(wǎng)站

    大數(shù)據(jù)分析平臺是一種用于處理和分析大規(guī)模數(shù)據(jù)集的系統(tǒng),旨在從海量數(shù)據(jù)中提取有價(jià)值的信息和洞察。以下是大數(shù)據(jù)分析平臺的主要功能和應(yīng)用場景: 主
    的頭像 發(fā)表于 06-28 15:46 ?484次閱讀

    大數(shù)據(jù)在軍事方面的應(yīng)用哪些

    大數(shù)據(jù)技術(shù)為戰(zhàn)爭決策提供了全新的思路和工具。軍事機(jī)關(guān)指揮系統(tǒng)通過搜集和分析大量的戰(zhàn)場數(shù)據(jù),可以建立復(fù)雜的決策模型,快速分析敵我態(tài)勢,評估作戰(zhàn)可行性,并推薦最優(yōu)的戰(zhàn)術(shù)方案。 利用
    的頭像 發(fā)表于 06-23 10:34 ?737次閱讀

    大數(shù)據(jù)在軍事訓(xùn)練領(lǐng)域的應(yīng)用哪些

    智慧華盛恒輝大數(shù)據(jù)在軍事訓(xùn)練領(lǐng)域的應(yīng)用廣泛且深入,以下是具體的應(yīng)用點(diǎn)及其歸納: 智慧華盛恒輝個(gè)性化訓(xùn)練計(jì)劃: 通過收集和分析每個(gè)士兵的訓(xùn)練數(shù)據(jù),如射擊命中率、行軍速度、體能訓(xùn)練成績等,可以為每個(gè)士兵
    的頭像 發(fā)表于 06-23 10:21 ?473次閱讀

    大數(shù)據(jù)在部隊(duì)管理中的運(yùn)用哪些

    管理、用數(shù)據(jù)創(chuàng)新的全新管理模式。 智慧華盛恒輝大數(shù)據(jù)能夠提供全樣本數(shù)據(jù),避免了以往依賴少量數(shù)據(jù)分析的局限性,使決策更加全面、系統(tǒng)、準(zhǔn)確。 前瞻性分析
    的頭像 發(fā)表于 06-23 09:53 ?858次閱讀

    廣告投放公司運(yùn)用大數(shù)據(jù)分析,實(shí)現(xiàn)精準(zhǔn)投放

    廣告投放公司運(yùn)用大數(shù)據(jù)分析,實(shí)現(xiàn)精準(zhǔn)投放 隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,廣告投放行業(yè)正經(jīng)歷著一場深刻的變革。傳統(tǒng)的廣告投放方式已經(jīng)難以滿足市場需求,而大數(shù)據(jù)分析則為廣告投放帶來了精準(zhǔn)、高效的解決方案
    的頭像 發(fā)表于 04-11 11:23 ?647次閱讀

    CYBT-343026傳輸大數(shù)據(jù)時(shí)會丟數(shù)據(jù)的原因?

    我正在使用 CYBT-343026 (CYW-20706 Silicon) 模塊。 我根據(jù) SPP 樣本制作了一個(gè)操作 SPP 的應(yīng)用程序。 但是,傳輸大數(shù)據(jù)時(shí)有時(shí)會丟失數(shù)據(jù)。 它從
    發(fā)表于 03-01 15:04

    大數(shù)據(jù)技術(shù)是干嘛的 大數(shù)據(jù)核心技術(shù)哪些

    的核心技術(shù),包括數(shù)據(jù)采集、存儲與管理、處理與分析等方面。 一、大數(shù)據(jù)技術(shù)背景和概念 1.1 背景 隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,人們可以通過各種途徑產(chǎn)生、獲取和傳輸數(shù)據(jù),使
    的頭像 發(fā)表于 01-31 11:07 ?2835次閱讀

    Get職場新知識:做分析,用大數(shù)據(jù)分析工具

    工具值得推薦? 那就得是奧威BI大數(shù)據(jù)分析工具。主要原因三: 1、奧威BI方案,開箱即用,立得百張BI報(bào)表,大量節(jié)省BI報(bào)表開發(fā)時(shí)間,一步到位完成銷售、財(cái)務(wù)、庫存、采購、應(yīng)收、生產(chǎn)六大主題。 2
    發(fā)表于 12-05 09:36

    電梯物聯(lián)網(wǎng)大數(shù)據(jù)平臺是什么意思?

    電梯物聯(lián)網(wǎng)大數(shù)據(jù)化平臺是將電梯的使用時(shí)間和管理中的各項(xiàng)數(shù)據(jù)進(jìn)行采集,整合及利用大數(shù)據(jù)分析能力和計(jì)算機(jī)視覺技術(shù)、結(jié)合關(guān)聯(lián)分析、空間分析和多維
    的頭像 發(fā)表于 11-23 11:01 ?734次閱讀