0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從四個(gè)方面對(duì)大數(shù)據(jù)進(jìn)行闡述

如意 ? 來源:今日頭條 ? 作者:華章科技 ? 2020-11-30 14:42 ? 次閱讀

01 大數(shù)據(jù)概念

數(shù)據(jù)發(fā)展推動(dòng)科技進(jìn)步,海量數(shù)據(jù)給數(shù)據(jù)分析帶來了新的機(jī)遇和挑戰(zhàn)。大數(shù)據(jù)是一種強(qiáng)大到在獲取、存儲(chǔ)、管理、分析方面遠(yuǎn)遠(yuǎn)超出傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和較低的價(jià)值密度這四大特征。

于是,我們需要新的處理模式來實(shí)現(xiàn)更強(qiáng)的數(shù)據(jù)處理能力以應(yīng)對(duì)多樣化的信息資產(chǎn)。

大數(shù)據(jù)技術(shù)追求的不是精確性的樣本數(shù)據(jù),而是面向全體的數(shù)據(jù),這部分?jǐn)?shù)據(jù)可能是不精確的、非結(jié)構(gòu)化的,但大數(shù)據(jù)技術(shù)正是利用這些之前未被利用的數(shù)據(jù),創(chuàng)造新的價(jià)值。

從海量數(shù)據(jù)中獲得的數(shù)據(jù)處理結(jié)果可能是超乎我們的認(rèn)知邏輯的,但是我們并不需要理解結(jié)果背后的因果關(guān)系。簡言之,我們需要用相關(guān)思維替代因果思維。

02 大數(shù)據(jù)核心技術(shù)

大數(shù)據(jù)在信息系統(tǒng)的生命周期中,從數(shù)據(jù)源到最終產(chǎn)生有價(jià)值的可視化信息,主要經(jīng)歷6個(gè)步驟,分別是數(shù)據(jù)收集、數(shù)據(jù)存儲(chǔ)、資源管理與服務(wù)協(xié)調(diào)、計(jì)算框架確定、數(shù)據(jù)分析和數(shù)據(jù)可視化,此過程涵蓋了海量分布式系統(tǒng)、數(shù)據(jù)庫、并行計(jì)算框架、數(shù)據(jù)挖掘等方面的技術(shù)。

圖2-1羅列了大數(shù)據(jù)技術(shù)中各個(gè)步驟目前所對(duì)應(yīng)的主流技術(shù)體系,大數(shù)據(jù)的相關(guān)技術(shù)日新月異、層出不窮,由于篇幅限制,不再一一列舉。

▲圖2-1 大數(shù)據(jù)的主流技術(shù)體系

03 大數(shù)據(jù)特點(diǎn)

大數(shù)據(jù)具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和較低的價(jià)值密度這四大特征,下面將分別進(jìn)行詳細(xì)闡述。

1. 海量的數(shù)據(jù)規(guī)模(Volume)

大數(shù)據(jù)所采集、存儲(chǔ)和計(jì)算的數(shù)據(jù)規(guī)模都非常大。隨著互聯(lián)網(wǎng)的廣泛應(yīng)用,使用互聯(lián)網(wǎng)的人和企業(yè)等增多,數(shù)據(jù)的創(chuàng)造者變多,數(shù)據(jù)量呈幾何級(jí)增長。近年來,隨著數(shù)據(jù)維度變多、數(shù)據(jù)類型增加、數(shù)據(jù)的描述能力增強(qiáng),數(shù)據(jù)可以傳達(dá)的信息也越來越多,越來越準(zhǔn)確。

2. 快速的數(shù)據(jù)流轉(zhuǎn)(Velocity)

大數(shù)據(jù)不僅增長速度快,處理速度也快,有很強(qiáng)的時(shí)效性。在信息時(shí)代,人成為網(wǎng)絡(luò)的核心,每個(gè)人每天都在制造新的數(shù)據(jù),這些數(shù)據(jù)再被相應(yīng)的機(jī)構(gòu)如政府、互聯(lián)網(wǎng)企業(yè)、銀行、電信運(yùn)營商等收集,形成了一個(gè)個(gè)龐大的數(shù)據(jù)體系。

面對(duì)如此龐大的數(shù)據(jù)體系,處理數(shù)據(jù)并得到結(jié)果的速度越快,數(shù)據(jù)的時(shí)效性就越強(qiáng),價(jià)值就越高——而大數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)挖掘最大的區(qū)別也在于此,大數(shù)據(jù)更強(qiáng)調(diào)數(shù)據(jù)處理的實(shí)時(shí)性和時(shí)效性。

3. 多樣的數(shù)據(jù)類型(Variety)

大數(shù)據(jù)的種類和來源多樣化,多樣的數(shù)據(jù)為數(shù)據(jù)處理帶來了挑戰(zhàn)。在數(shù)據(jù)結(jié)構(gòu)上,大數(shù)據(jù)可以分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù);在具體形式上,大數(shù)據(jù)可以分為視頻、音頻、圖像、博客、社交網(wǎng)絡(luò)、互聯(lián)網(wǎng)搜索等。大數(shù)據(jù)迎接的挑戰(zhàn)就是要針對(duì)這些結(jié)構(gòu)不一、形式多樣的數(shù)據(jù),挖掘其中的相關(guān)性。而這些前所未有的、來自各個(gè)領(lǐng)域的、不同形式的數(shù)據(jù),賦予了大數(shù)據(jù)強(qiáng)大的威力。

4. 較低的價(jià)值密度(Value)

大數(shù)據(jù)的價(jià)值密度相對(duì)較低。數(shù)據(jù)的價(jià)值密度和數(shù)據(jù)的規(guī)模呈反相關(guān),數(shù)據(jù)的規(guī)模越大,數(shù)據(jù)的價(jià)值密度越低。大數(shù)據(jù)最大的價(jià)值即在于從大量低價(jià)值密度數(shù)據(jù)中挖掘出對(duì)分析和預(yù)測等有價(jià)值的信息。

相較于傳統(tǒng)數(shù)據(jù)挖掘利用結(jié)構(gòu)化的數(shù)據(jù)類型,大數(shù)據(jù)把目光也投向了非結(jié)構(gòu)化的、非抽樣的、包含全體的數(shù)據(jù)類型。這為大數(shù)據(jù)帶來了更多的有效信息,但同時(shí)也增加了大量無價(jià)值的甚至是錯(cuò)誤的信息。

04 大數(shù)據(jù)的通用應(yīng)用

大數(shù)據(jù)已經(jīng)滲透到了全世界市場中的各個(gè)領(lǐng)域,彰顯著巨大的價(jià)值,其在各個(gè)領(lǐng)域的詳細(xì)應(yīng)用情況如下。

1. 金融領(lǐng)域

大數(shù)據(jù)在金融領(lǐng)域應(yīng)用廣泛,如針對(duì)個(gè)人的信貸風(fēng)險(xiǎn)評(píng)估,銀行根據(jù)用戶的刷卡、轉(zhuǎn)賬、微信評(píng)論等數(shù)據(jù)有針對(duì)性地推送廣告;理財(cái)軟件通過大數(shù)據(jù)為客戶有針對(duì)性地推薦理財(cái)產(chǎn)品。總結(jié)來說,大數(shù)據(jù)在金融領(lǐng)域的應(yīng)用可以概括為精準(zhǔn)營銷、風(fēng)險(xiǎn)控制、效率提升、決策支持。

2. 醫(yī)療領(lǐng)域

醫(yī)療行業(yè)擁有大量的病例、檢測記錄、藥物記錄、治療結(jié)果記錄等,這些數(shù)據(jù)中蘊(yùn)含著巨大的價(jià)值,如果可以加以利用,將對(duì)醫(yī)療界產(chǎn)生不可估量的影響。疾病確診和因人而異的治療方案設(shè)定是醫(yī)療領(lǐng)域的重大問題,大數(shù)據(jù)可以幫助建立針對(duì)疾病特點(diǎn)、病人狀況以及治療方案的數(shù)據(jù)庫,為人類健康貢獻(xiàn)巨大的力量。

3. 生物領(lǐng)域

各國研究人員正如火如荼地推進(jìn)著人類基因組計(jì)劃,這促進(jìn)了生物數(shù)據(jù)的爆發(fā)式增長。基因檢測可以幫助人們對(duì)自己現(xiàn)在的以及未來的健康狀況有更深刻、全面的認(rèn)識(shí),甚至可以幫助父母在寶寶出生前就對(duì)其健康狀況進(jìn)行檢測。因此,人類基因組計(jì)劃是未來人類戰(zhàn)勝疾病的重要工具。

大數(shù)據(jù)可以整合已有的人類基因的檢測結(jié)果并進(jìn)行分析,加速人類基因組研究的進(jìn)程。

4. 零售領(lǐng)域

零售行業(yè)可以利用大數(shù)據(jù)了解顧客的消費(fèi)偏好和趨勢,用以商品的精準(zhǔn)營銷和相關(guān)產(chǎn)品的精準(zhǔn)推銷,降低運(yùn)營成本,提高進(jìn)貨管理和過期產(chǎn)品管理效率。大數(shù)據(jù)可以幫助零售商預(yù)測消費(fèi)者需求趨勢,更高效地提高供應(yīng)鏈滿足需求的能力。對(duì)大數(shù)據(jù)帶來的潛在信息的挖掘和有效利用,將成為未來零售領(lǐng)域的必爭之地。

5. 電商領(lǐng)域

電商行業(yè)的數(shù)據(jù)集中、數(shù)據(jù)規(guī)模大,可以利用大數(shù)據(jù)在很多方面進(jìn)行有效信息的分析提取,如用戶消費(fèi)趨勢、地域消費(fèi)特點(diǎn)等。

電商領(lǐng)域中的大數(shù)據(jù)應(yīng)用已經(jīng)頗具規(guī)模,電商也是最早利用大數(shù)據(jù)進(jìn)行精準(zhǔn)營銷的行業(yè)。電商可以根據(jù)顧客消費(fèi)習(xí)慣提前備貨以提高商品送達(dá)效率,還可以通過對(duì)客戶瀏覽、收藏、加入購物車和購買記錄等數(shù)據(jù)的分析,對(duì)用戶進(jìn)行有效的商品推薦,提高銷量。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    6754

    瀏覽量

    88611
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1400

    瀏覽量

    33963
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8831

    瀏覽量

    137137
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    如何零學(xué)大數(shù)據(jù)?

    設(shè)計(jì),掌握數(shù)據(jù)采集到實(shí)時(shí)計(jì)算到數(shù)據(jù)存儲(chǔ)再到前臺(tái)展示,所有工作一個(gè)人搞定!并可以架構(gòu)的層次站在架構(gòu)師的角度去完成一
    發(fā)表于 03-01 15:41

    “阿里巴巴大數(shù)據(jù)系統(tǒng)體系”大層次

    )。 所以面對(duì)如此“量大”、“價(jià)值大”的資源,我們需要建立一套數(shù)據(jù)采集、計(jì)算到服務(wù)到應(yīng)用的“大數(shù)據(jù)體系”,就跟“石油體系’一樣有勘探、采集、傳輸、加工、應(yīng)用等;由此也萌生出一批“
    發(fā)表于 08-29 16:19

    如何在同一個(gè)庫中使用四個(gè)Selectio Wizard四個(gè)不同的通道中捕獲數(shù)據(jù)

    嗨,大家好,我正在開發(fā)一個(gè)Vivado項(xiàng)目,我想在同一個(gè)庫中使用四個(gè)Selectio Wizard(使用iodelay)四個(gè)不同的通道中捕
    發(fā)表于 08-17 10:31

    什么是大數(shù)據(jù)?大數(shù)據(jù)的特點(diǎn)有哪些

    大數(shù)據(jù)(big data)目錄1什么是大數(shù)據(jù)2大數(shù)據(jù)的定義3大數(shù)據(jù)的特點(diǎn)[1]4大數(shù)據(jù)的作用[2]5大數(shù)
    發(fā)表于 07-12 06:52

    個(gè)方面對(duì)智能電網(wǎng)大數(shù)據(jù)應(yīng)用領(lǐng)域進(jìn)行論述分析

    智能電網(wǎng)是大數(shù)據(jù)的重要技術(shù)應(yīng)用領(lǐng)域之一。中投顧問發(fā)布的《“十三五”數(shù)據(jù)中國建設(shè)下智能電網(wǎng)產(chǎn)業(yè)投資分析及前景預(yù)測報(bào)告》分析認(rèn)為智能電網(wǎng)大數(shù)據(jù)結(jié)構(gòu)復(fù)雜、種類繁多,具有分散性、多樣性和復(fù)雜性等特征,這些
    發(fā)表于 01-23 11:55 ?6633次閱讀

    大數(shù)據(jù)時(shí)代的四個(gè)特征

    常不劃算的,對(duì)于一個(gè)平臺(tái)而言,也許保存的數(shù)據(jù)只有過去幾天或者一個(gè)月之內(nèi),再遠(yuǎn)的數(shù)據(jù)就要及時(shí)清理,不然代價(jià)太大?;谶@種情況,大數(shù)據(jù)對(duì)處理速度
    的頭像 發(fā)表于 12-19 15:51 ?1.2w次閱讀

    2018年智能鎖行業(yè)的問題大致總結(jié)為以下四個(gè)方面

    最近,對(duì)智能鎖行業(yè)進(jìn)行了年終調(diào)研,根據(jù)企業(yè)的反應(yīng),智能鎖行業(yè)的問題大致總結(jié)為以下四個(gè)方面
    發(fā)表于 01-02 10:07 ?1075次閱讀

    淺析大數(shù)據(jù)在醫(yī)療行業(yè)四個(gè)方面的應(yīng)用

    隨著各行各業(yè)對(duì)大數(shù)據(jù)的應(yīng)用,大數(shù)據(jù)正在日漸影響著行業(yè)的發(fā)展,醫(yī)療業(yè)也不例外。通過對(duì)醫(yī)療數(shù)據(jù)的分析,不但能夠預(yù)測流行疾病的爆發(fā)趨勢,以此避免感染、降低醫(yī)療成本,還能為患者提供更加便利的服務(wù)。具體來看,
    的頭像 發(fā)表于 11-07 15:08 ?1.3w次閱讀

    四個(gè)特征定義大數(shù)據(jù),完善大數(shù)據(jù)的定義

    令人生畏的(Intimidating):管理大數(shù)據(jù)到使用正確的工具獲取它的價(jià)值,利用大數(shù)據(jù)的過程中充滿了各種挑戰(zhàn)。
    發(fā)表于 05-17 11:28 ?3484次閱讀

    方面對(duì)DDR5進(jìn)行闡述

    DDR3-DDR5 地址、控制、命令數(shù)據(jù)、時(shí)鐘、電源的管腳總體擺放位置只作了小調(diào)整,而這個(gè)小調(diào)整按流程需要在DIE-PKG-PCB間進(jìn)行Co-Design,以保證信號(hào)SI與電源的噪聲,這是協(xié)同設(shè)計(jì)的過程。
    的頭像 發(fā)表于 08-04 16:24 ?6300次閱讀

    四個(gè)方面解讀PCB射頻電路基礎(chǔ)特性及重要因素

    此處將從射頻界面、小的期望信號(hào)、大的干擾信號(hào)、相鄰頻道的干擾四個(gè)方面解讀射頻電路大基礎(chǔ)特性,并給出了在 PCB 設(shè)計(jì)過程中需要特別注意的重要因素。
    發(fā)表于 08-07 14:42 ?905次閱讀

    應(yīng)用這4個(gè)方面對(duì)大數(shù)據(jù)進(jìn)行闡述

    大數(shù)據(jù)在信息系統(tǒng)的生命周期中,數(shù)據(jù)源到最終產(chǎn)生有價(jià)值的可視化信息,主要經(jīng)歷6個(gè)步驟,分別是數(shù)據(jù)收集、數(shù)
    的頭像 發(fā)表于 12-15 16:21 ?3013次閱讀

    2021年應(yīng)關(guān)注的四個(gè)大數(shù)據(jù)趨勢

    以下是2021年應(yīng)該關(guān)注的四個(gè)大數(shù)據(jù)趨勢:
    的頭像 發(fā)表于 12-31 09:56 ?1741次閱讀

    個(gè)方面闡述Cache

    關(guān)于cache,大概可以個(gè)方面進(jìn)行闡述:內(nèi)存到cache的映射方式,cache的寫策略,cache的替換策略。 映射方式 內(nèi)存到cach
    的頭像 發(fā)表于 11-21 11:09 ?2458次閱讀

    云安全包括哪四個(gè)方面

    云安全包括哪四個(gè)方面 隨著云計(jì)算逐漸成為主流,云安全也獲得了越來越多的關(guān)注,傳統(tǒng)和新興的云計(jì)算廠商以及安全廠商均推出了大量云安全產(chǎn)品。但是,與有清晰定義的“云計(jì)算”(NIST SP 800-145
    發(fā)表于 04-13 13:51 ?2576次閱讀