0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)核心技術(shù)/特點(diǎn)/通用應(yīng)用

h1654155282.3538 ? 來(lái)源:華章科技 ? 作者:華章科技 ? 2021-01-17 11:51 ? 次閱讀

01 大數(shù)據(jù)概念

數(shù)據(jù)發(fā)展推動(dòng)科技進(jìn)步,海量數(shù)據(jù)給數(shù)據(jù)分析帶來(lái)了新的機(jī)遇和挑戰(zhàn)。大數(shù)據(jù)是一種強(qiáng)大到在獲取、存儲(chǔ)、管理、分析方面遠(yuǎn)遠(yuǎn)超出傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和較低的價(jià)值密度這四大特征。

于是,我們需要新的處理模式來(lái)實(shí)現(xiàn)更強(qiáng)的數(shù)據(jù)處理能力以應(yīng)對(duì)多樣化的信息資產(chǎn)。

大數(shù)據(jù)技術(shù)追求的不是精確性的樣本數(shù)據(jù),而是面向全體的數(shù)據(jù),這部分?jǐn)?shù)據(jù)可能是不精確的、非結(jié)構(gòu)化的,但大數(shù)據(jù)技術(shù)正是利用這些之前未被利用的數(shù)據(jù),創(chuàng)造新的價(jià)值。

從海量數(shù)據(jù)中獲得的數(shù)據(jù)處理結(jié)果可能是超乎我們的認(rèn)知邏輯的,但是我們并不需要理解結(jié)果背后的因果關(guān)系。簡(jiǎn)言之,我們需要用相關(guān)思維替代因果思維。

02 大數(shù)據(jù)核心技術(shù)

大數(shù)據(jù)在信息系統(tǒng)的生命周期中,從數(shù)據(jù)源到最終產(chǎn)生有價(jià)值的可視化信息,主要經(jīng)歷6個(gè)步驟,分別是數(shù)據(jù)收集、數(shù)據(jù)存儲(chǔ)、資源管理與服務(wù)協(xié)調(diào)、計(jì)算框架確定、數(shù)據(jù)分析和數(shù)據(jù)可視化,此過(guò)程涵蓋了海量分布式系統(tǒng)、數(shù)據(jù)庫(kù)、并行計(jì)算框架、數(shù)據(jù)挖掘等方面的技術(shù)。

圖2-1羅列了大數(shù)據(jù)技術(shù)中各個(gè)步驟目前所對(duì)應(yīng)的主流技術(shù)體系,大數(shù)據(jù)的相關(guān)技術(shù)日新月異、層出不窮,由于篇幅限制,不再一一列舉。

o4YBAGADtGyAMdSEAAHh1vrOIbI674.png

▲圖2-1 大數(shù)據(jù)的主流技術(shù)體系

03 大數(shù)據(jù)特點(diǎn)

大數(shù)據(jù)具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和較低的價(jià)值密度這四大特征,下面將分別進(jìn)行詳細(xì)闡述。

1. 海量的數(shù)據(jù)規(guī)模(Volume)

大數(shù)據(jù)所采集、存儲(chǔ)和計(jì)算的數(shù)據(jù)規(guī)模都非常大。隨著互聯(lián)網(wǎng)的廣泛應(yīng)用,使用互聯(lián)網(wǎng)的人和企業(yè)等增多,數(shù)據(jù)的創(chuàng)造者變多,數(shù)據(jù)量呈幾何級(jí)增長(zhǎng)。近年來(lái),隨著數(shù)據(jù)維度變多、數(shù)據(jù)類型增加、數(shù)據(jù)的描述能力增強(qiáng),數(shù)據(jù)可以傳達(dá)的信息也越來(lái)越多,越來(lái)越準(zhǔn)確。

2. 快速的數(shù)據(jù)流轉(zhuǎn)(Velocity)

大數(shù)據(jù)不僅增長(zhǎng)速度快,處理速度也快,有很強(qiáng)的時(shí)效性。在信息時(shí)代,人成為網(wǎng)絡(luò)的核心,每個(gè)人每天都在制造新的數(shù)據(jù),這些數(shù)據(jù)再被相應(yīng)的機(jī)構(gòu)如政府、互聯(lián)網(wǎng)企業(yè)、銀行、電信運(yùn)營(yíng)商等收集,形成了一個(gè)個(gè)龐大的數(shù)據(jù)體系。

面對(duì)如此龐大的數(shù)據(jù)體系,處理數(shù)據(jù)并得到結(jié)果的速度越快,數(shù)據(jù)的時(shí)效性就越強(qiáng),價(jià)值就越高——而大數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)挖掘最大的區(qū)別也在于此,大數(shù)據(jù)更強(qiáng)調(diào)數(shù)據(jù)處理的實(shí)時(shí)性和時(shí)效性。

3. 多樣的數(shù)據(jù)類型(Variety)

大數(shù)據(jù)的種類和來(lái)源多樣化,多樣的數(shù)據(jù)為數(shù)據(jù)處理帶來(lái)了挑戰(zhàn)。在數(shù)據(jù)結(jié)構(gòu)上,大數(shù)據(jù)可以分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù);在具體形式上,大數(shù)據(jù)可以分為視頻音頻、圖像、博客、社交網(wǎng)絡(luò)、互聯(lián)網(wǎng)搜索等。大數(shù)據(jù)迎接的挑戰(zhàn)就是要針對(duì)這些結(jié)構(gòu)不一、形式多樣的數(shù)據(jù),挖掘其中的相關(guān)性。而這些前所未有的、來(lái)自各個(gè)領(lǐng)域的、不同形式的數(shù)據(jù),賦予了大數(shù)據(jù)強(qiáng)大的威力。

4. 較低的價(jià)值密度(Value)

大數(shù)據(jù)的價(jià)值密度相對(duì)較低。數(shù)據(jù)的價(jià)值密度和數(shù)據(jù)的規(guī)模呈反相關(guān),數(shù)據(jù)的規(guī)模越大,數(shù)據(jù)的價(jià)值密度越低。大數(shù)據(jù)最大的價(jià)值即在于從大量低價(jià)值密度數(shù)據(jù)中挖掘出對(duì)分析和預(yù)測(cè)等有價(jià)值的信息。

相較于傳統(tǒng)數(shù)據(jù)挖掘利用結(jié)構(gòu)化的數(shù)據(jù)類型,大數(shù)據(jù)把目光也投向了非結(jié)構(gòu)化的、非抽樣的、包含全體的數(shù)據(jù)類型。這為大數(shù)據(jù)帶來(lái)了更多的有效信息,但同時(shí)也增加了大量無(wú)價(jià)值的甚至是錯(cuò)誤的信息。

04 大數(shù)據(jù)的通用應(yīng)用

大數(shù)據(jù)已經(jīng)滲透到了全世界市場(chǎng)中的各個(gè)領(lǐng)域,彰顯著巨大的價(jià)值,其在各個(gè)領(lǐng)域的詳細(xì)應(yīng)用情況如下。

1. 金融領(lǐng)域

大數(shù)據(jù)在金融領(lǐng)域應(yīng)用廣泛,如針對(duì)個(gè)人的信貸風(fēng)險(xiǎn)評(píng)估,銀行根據(jù)用戶的刷卡、轉(zhuǎn)賬、微信評(píng)論等數(shù)據(jù)有針對(duì)性地推送廣告;理財(cái)軟件通過(guò)大數(shù)據(jù)為客戶有針對(duì)性地推薦理財(cái)產(chǎn)品??偨Y(jié)來(lái)說(shuō),大數(shù)據(jù)在金融領(lǐng)域的應(yīng)用可以概括為精準(zhǔn)營(yíng)銷、風(fēng)險(xiǎn)控制、效率提升、決策支持。

2. 醫(yī)療領(lǐng)域

醫(yī)療行業(yè)擁有大量的病例、檢測(cè)記錄、藥物記錄、治療結(jié)果記錄等,這些數(shù)據(jù)中蘊(yùn)含著巨大的價(jià)值,如果可以加以利用,將對(duì)醫(yī)療界產(chǎn)生不可估量的影響。疾病確診和因人而異的治療方案設(shè)定是醫(yī)療領(lǐng)域的重大問(wèn)題,大數(shù)據(jù)可以幫助建立針對(duì)疾病特點(diǎn)、病人狀況以及治療方案的數(shù)據(jù)庫(kù),為人類健康貢獻(xiàn)巨大的力量。

3. 生物領(lǐng)域

各國(guó)研究人員正如火如荼地推進(jìn)著人類基因組計(jì)劃,這促進(jìn)了生物數(shù)據(jù)的爆發(fā)式增長(zhǎng)。基因檢測(cè)可以幫助人們對(duì)自己現(xiàn)在的以及未來(lái)的健康狀況有更深刻、全面的認(rèn)識(shí),甚至可以幫助父母在寶寶出生前就對(duì)其健康狀況進(jìn)行檢測(cè)。因此,人類基因組計(jì)劃是未來(lái)人類戰(zhàn)勝疾病的重要工具。

大數(shù)據(jù)可以整合已有的人類基因的檢測(cè)結(jié)果并進(jìn)行分析,加速人類基因組研究的進(jìn)程。

4. 零售領(lǐng)域

零售行業(yè)可以利用大數(shù)據(jù)了解顧客的消費(fèi)偏好和趨勢(shì),用以商品的精準(zhǔn)營(yíng)銷和相關(guān)產(chǎn)品的精準(zhǔn)推銷,降低運(yùn)營(yíng)成本,提高進(jìn)貨管理和過(guò)期產(chǎn)品管理效率。大數(shù)據(jù)可以幫助零售商預(yù)測(cè)消費(fèi)者需求趨勢(shì),更高效地提高供應(yīng)鏈滿足需求的能力。對(duì)大數(shù)據(jù)帶來(lái)的潛在信息的挖掘和有效利用,將成為未來(lái)零售領(lǐng)域的必爭(zhēng)之地。

5. 電商領(lǐng)域

電商行業(yè)的數(shù)據(jù)集中、數(shù)據(jù)規(guī)模大,可以利用大數(shù)據(jù)在很多方面進(jìn)行有效信息的分析提取,如用戶消費(fèi)趨勢(shì)、地域消費(fèi)特點(diǎn)等。

電商領(lǐng)域中的大數(shù)據(jù)應(yīng)用已經(jīng)頗具規(guī)模,電商也是最早利用大數(shù)據(jù)進(jìn)行精準(zhǔn)營(yíng)銷的行業(yè)。電商可以根據(jù)顧客消費(fèi)習(xí)慣提前備貨以提高商品送達(dá)效率,還可以通過(guò)對(duì)客戶瀏覽、收藏、加入購(gòu)物車和購(gòu)買記錄等數(shù)據(jù)的分析,對(duì)用戶進(jìn)行有效的商品推薦,提高銷量。
責(zé)任編輯人:CC

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    新能源汽車小三電的核心技術(shù)

    新能源汽車的核心在于三電系統(tǒng),即電池、電機(jī)和電控。而在這三電系統(tǒng)中,我們又可以細(xì)分為“大三電”與“小三電”。大三電主要包括驅(qū)動(dòng)電機(jī)、電控和變速器;而小三電則涵蓋高壓配電盒PDU、車載充電機(jī)OBC以及DC/DC變換器。今天,我們就來(lái)深入了解一下小三電的核心技術(shù)。
    的頭像 發(fā)表于 10-16 14:45 ?160次閱讀
    新能源汽車小三電的<b class='flag-5'>核心技術(shù)</b>

    AI網(wǎng)絡(luò)發(fā)展的四大核心技術(shù)支柱

    在AI大模型時(shí)代,隨著模型參數(shù)量與訓(xùn)練集規(guī)模的爆炸性增長(zhǎng),單純依賴GPU單體算力的提升已難以滿足需求,業(yè)界焦點(diǎn)逐漸轉(zhuǎn)向系統(tǒng)架構(gòu)層面的革新,其中,作為底層核心技術(shù)的網(wǎng)絡(luò)成為了突破的關(guān)鍵。全球科技巨頭正競(jìng)相研發(fā)相關(guān)產(chǎn)品技術(shù),AI網(wǎng)絡(luò)技術(shù)
    的頭像 發(fā)表于 08-14 17:11 ?783次閱讀

    三星電子成功收購(gòu)英國(guó)初創(chuàng)公司,致力開(kāi)發(fā)AI核心技術(shù)

    7月18日,三星電子正式對(duì)外宣布了一項(xiàng)重要戰(zhàn)略舉措——成功收購(gòu)英國(guó)新興科技企業(yè)Oxford Semantic Technologies。這家初創(chuàng)公司成立于2017年,專注于前沿的知識(shí)圖譜技術(shù)領(lǐng)域,致力于開(kāi)發(fā)能夠賦能更復(fù)雜AI應(yīng)用的核心技術(shù)。
    的頭像 發(fā)表于 07-18 15:40 ?460次閱讀

    圖像識(shí)別算法的核心技術(shù)是什么

    圖像識(shí)別算法是計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)重要研究方向,其目標(biāo)是使計(jì)算機(jī)能夠像人類一樣理解和識(shí)別圖像中的內(nèi)容。圖像識(shí)別算法的核心技術(shù)包括以下幾個(gè)方面: 特征提取 特征提取是圖像識(shí)別算法的基礎(chǔ),它從原始圖像
    的頭像 發(fā)表于 07-16 11:02 ?447次閱讀

    大數(shù)據(jù)采集系統(tǒng)分為幾類

    大數(shù)據(jù)采集系統(tǒng)是大數(shù)據(jù)生態(tài)系統(tǒng)中的重要組成部分,它負(fù)責(zé)從各種數(shù)據(jù)源收集、整合和存儲(chǔ)數(shù)據(jù)。根據(jù)不同的數(shù)據(jù)源、采集方法和應(yīng)用場(chǎng)景,
    的頭像 發(fā)表于 07-01 15:44 ?1179次閱讀

    【大語(yǔ)言模型:原理與工程實(shí)踐】核心技術(shù)綜述

    我也不打算把網(wǎng)上相關(guān)的信息在總結(jié)一下,這樣的話,工作量很大。 我主要看了-大語(yǔ)言模型基礎(chǔ)技術(shù)這節(jié) 大語(yǔ)言模型(Large Language Models,LLMs)的核心技術(shù)涵蓋了從模型的架構(gòu)設(shè)計(jì)到
    發(fā)表于 05-05 10:56

    新能源汽車核心技術(shù)加油站-VCU

    新能源汽車核心技術(shù)加油站-VCU
    的頭像 發(fā)表于 04-20 08:10 ?277次閱讀
    新能源汽車<b class='flag-5'>核心技術(shù)</b>加油站-VCU

    安達(dá)發(fā)|APS生產(chǎn)排程軟件6大核心技術(shù)

    APS生產(chǎn)排程軟件是一種先進(jìn)的生產(chǎn)計(jì)劃和調(diào)度工具,它通過(guò)整合企業(yè)內(nèi)外部資源,實(shí)現(xiàn)生產(chǎn)計(jì)劃的優(yōu)化和生產(chǎn)過(guò)程的自動(dòng)化控制。APS生產(chǎn)排程軟件的核心技術(shù)包括產(chǎn)品工藝數(shù)據(jù)管理(PDM)、客戶需求管理(CRM
    的頭像 發(fā)表于 02-20 16:09 ?540次閱讀
    安達(dá)發(fā)|APS生產(chǎn)排程軟件6大<b class='flag-5'>核心技術(shù)</b>

    大數(shù)據(jù)技術(shù)是干嘛的 大數(shù)據(jù)核心技術(shù)有哪些

    核心技術(shù),包括數(shù)據(jù)采集、存儲(chǔ)與管理、處理與分析等方面。 一、大數(shù)據(jù)技術(shù)背景和概念 1.1 背景 隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,人們可以通過(guò)各種
    的頭像 發(fā)表于 01-31 11:07 ?2728次閱讀

    視頻信號(hào)處理:無(wú)縫高清矩陣切換器的核心技術(shù)解析

    來(lái)百度APP暢享高清圖片 無(wú)縫高清矩陣切換器的核心技術(shù)主要包括視頻信號(hào)處理、高速傳輸和矩陣切換技術(shù)。其中,視頻信號(hào)處理技術(shù)是切換器的核心技術(shù)之一,直接影響著切換器的性能和效果。 視頻信
    的頭像 發(fā)表于 01-24 14:26 ?572次閱讀
    視頻信號(hào)處理:無(wú)縫高清矩陣切換器的<b class='flag-5'>核心技術(shù)</b>解析

    邊緣AI核心技術(shù)和產(chǎn)業(yè)鏈!技術(shù)持續(xù)進(jìn)步,應(yīng)用不斷拓展!

    ,并保護(hù)用戶的隱私。此外,邊緣AI還可以在沒(méi)有互聯(lián)網(wǎng)連接的情況下獨(dú)立運(yùn)行,這對(duì)于一些實(shí)時(shí)性要求較高的應(yīng)用非常重要。 ? 邊緣AI 產(chǎn)業(yè)鏈及核心技術(shù) ? 邊緣AI涉及的核心技術(shù)很多,包括但不限于網(wǎng)絡(luò)技術(shù)、傳感
    的頭像 發(fā)表于 01-11 01:20 ?4610次閱讀
    邊緣AI<b class='flag-5'>核心技術(shù)</b>和產(chǎn)業(yè)鏈!<b class='flag-5'>技術(shù)</b>持續(xù)進(jìn)步,應(yīng)用不斷拓展!

    無(wú)線通信的核心技術(shù)有哪些?

    無(wú)線通信的核心技術(shù)包括調(diào)制與解調(diào)技術(shù)、編碼與解碼技術(shù)、非正交多址接入技術(shù)等。 1、調(diào)制與解調(diào)技術(shù):調(diào)制是將數(shù)字信號(hào)轉(zhuǎn)換成適合在無(wú)線信道上傳輸
    的頭像 發(fā)表于 11-10 17:17 ?1500次閱讀

    解讀可穿戴設(shè)備代表性產(chǎn)品核心技術(shù)原理

    電子發(fā)燒友網(wǎng)站提供《解讀可穿戴設(shè)備代表性產(chǎn)品核心技術(shù)原理.doc》資料免費(fèi)下載
    發(fā)表于 10-31 11:22 ?0次下載
    解讀可穿戴設(shè)備代表性產(chǎn)品<b class='flag-5'>核心技術(shù)</b>原理

    服務(wù)機(jī)器人的核心技術(shù)到底有哪些

    機(jī)器人的基本架構(gòu)通常包括中央處理器 (CPU)、電源/電池管理單元、電池充電器、無(wú)線通信 (COM) 模塊、人機(jī)界面 (HMI)、傳感器及驅(qū)動(dòng)模塊(有刷和無(wú)刷電機(jī))。那么,服務(wù)機(jī)器人的核心技術(shù)到底有哪些呢?
    發(fā)表于 10-26 10:23 ?512次閱讀
    服務(wù)機(jī)器人的<b class='flag-5'>核心技術(shù)</b>到底有哪些

    線路板PCB:特斯拉Cybertruck的核心技術(shù)

    線路板PCB:特斯拉Cybertruck的核心技術(shù)
    的頭像 發(fā)表于 10-25 10:49 ?762次閱讀