0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

還在數(shù)據(jù)中臺與傳統(tǒng)大數(shù)據(jù)平臺之間傻傻分不清?

工業(yè)互聯(lián)網(wǎng)前線 ? 來源:大數(shù)據(jù)DT ? 作者:彭鋒 宋文欣 孫浩 ? 2021-10-12 17:16 ? 次閱讀

作者:彭鋒 宋文欣 孫浩峰

來源:大數(shù)據(jù)DT(ID:hzdashuju),本文經(jīng)授權(quán)轉(zhuǎn)載

導(dǎo)讀:我們可以這樣理解,傳統(tǒng)大數(shù)據(jù)平臺和數(shù)據(jù)倉庫是數(shù)據(jù)中臺的數(shù)據(jù)來源,建設(shè)數(shù)據(jù)中臺是為了更好地服務(wù)于業(yè)務(wù)部門。

圖1-1顯示了信息化系統(tǒng)、數(shù)據(jù)倉庫、傳統(tǒng)大數(shù)據(jù)平臺、數(shù)據(jù)中臺之間的關(guān)系,其中的箭頭表示數(shù)據(jù)的主要流向。

數(shù)據(jù)中臺與傳統(tǒng)大數(shù)據(jù)平臺到底有什么區(qū)別?為了敘述方便,我們先給出傳統(tǒng)大數(shù)據(jù)平臺的架構(gòu)。

大數(shù)據(jù)基礎(chǔ)能力層:Hadoop、Spark、Hive、HBase、Flume、Sqoop、Kafka、 Elasticsearch等。

在大數(shù)據(jù)組件上搭建的 ETL流水線,包括數(shù)據(jù)分析、機(jī)器學(xué)習(xí)程序。

數(shù)據(jù)治理系統(tǒng)。

數(shù)據(jù)倉庫系統(tǒng)。

數(shù)據(jù)可視化系統(tǒng)。

可以看到,這些是傳統(tǒng)大數(shù)據(jù)平臺的核心功能。在很多大數(shù)據(jù)項(xiàng)目里,只要把這些系統(tǒng)搭起來,每天可以生成業(yè)務(wù)報(bào)表(包括實(shí)時(shí)大屏),就算大數(shù)據(jù)平臺搭建成功了。

但數(shù)據(jù)中臺應(yīng)該是大數(shù)據(jù)平臺的一個(gè)超集。我們認(rèn)為,在大數(shù)據(jù)平臺的基礎(chǔ)之上,數(shù)據(jù)中臺還應(yīng)該提供下面的系統(tǒng)功能。

1. 全局的數(shù)據(jù)應(yīng)用資產(chǎn)管理

這里所說的數(shù)據(jù)應(yīng)用資產(chǎn)管理包括整個(gè)生態(tài)系統(tǒng)中的數(shù)據(jù)和應(yīng)用。傳統(tǒng)的數(shù)據(jù)資產(chǎn)管理絕大部分只包括關(guān)系型數(shù)據(jù)庫中的資產(chǎn)(包括Hive),而一個(gè)數(shù)據(jù)中臺應(yīng)該管理所有結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)資產(chǎn),以及使用這些數(shù)據(jù)資產(chǎn)的應(yīng)用。

如果傳統(tǒng)的數(shù)據(jù)資產(chǎn)管理提供的是數(shù)據(jù)目錄,那么數(shù)據(jù)中臺提供的應(yīng)該是擴(kuò)展的數(shù)據(jù)及應(yīng)用目錄。要避免重復(fù)造輪子,首先要知道系統(tǒng)中有哪些輪子,因此維護(hù)一個(gè)系統(tǒng)中數(shù)據(jù)及數(shù)據(jù)應(yīng)用的列表是很關(guān)鍵的。

2. 全局的數(shù)據(jù)治理機(jī)制

與傳統(tǒng)的數(shù)據(jù)治理不一樣,數(shù)據(jù)中臺必須提供針對全局的數(shù)據(jù)治理工具和機(jī)制。傳統(tǒng)數(shù)據(jù)倉庫中的數(shù)據(jù)建模和數(shù)據(jù)治理大多針對一個(gè)特定部門的業(yè)務(wù),部分原因是全局?jǐn)?shù)據(jù)建模和治理周期太長,由于存在部門之間的協(xié)調(diào)問題,往往難度很大。

數(shù)據(jù)中臺提供的數(shù)據(jù)治理機(jī)制必須允許各個(gè)業(yè)務(wù)部門自主迭代,但前提是要有全局一致的標(biāo)準(zhǔn)。阿里提出的OneID強(qiáng)調(diào)全局統(tǒng)一的對象ID(例如用戶ID),就屬于這個(gè)機(jī)制。

3. 自助的、多租戶的數(shù)據(jù)應(yīng)用開發(fā)及發(fā)布

現(xiàn)有的絕大部分大數(shù)據(jù)平臺要求使用者具備一定的編程能力。數(shù)據(jù)中臺強(qiáng)調(diào)的是為業(yè)務(wù)部門賦能,而業(yè)務(wù)人員需要有一個(gè)自助的、可適應(yīng)不同水平和能力要求的開發(fā)平臺。這個(gè)開發(fā)平臺要能夠保證數(shù)據(jù)隔離和資源隔離,這樣任何一個(gè)使用系統(tǒng)的人都不用擔(dān)心自己會對系統(tǒng)造成損害。

4. 數(shù)據(jù)應(yīng)用運(yùn)維

用戶應(yīng)該可以很方便地將自己開發(fā)的數(shù)據(jù)應(yīng)用自助發(fā)布到生產(chǎn)系統(tǒng)中,而無須經(jīng)過專門的數(shù)據(jù)團(tuán)隊(duì)。因?yàn)槲覀冃枰蚕磉@些應(yīng)用及其產(chǎn)生的數(shù)據(jù),所以需要有類似于CI/CD的專門系統(tǒng)來管理應(yīng)用的代碼質(zhì)量和進(jìn)行版本控制。

在數(shù)據(jù)應(yīng)用運(yùn)行過程中產(chǎn)生的數(shù)據(jù)也需要全程監(jiān)控,以保證數(shù)據(jù)的完整性、正確性和實(shí)時(shí)性。

5. 數(shù)據(jù)應(yīng)用集成

應(yīng)該可以隨時(shí)集成新的數(shù)據(jù)應(yīng)用。新的大數(shù)據(jù)應(yīng)用、人工智能工具不斷涌現(xiàn),我們的系統(tǒng)應(yīng)該能夠隨時(shí)支持這些新應(yīng)用。如果數(shù)據(jù)中臺不能支持這些應(yīng)用,各個(gè)業(yè)務(wù)部門可能又會打造自己的小集群,造成新的數(shù)據(jù)孤島及應(yīng)用孤島。

6. 數(shù)據(jù)即服務(wù),模型即服務(wù)

數(shù)據(jù)分析的結(jié)果,不管是統(tǒng)計(jì)分析的結(jié)果,還是機(jī)器學(xué)習(xí)生成的模型,應(yīng)該能夠很快地使用無代碼的方式發(fā)布,并供全機(jī)構(gòu)使用。

7. 數(shù)據(jù)能力共享管理

大部分?jǐn)?shù)據(jù)能力應(yīng)當(dāng)具有完善的共享管理機(jī)制、方便安全的共享機(jī)制以及靈活的反饋機(jī)制。最后決定數(shù)據(jù)如何使用的是獨(dú)立的個(gè)人,他們需要一套獲取信息的機(jī)制,因此在機(jī)構(gòu)內(nèi)部必須要有這樣的共享機(jī)制,才能真正讓數(shù)據(jù)用起來。

8. 完善的運(yùn)營指標(biāo)

數(shù)據(jù)中臺強(qiáng)調(diào)的是可衡量的數(shù)據(jù)價(jià)值,因此,對于數(shù)據(jù)在系統(tǒng)中的使用方式、被使用的頻率、最后產(chǎn)生的效果,必須要有一定的運(yùn)營指標(biāo),才能驗(yàn)證數(shù)據(jù)的價(jià)值和數(shù)據(jù)中臺項(xiàng)目的效率。

綜合上面的討論,除了阿里巴巴提出的OneID、OneModel、OneService之外,我們認(rèn)為數(shù)據(jù)中臺還應(yīng)該滿足以下兩個(gè)要求。

1. TotalPlatform

所有中臺數(shù)據(jù)及相關(guān)的應(yīng)用應(yīng)該在統(tǒng)一平臺中統(tǒng)一管理。如果有數(shù)據(jù)存儲在中臺管理不到的地方,或者有人在中臺未知的情況下使用數(shù)據(jù),我們就無法真正實(shí)現(xiàn)對數(shù)據(jù)的全局管理。這要求數(shù)據(jù)中臺能快速支持新的數(shù)據(jù)格式和數(shù)據(jù)應(yīng)用,便于數(shù)據(jù)工具的共享,而無須建立一個(gè)分離的系統(tǒng)。

2. TotalInsight

數(shù)據(jù)中臺應(yīng)該能夠理解并管理系統(tǒng)中數(shù)據(jù)的流動,提供數(shù)據(jù)價(jià)值的定量衡量,明確各個(gè)部門的花費(fèi)和產(chǎn)出。整個(gè)中臺的運(yùn)營是有序可控的,而不是一個(gè)黑盒子,用戶可以輕松理解全局的數(shù)據(jù)資產(chǎn)和能力,從系統(tǒng)中快速實(shí)現(xiàn)數(shù)據(jù)變現(xiàn)。

如圖1-3所示,數(shù)據(jù)中臺可以說是按照一定的規(guī)范要求建設(shè)的數(shù)據(jù)能力平臺,在數(shù)據(jù)倉庫、大數(shù)據(jù)平臺、數(shù)據(jù)服務(wù)、數(shù)據(jù)應(yīng)用的建設(shè)中實(shí)現(xiàn)了符合OneID、OneModel、OneService的數(shù)據(jù)層。

這個(gè)數(shù)據(jù)層,加上在其上建立的業(yè)務(wù)能力層以及運(yùn)營這個(gè)數(shù)據(jù)中臺需要的TotalPlatform、TotalInsight,形成我們看到的數(shù)據(jù)中臺。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:數(shù)據(jù)中臺與傳統(tǒng)大數(shù)據(jù)平臺有什么區(qū)別?終于有人講明白了

文章出處:【微信號:IndustryIOT,微信公眾號:工業(yè)互聯(lián)網(wǎng)前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    機(jī)器學(xué)習(xí)在數(shù)據(jù)分析的應(yīng)用

    隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)量的爆炸性增長對數(shù)據(jù)分析提出了更高的要求。機(jī)器學(xué)習(xí)作為一種強(qiáng)大的工具,通過訓(xùn)練模型從數(shù)據(jù)中學(xué)習(xí)規(guī)律,為企業(yè)和組織提供了更高效、更準(zhǔn)確的
    的頭像 發(fā)表于 07-02 11:22 ?403次閱讀

    數(shù)據(jù)在制造業(yè)的應(yīng)用及其轉(zhuǎn)型價(jià)值

    在數(shù)字化時(shí)代,制造業(yè)正面臨前所未有的挑戰(zhàn)與機(jī)遇。隨著大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)等技術(shù)的發(fā)展,數(shù)據(jù)已經(jīng)成為制造業(yè)企業(yè)轉(zhuǎn)型的重要驅(qū)動力。
    的頭像 發(fā)表于 05-17 17:20 ?386次閱讀

    數(shù)據(jù)、數(shù)據(jù)倉庫、數(shù)據(jù)治理與主數(shù)據(jù)的定位與差異

    在數(shù)字化時(shí)代,大數(shù)據(jù)已經(jīng)成為企業(yè)運(yùn)營和決策的重要資產(chǎn)。為了更好地管理和利用這些數(shù)據(jù),數(shù)據(jù)
    的頭像 發(fā)表于 05-08 10:40 ?376次閱讀

    數(shù)據(jù)工具:企業(yè)數(shù)據(jù)管理的核心動力

    在數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)據(jù)工具已經(jīng)成為各大企業(yè)提升效率、優(yōu)化決策的核心動力。通過集成、分析和管理企業(yè)內(nèi)外的各種數(shù)據(jù),
    的頭像 發(fā)表于 04-26 17:30 ?416次閱讀

    探索數(shù)據(jù)的力量:企業(yè)數(shù)據(jù)資產(chǎn)管理的未來

    隨著數(shù)字化時(shí)代的到來,"數(shù)據(jù)"這一概念逐漸為人所知,并迅速成為推動企業(yè)數(shù)據(jù)驅(qū)動轉(zhuǎn)型的重要基石。數(shù)據(jù)
    的頭像 發(fā)表于 04-10 16:21 ?245次閱讀

    傻傻分不清?射頻模擬信號源和矢量信號源的區(qū)別

    傻傻分不清?射頻模擬信號源和矢量信號源的區(qū)別? 射頻模擬信號源和矢量信號源是測試和測量領(lǐng)域中常見的兩種信號源。它們在信號產(chǎn)生原理、輸出信號特性、使用場景等方面有很大區(qū)別。本文將從原理、特性和應(yīng)用場
    的頭像 發(fā)表于 01-19 15:54 ?4464次閱讀

    構(gòu)建高效數(shù)據(jù)生態(tài):數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)湖、大數(shù)據(jù)平臺數(shù)據(jù)解析_光點(diǎn)科技

    在數(shù)字化的浪潮,一套高效的數(shù)據(jù)管理系統(tǒng)是企業(yè)競爭力的核心。從傳統(tǒng)數(shù)據(jù)庫到現(xiàn)代的數(shù)據(jù)
    的頭像 發(fā)表于 01-17 10:20 ?311次閱讀

    你還是分不清多進(jìn)程和多線程嗎?一文搞懂!

    同時(shí)運(yùn)行多個(gè)獨(dú)立的進(jìn)程。每個(gè)進(jìn)程都有自己獨(dú)立的內(nèi)存空間,可以同時(shí)執(zhí)行不同的任務(wù)。多進(jìn)程之間通過進(jìn)程間通信的方式進(jìn)行數(shù)據(jù)交換。 優(yōu)點(diǎn): - 程序之間內(nèi)存空間相互獨(dú)立,相互不會干擾。 -
    的頭像 發(fā)表于 12-19 16:07 ?491次閱讀

    [ElfBoard]是誰字和字節(jié)傻傻分不清楚?

    高電壓和低電壓,在數(shù)字電路,通常將高電壓視為 1 ,低電壓視為 0 ,因此我們信息存儲的最終形式是一連串 1 和 0 的組合。這種表達(dá)形式與我們在邏輯中經(jīng)常使用 true 和 false 是類似
    發(fā)表于 12-12 13:13

    數(shù)據(jù)具體是怎么解決數(shù)據(jù)孤島的?

    在數(shù)字化時(shí)代,數(shù)據(jù)已成為企業(yè)的核心資產(chǎn)。然而,由于歷史遺留問題、部門壁壘等因素,很多企業(yè)面臨著“數(shù)據(jù)孤島”的問題。數(shù)據(jù)孤島是指在一個(gè)組織內(nèi),數(shù)據(jù)
    的頭像 發(fā)表于 11-27 15:51 ?535次閱讀

    參數(shù)在數(shù)據(jù)轉(zhuǎn)換器的應(yīng)用

    電子發(fā)燒友網(wǎng)站提供《參數(shù)在數(shù)據(jù)轉(zhuǎn)換器的應(yīng)用.pdf》資料免費(fèi)下載
    發(fā)表于 11-27 11:46 ?0次下載
    參數(shù)<b class='flag-5'>在數(shù)據(jù)</b>轉(zhuǎn)換器<b class='flag-5'>中</b>的應(yīng)用

    電梯物聯(lián)網(wǎng)大數(shù)據(jù)平臺是什么意思?

    電梯物聯(lián)網(wǎng)大數(shù)據(jù)平臺是將電梯的使用時(shí)間和管理的各項(xiàng)數(shù)據(jù)進(jìn)行采集,整合及利用大數(shù)據(jù)分析能力和計(jì)算機(jī)視覺技術(shù)、結(jié)合關(guān)聯(lián)分析、空間分析和多維分
    的頭像 發(fā)表于 11-23 11:01 ?722次閱讀