第一階段
企業(yè)信息化達到一定程度之后,一定會有報表的需求,此時直接從業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫進行查詢。
第二階段
直接查詢業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫,很容易對業(yè)務(wù)系統(tǒng)造成影響,這時可能會將數(shù)據(jù)抽取出來,放在一個鏡像數(shù)據(jù)庫里進行查詢。
第三階段
當數(shù)據(jù)規(guī)模越來越大,報表與數(shù)據(jù)分析的需求也隨之增多。開始對數(shù)據(jù)進行系統(tǒng)化的規(guī)劃與管理時,數(shù)據(jù)倉庫的雛形也已建立起來。
關(guān)系型數(shù)據(jù)庫的星形(或雪花型)結(jié)構(gòu)是數(shù)據(jù)倉庫的常見形式之一,但不是唯一的形式,只要能做到將數(shù)據(jù)有序管理,基本上就可以稱之為數(shù)據(jù)倉庫。
當建立起心形或雪花型的數(shù)據(jù)倉庫的時候,已經(jīng)可以做一些基本的數(shù)據(jù)分析了。但是會有一些弊端。星形或水上行結(jié)構(gòu)雖然模擬了多維數(shù)據(jù)模型,但是其本質(zhì)上還是關(guān)系型數(shù)據(jù)庫的表字段以及數(shù)據(jù)行的模型。無法做到真正意義上的面對業(yè)務(wù)時的數(shù)據(jù)分析。而且這種直接建立在關(guān)系型數(shù)據(jù)庫之上的模型,很難讓業(yè)務(wù)人員自主進行數(shù)據(jù)分析。
第四階段
基于關(guān)系數(shù)據(jù)庫星型或雪花型結(jié)構(gòu)所建立的數(shù)據(jù)倉庫,雖然可以進行數(shù)據(jù)分析,但分析能力不強。
星型或雪花型結(jié)構(gòu)雖然模擬了多維數(shù)據(jù)模型,但其本質(zhì)上還是關(guān)系型數(shù)據(jù)庫的表及字段模型,無法做到真正意義上面向業(yè)務(wù)的數(shù)據(jù)分析,而且這種直接建立在關(guān)系型數(shù)據(jù)庫之上的模型,很難讓業(yè)務(wù)人員獨立進行數(shù)據(jù)分析。
第五階段
由于多維數(shù)據(jù)庫維度既業(yè)務(wù)的特性,所以基于多維數(shù)據(jù)庫所建立的數(shù)據(jù)體系的分析能力要強很多,而且也能將讓業(yè)務(wù)人員自主分析這一目標落地實現(xiàn)。
多維數(shù)據(jù)庫向外提供維度與數(shù)據(jù)集市模型,數(shù)據(jù)的實際物理存儲則對外屏蔽。關(guān)系型數(shù)據(jù)庫可以作為多維數(shù)據(jù)庫的一種底層實現(xiàn),當然還有其他的方式,比如數(shù)據(jù)塊文件、分布式存儲等。
關(guān)系型數(shù)據(jù)庫的星型(或雪花型)結(jié)構(gòu)容易與多維數(shù)據(jù)庫的維度與數(shù)據(jù)立方體結(jié)構(gòu)產(chǎn)生一些混淆,主要是由于以下兩點原因:
多維數(shù)據(jù)庫可以使用關(guān)系數(shù)據(jù)庫作為數(shù)據(jù)實際存儲方案;
多維數(shù)據(jù)庫的MDX與關(guān)系數(shù)據(jù)庫的SQL在語法結(jié)構(gòu)上的類似。
以上兩點原因使得在關(guān)系數(shù)據(jù)庫的星型(或雪花型)模型上使用SQL進行查詢被誤認為是可以進行多維分析的,實際上這是非常錯誤的認識,原因在于表及字段模型和維度及數(shù)據(jù)立方體模型本質(zhì)上的區(qū)別。
以上是思邁特軟件Smartbi的分享,更多行業(yè)干貨可關(guān)注我們下一期的分享。思邁特軟件Smartbi是知名國產(chǎn)BI品牌,專注于商業(yè)智能BI與大數(shù)據(jù)BI分析平臺軟件產(chǎn)業(yè)的研發(fā)及服務(wù)。經(jīng)過多年持續(xù)自主研發(fā),凝聚大量商業(yè)智能最佳實踐經(jīng)驗,整合了各行業(yè)的數(shù)據(jù)分析和決策支持的功能需求。滿足最終用戶在企業(yè)級報表、數(shù)據(jù)可視化分析、自助探索分析、數(shù)據(jù)挖掘建模、AI智能分析等大數(shù)據(jù)分析需求。
現(xiàn)個人版提供全模塊長期免費使用,有興趣的小伙伴可登陸官網(wǎng)免費試用。
責(zé)任編輯:tzh
評論
查看更多