0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)集成系統(tǒng)在教育行業(yè)中的應(yīng)用

jf_78858299 ? 來源:一個數(shù)據(jù)人的自留地 ? 作者:數(shù)據(jù)人創(chuàng)作者聯(lián)盟 ? 2023-05-06 10:28 ? 次閱讀

一個風(fēng)雨交加的晚上,領(lǐng)導(dǎo)把我拉到會議室說:老影啊,公司接到一個項目,需要在3個月里完成一個大數(shù)據(jù)平臺的開發(fā),用于項目的交付,這個任務(wù)交給你了,加油搞!此刻的我:搞?搞事情啊~~~。由此我開始了數(shù)據(jù)平臺的“闖關(guān)之路”,遇到的第一個boss就是數(shù)據(jù)集成系統(tǒng)......

01

什么是數(shù)據(jù)集成?

百科里的解釋是:把不同來源、格式、特點性質(zhì)的數(shù)據(jù)在邏輯上或物理上有機(jī)地集中,從而為企業(yè)提供全面的數(shù)據(jù)共享;通俗講就是把分散在各個系統(tǒng)中的各種類型的數(shù)據(jù)統(tǒng)一匯聚起來,主要體現(xiàn)在一個“集”字。

而數(shù)據(jù)集成系統(tǒng)就是提供數(shù)據(jù)集成能力的平臺,是一站式解決異構(gòu)數(shù)據(jù)存儲互通,消除數(shù)據(jù)孤島的同步平臺,為大數(shù)據(jù)各系統(tǒng)和業(yè)務(wù)方提供數(shù)據(jù)集成的高效通道 。

拿現(xiàn)實中的實例類比來說,數(shù)據(jù)集成就好比把各種糧食通過不同的管道灌輸?shù)揭粋€大糧倉中,這些管道就是數(shù)據(jù)集成系統(tǒng),我們可以支持接入各式各樣的糧食,小麥、玉米、大豆等等,同時支持在這些管道中加一些濾網(wǎng),比如在大豆的管道中加上5mm的濾網(wǎng),此時從大豆管道過來的糧食只有5mm以下的大豆,這就相當(dāng)于數(shù)據(jù)集成系統(tǒng)中的數(shù)據(jù)過濾功能;這個糧倉相當(dāng)于集成目的,我們把數(shù)據(jù)集成進(jìn)來之后存儲在這里,供其他各方消費。

02

教育為什么要做數(shù)據(jù)集成?

2.1 數(shù)據(jù)大爆炸

現(xiàn)在是一個信息大爆炸時代,互聯(lián)網(wǎng)的高速發(fā)展、迅速普及,讓信息無處不在、無孔不入,每天在我們所生活在的這個世界出現(xiàn)了大量的信息,教育場景下也不例外,隨著各種信息化系統(tǒng)的涌入,信息以空前的速度增長,教育從業(yè)者體驗著信息時代便捷的同時,也給他們帶來了問題和“副作用”,從浩如煙海的信息海洋中迅速而準(zhǔn)確地獲取他們最需要的信息,變得非常困難。

2.2 數(shù)據(jù)來源多樣化

隨著《教育信息化2.0行動計劃》的提出,教學(xué)過程中的信息化系統(tǒng)越來越多,比如作業(yè)系統(tǒng)、考試系統(tǒng)、選課系統(tǒng)、智慧課堂等等,每個系統(tǒng)都會產(chǎn)生大量的數(shù)據(jù),存儲在各自的數(shù)據(jù)庫中,如果系統(tǒng)的服務(wù)商不同,可能數(shù)據(jù)的格式也不一樣,致使教育場景下的數(shù)據(jù)越來越多,越來越難以管理。

2.3 數(shù)據(jù)集不同結(jié)構(gòu)

教育場景下的數(shù)據(jù)集可能是結(jié)構(gòu)化的、半結(jié)構(gòu)化的,甚至非結(jié)構(gòu)化的;比如:考試系統(tǒng)中的數(shù)據(jù)是結(jié)構(gòu)化的,評價系統(tǒng)中的數(shù)據(jù)是半結(jié)構(gòu)化的,課堂實錄中的數(shù)據(jù)是非結(jié)構(gòu)化的;不同結(jié)構(gòu)的數(shù)據(jù)需要整合成統(tǒng)一的結(jié)構(gòu)才能夠進(jìn)行統(tǒng)計和分析。

2.4 數(shù)據(jù)冗余

數(shù)據(jù)中有很多冗余、錯誤、敏感數(shù)據(jù),如果不進(jìn)行數(shù)據(jù)清洗,會影響數(shù)據(jù)分析的效率和結(jié)果;在這種情況下需要我們配置統(tǒng)一的標(biāo)準(zhǔn),對數(shù)據(jù)進(jìn)行簡單的處理,以便于后續(xù)進(jìn)行統(tǒng)計分析。

03

數(shù)據(jù)集成系統(tǒng)對教育的價值是什么?

大數(shù)據(jù)技術(shù)能夠?qū)㈦[藏于海量數(shù)據(jù)中的信息和知識挖掘出來,按照科學(xué)的教育評價準(zhǔn)則,對教學(xué)數(shù)據(jù)進(jìn)行科學(xué)的統(tǒng)計分析,提供有價值的教學(xué)質(zhì)量測評與分析數(shù)據(jù),實現(xiàn)對教育活動,教育過程和教育結(jié)果的價值評判,為提高教育質(zhì)量,教育決策以及學(xué)校改進(jìn)日常教學(xué)方法提供科學(xué)的依據(jù),實現(xiàn)教育管理的智能化,提升教育管理與服務(wù)水平。

數(shù)據(jù)集成系統(tǒng)作為底層基礎(chǔ)支撐性服務(wù),是大數(shù)據(jù)系統(tǒng)的核心組成部分。通過提供數(shù)據(jù)集成能力,將教育各部門和來自互聯(lián)網(wǎng)的結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行統(tǒng)一的匯聚接入,存儲到大數(shù)據(jù)存儲組件,并支持?jǐn)?shù)據(jù)的預(yù)處理,為大數(shù)據(jù)系統(tǒng)提供原始數(shù)據(jù)支撐。

04

數(shù)據(jù)集成系統(tǒng)怎么做?

4.1 建設(shè)原則

  • 數(shù)據(jù)采集系統(tǒng)針對實際項目中復(fù)雜的、異構(gòu)的數(shù)據(jù)環(huán)境,實現(xiàn)對多種數(shù)據(jù)源的集成,支持的關(guān)系數(shù)據(jù)庫有Oracle、MySQL、Sqlserver等,支持的文件類型有txt文件、csv文件、excel文件等,支持的接口類型有webservice接口、http接口、socket接口等。
  • 對于不同的大數(shù)據(jù)存儲需求,實現(xiàn)對多種大數(shù)據(jù)存儲組件的支持,支持的大數(shù)據(jù)存儲組件包括HDFS、HBase、Hive、Solr、Elasticserach等。
  • 針對數(shù)據(jù)的預(yù)處理需求,實現(xiàn)對數(shù)據(jù)的清洗、轉(zhuǎn)換、標(biāo)準(zhǔn)化等預(yù)處理的支持,并且支持清洗規(guī)則、轉(zhuǎn)換規(guī)則的用戶自定義,以及清洗、轉(zhuǎn)換、導(dǎo)入流程的用戶自定義。
  • 在數(shù)據(jù)采集系統(tǒng)中,各類功能點模塊化、組件化,便于步驟獨立,保證系統(tǒng)內(nèi)部模塊自治,同時便于多種步驟、方法的組合應(yīng)用。
  • 簡化用戶操作,通過圖形化的配置方式,簡單,靈活,使得用戶無需過分關(guān)心數(shù)據(jù)庫的各種內(nèi)部細(xì)節(jié),而專注于功能。

4.2 數(shù)據(jù)集成信息框架

數(shù)據(jù)集成信息流

4.3 功能結(jié)構(gòu)

為了快速實現(xiàn)數(shù)據(jù)集成系統(tǒng),滿足后續(xù)項目交付,經(jīng)過和研發(fā)大佬的多次溝通,優(yōu)先實現(xiàn)為業(yè)務(wù)提供數(shù)據(jù)集成的能力的數(shù)據(jù)源管理和集成任務(wù)管理。明確了第一版需求,只要包含數(shù)據(jù)源管理和集成任務(wù)管理就可以支持項目交付,因此功能結(jié)構(gòu)設(shè)計如下:

數(shù)據(jù)集成系統(tǒng)功能結(jié)構(gòu)圖

4.4 建設(shè)內(nèi)容

4.4.1 數(shù)據(jù)源管理

數(shù)據(jù)源模塊主要管理平臺支持的數(shù)據(jù)組件的基礎(chǔ)信息,包含各種數(shù)據(jù)組件的新增,配置和管理,如關(guān)系型數(shù)據(jù)庫的數(shù)據(jù)庫IP,端口,訪問信息等。這里大家可以理解為一個中間層,先通過數(shù)據(jù)抽取組件將各系統(tǒng)數(shù)據(jù)抽取到這里,以備后續(xù)集成任務(wù)管理模塊的調(diào)用。

  • 在這里可以對數(shù)據(jù)源進(jìn)行增刪改查
  • 前提是需要和數(shù)據(jù)來源方溝通好,需要提供數(shù)據(jù)庫ip相關(guān)信息
  • 下方是頁面示例:

數(shù)據(jù)源管理列表

4.4.2 集成任務(wù)管理

當(dāng)用戶創(chuàng)建好數(shù)據(jù)源之后,需要有一個模塊支持用戶創(chuàng)建集成任務(wù),相當(dāng)于上文中講到的,上游的所有糧食都準(zhǔn)備好了,需要我們提供搭建管道的地方,讓用戶把所有的管道搭起來,然后把各種糧食都匯聚到一起。此時集成任務(wù)管理模塊誕生了,這個模塊下主要對數(shù)據(jù)集成的任務(wù)進(jìn)行統(tǒng)一的管理,支持用戶對數(shù)據(jù)集成任務(wù)進(jìn)行增刪改查.

(1)操作列表功能

  • 上線:

    集成任務(wù)完成創(chuàng)建狀態(tài)默認(rèn)為未上線,此時用戶可將集成任務(wù)上線,上線為就緒狀態(tài);

  • 運行:

    上線狀態(tài)下的任務(wù)支持運行,運行自動調(diào)用任務(wù)執(zhí)行組件,開始數(shù)據(jù)集成;

  • 下線:

    已上線的任務(wù)支持下線;

  • 刪除:

    未上線和已下線的任務(wù)支持刪除;

  • 編輯:

    未上線和已下線的任務(wù)支持編輯。

(2)任務(wù)運行

  • 集成任務(wù)創(chuàng)建好之后,如果需要周期性的拉取數(shù)據(jù),這時候需要支持進(jìn)行例行周期配置,支持用戶配置定時任務(wù);
  • 同時支持用戶進(jìn)行失敗策略、任務(wù)執(zhí)行優(yōu)先級等相關(guān)參數(shù)的配置。

4.4.3 新增集成任務(wù)

為了方便用戶填寫,支持用戶選擇不同的數(shù)據(jù)源類型,數(shù)據(jù)接口類型不同,需要配置的參數(shù)信息也不同;但是總體來說數(shù)據(jù)集成主要分為三步:

  • 數(shù)據(jù)接入:

    回答數(shù)據(jù)從哪來的問題;

  • 數(shù)據(jù)處理:

    回答對數(shù)據(jù)要做什么的問題;

  • 數(shù)據(jù)輸出:回答數(shù)據(jù)要到哪去的問題。

下方以將第三方數(shù)據(jù)庫數(shù)據(jù)集成到hive中為例舉例說明。選擇數(shù)據(jù)庫之后,頁面進(jìn)入數(shù)據(jù)集成任務(wù)配置頁,三個步驟依次如下:

(1)數(shù)據(jù)接入

主要配置數(shù)據(jù)源相關(guān)信息,需要用戶填寫數(shù)據(jù)源表相關(guān)信息:

  • 數(shù)據(jù)源:

    數(shù)據(jù)集群相關(guān)信息;

  • 數(shù)據(jù)庫:

    源數(shù)據(jù)存儲數(shù)據(jù)庫;

  • 是否分表:

    如果分表存儲需要從多個表抽取數(shù)據(jù);

  • 表名:

    源數(shù)據(jù)所在表名;

  • 數(shù)據(jù)歸屬產(chǎn)品/系統(tǒng):

    這部分?jǐn)?shù)據(jù)在目錄管理系統(tǒng)維護(hù),這里直接引用;

  • 數(shù)據(jù)預(yù)覽:

    支持用戶對所選表進(jìn)行預(yù)覽,查看數(shù)據(jù)格式。

(2)數(shù)據(jù)處理

到在數(shù)據(jù)集成過程中會對數(shù)據(jù)進(jìn)行預(yù)處理,考慮到后續(xù)的擴(kuò)展性,這里直接將各種處理步驟提煉為公共組件,支持用戶自定義選擇,第一期可支持:字段映射過濾、賬號匹配、數(shù)據(jù)脫敏、數(shù)據(jù)轉(zhuǎn)換;

為了節(jié)省操作,數(shù)據(jù)處理默認(rèn)以字段映射過濾開始,自動選擇一項,用戶可直接點擊下一步。

(3)數(shù)據(jù)輸出

此時的數(shù)據(jù)經(jīng)過預(yù)處理,已經(jīng)完成了清洗、轉(zhuǎn)換的操作,接下來就需要將處理完的數(shù)據(jù)存下來,以備后續(xù)使用。

05

數(shù)據(jù)集成結(jié)束后做什么?

下面以學(xué)生畫像的思路和大家簡單聊聊。

通過從各個系統(tǒng)中采集過來的數(shù)據(jù),包含但不限于:學(xué)生上網(wǎng)數(shù)據(jù)、網(wǎng)頁瀏覽時長、作業(yè)完成數(shù)據(jù)、作業(yè)完成時長、課堂互動數(shù)據(jù)等等,幫助學(xué)校管理者針對學(xué)生群體進(jìn)行標(biāo)簽化分析。幫助教育管理者從學(xué)習(xí),網(wǎng)絡(luò)行為,生活等多維度分析學(xué)生群體的習(xí)慣和特點,為學(xué)校實現(xiàn)個性化培養(yǎng)教育提供數(shù)據(jù)支撐。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關(guān)推薦

    云脈文檔識別在教育行業(yè)的應(yīng)用

    `如今云脈文檔識別在各行各業(yè)都有非常廣泛的應(yīng)用空間,教育行業(yè)也不例外。 對于工作繁忙的教師而言,平時在書店,圖書館看書、看雜志時發(fā)現(xiàn)精彩詞句,或重要數(shù)據(jù)、資訊,想及時摘錄下來在課堂上分享給學(xué)生,通常
    發(fā)表于 03-13 17:25

    Banana Pi 攜手東莞金祿電子,發(fā)展開源硬件在教育行業(yè)的應(yīng)用

    Banana Pi 攜手東莞金祿電子,發(fā)展開源硬件在教育行業(yè)的應(yīng)用轉(zhuǎn)自lemaker東莞市金祿電子科技有限公司是一家從事無紙化教育整體解決方案及配套產(chǎn)品的研發(fā)、生產(chǎn)、銷售、應(yīng)用推廣的高新技術(shù)企業(yè)
    發(fā)表于 08-09 21:04

    VR虛擬現(xiàn)實軟件開發(fā)應(yīng)用在教育行業(yè)有哪些優(yōu)勢?

    提起VR虛擬現(xiàn)實軟件,不得不說的就是教育。那么,當(dāng)VR虛擬現(xiàn)實軟件用在教育行業(yè)到底會有怎樣的效果呢? VR虛擬現(xiàn)實軟件呈現(xiàn)的內(nèi)容是將現(xiàn)實與虛擬相融合,虛擬素材的展示非常的生動、形象、直觀,如電波
    發(fā)表于 12-17 14:16

    AR技術(shù)在教育行業(yè)的應(yīng)用

    AR技術(shù)在教育行業(yè)的應(yīng)用相對來說并不常見,除去對于兒童教育圖書,AR涂涂樂一類的應(yīng)用方式,在于其它方面的應(yīng)用方式少之又少。但是,教育行業(yè)作為
    發(fā)表于 07-17 11:37 ?2354次閱讀

    探索AR技術(shù)在教育行業(yè)的應(yīng)用,看看AR教育有什么優(yōu)勢與前景?

    說起AR教育相信大家都已經(jīng)耳熟能詳,AR(增強(qiáng)現(xiàn)實)技術(shù)將知識與概念形象化、具體化的展現(xiàn)出來,交互性及趣味性強(qiáng),虛實結(jié)合的教學(xué)環(huán)境來促進(jìn)知識的遷移,達(dá)到寓教于樂的目的,越來越多的教育工作者去了解與探索AR技術(shù)在教育
    發(fā)表于 08-08 11:39 ?9103次閱讀

    物聯(lián)網(wǎng)在教育的應(yīng)用

    本文主要講述了物聯(lián)網(wǎng)在教育領(lǐng)域中的應(yīng)用。
    的頭像 發(fā)表于 08-15 08:50 ?5181次閱讀

    人工智能是干嘛的 人工智能在教育的應(yīng)用研究

      摘 要:如今人工智能在教育行業(yè)的應(yīng)用已經(jīng)收到了越來越多的關(guān)注。本文通過查閱相關(guān)文獻(xiàn)資料,分析其研究與應(yīng)用,總結(jié)了人工智能在教育行業(yè)的應(yīng)
    發(fā)表于 07-18 16:55 ?0次下載

    智能語音助手在教育行業(yè)的應(yīng)用與挑戰(zhàn)

    一、引言 隨著人工智能技術(shù)的不斷發(fā)展,智能語音助手在教育行業(yè)的應(yīng)用越來越廣泛。語音數(shù)據(jù)在教育智能語音助手中發(fā)揮著重要作用,為系統(tǒng)提供了豐富
    的頭像 發(fā)表于 01-19 17:21 ?679次閱讀

    投影融合系統(tǒng)在教育領(lǐng)域的應(yīng)用與發(fā)展趨勢

    投影融合系統(tǒng)在教育領(lǐng)域的應(yīng)用正逐漸普及,它為教育帶來了新的教學(xué)方式和更豐富的教學(xué)內(nèi)容。以下是一些投影融合系統(tǒng)在教育領(lǐng)域的應(yīng)用與發(fā)展趨勢: 增
    的頭像 發(fā)表于 02-01 15:10 ?379次閱讀
    投影融合<b class='flag-5'>系統(tǒng)</b><b class='flag-5'>在教育</b>領(lǐng)域的應(yīng)用與發(fā)展趨勢

    SOLIDWORKS在教育領(lǐng)域的應(yīng)用

    隨著科技的飛速發(fā)展和數(shù)字化浪潮的推進(jìn),SOLIDWORKS作為一款強(qiáng)大的三維設(shè)計軟件,其應(yīng)用領(lǐng)域已經(jīng)不僅局限于工程設(shè)計和制造行業(yè),還逐漸滲透到教育領(lǐng)域中,成為培養(yǎng)學(xué)生實踐能力和創(chuàng)新思維的重要工具。本文將探討SOLIDWORKS在教育
    的頭像 發(fā)表于 04-07 16:44 ?318次閱讀
    SOLIDWORKS<b class='flag-5'>在教育</b>領(lǐng)域的應(yīng)用

    光纖技術(shù)在教育的意義大嗎

    。 光纖技術(shù)在教育的意義 光纖技術(shù)是教育領(lǐng)域的變革力量,影響著學(xué)習(xí)生態(tài)系統(tǒng)的各個方面。其貢獻(xiàn)包括公平的入學(xué)機(jī)會、成本效率、全球連通性以及適應(yīng)新興
    的頭像 發(fā)表于 04-11 11:56 ?191次閱讀

    訊維通信技術(shù)在教育行業(yè)的應(yīng)用案例研究

    訊維通信技術(shù)在教育行業(yè)的應(yīng)用案例豐富多樣,為教育機(jī)構(gòu)帶來了顯著的效益和變革。以下是一些具體的應(yīng)用案例研究: 案例一:數(shù)字孿生智慧課堂 某知名大學(xué)引入了訊維的數(shù)字孿生技術(shù),成功構(gòu)建了數(shù)字孿生智慧課堂
    的頭像 發(fā)表于 04-18 15:42 ?232次閱讀

    訊維智能可視化綜合平臺在教育行業(yè)的應(yīng)用與前景

    訊維智能可視化綜合平臺在教育行業(yè)的應(yīng)用已經(jīng)展現(xiàn)出其巨大的潛力和價值,對于提升教學(xué)效果、豐富學(xué)習(xí)體驗以及推動教育行業(yè)的數(shù)字化轉(zhuǎn)型具有重要意義。以下是該平臺
    的頭像 發(fā)表于 05-11 16:34 ?307次閱讀

    SolidWorks教育在教學(xué)的具體應(yīng)用

    隨著科技的不斷進(jìn)步和工程教育的快速發(fā)展,計算機(jī)輔助設(shè)計軟件在教學(xué)領(lǐng)域的應(yīng)用越來越廣泛。SolidWorks教育版作為一款功能強(qiáng)大、操作簡便的三維建模軟件,已經(jīng)成為工程教育領(lǐng)域中不可或缺
    的頭像 發(fā)表于 07-09 16:19 ?272次閱讀
    SolidWorks<b class='flag-5'>教育</b>版<b class='flag-5'>在教</b>學(xué)<b class='flag-5'>中</b>的具體應(yīng)用

    生成式人工智能在教育的應(yīng)用

    生成式人工智能在教育的應(yīng)用日益廣泛,為教育領(lǐng)域帶來了諸多變革和創(chuàng)新。以下是對生成式人工智能在教育的幾個主要應(yīng)用方面的詳細(xì)闡述:
    的頭像 發(fā)表于 09-16 16:07 ?353次閱讀