0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于流式計算的DPI數(shù)據(jù)處理方案

電子工程師 ? 來源:陳翠 ? 2019-05-01 20:22 ? 次閱讀

1 引言

隨著移動互聯(lián)網(wǎng)的不斷發(fā)展以及各類智能設(shè)備日益深入民眾日常生活中,人類社會產(chǎn)生的數(shù)據(jù)量正在以指數(shù)級快速增長,人類已經(jīng)正式邁入大數(shù)據(jù)時代[1]。如今,運營商能夠獲得的用戶數(shù)據(jù)越來越豐富,通過DPI(Deep Packet Inspector,深度分組檢測)分析技術(shù),能夠較好地識別網(wǎng)絡(luò)上的流量類別、應用層上的應用種類等[2]。在這個“數(shù)據(jù)為王”的時代,如何充分利用這筆重要的戰(zhàn)略資產(chǎn)已成為重中之重。

數(shù)據(jù)規(guī)模的快速增長給大數(shù)據(jù)分析處理帶來了巨大的挑戰(zhàn),尤其是在通信行業(yè),數(shù)據(jù)越發(fā)呈現(xiàn)出無限性、突發(fā)性和實時性等特征[3],傳統(tǒng)的基于MapReduce的批處理模式難以滿足數(shù)據(jù)實時性的要求,而能否在第一時間獲得數(shù)據(jù)所蘊含的信息決定了數(shù)據(jù)的價值。因此,流式處理技術(shù)成為大數(shù)據(jù)技術(shù)研究的新熱點[4]。流式處理能夠針對數(shù)據(jù)的變化進行實時處理,能夠在秒級獲得處理結(jié)果,特別適合一些對時效性要求很高的場景。

本文結(jié)合電信運營商的需求,對DPI數(shù)據(jù)進行實時的采集及處理,提出一種基于流式計算的DPI數(shù)據(jù)處理方案,能夠?qū)@得DPI數(shù)據(jù)實時信息的時延降低到分鐘級,甚至秒級,實現(xiàn)對電信用戶上網(wǎng)信息的實時處理、監(jiān)測及分類匯總,為之后進行的大數(shù)據(jù)應用提供了良好基礎(chǔ)。

2 流式處理概述

傳統(tǒng)基于MapReduce大數(shù)據(jù)處理技術(shù)實際上是一種批處理方式,如圖1所示。批處理模式首先要完成數(shù)據(jù)的累積和存儲,然后Hadoop客戶端將數(shù)據(jù)上傳到HDFS上,最后才啟動Map/Reduce進行數(shù)據(jù)處理,處理后再寫入到HDFS。這種方式必須要所有數(shù)據(jù)都要準備好,然后統(tǒng)一進行集中計算和價值發(fā)現(xiàn),無法滿足實時性的要求。

2015年,Nathan Marz提出了實時大數(shù)據(jù)處理框架Lambda架構(gòu)[5],整合了離線計算和實時計算,能夠滿足實時系統(tǒng)高容錯、低時延和可擴展等要求,并且可集成Hadoop、Kafka、Storm、Spark及HBase等各類大數(shù)據(jù)組件。

一個典型的Lambda架構(gòu)如圖2所示,主要使用的場景是邏輯復雜且延遲低的程序。數(shù)據(jù)會分別灌入實時系統(tǒng)和批處理系統(tǒng),然后各自輸出自己的結(jié)果,結(jié)果會在查詢端進行合并。

基于流式計算的DPI數(shù)據(jù)處理方案

圖2 Lambda架構(gòu)圖

3 流式計算架構(gòu)對比

流式計算對系統(tǒng)的容錯、時延、可擴展及可靠性能力提出了很高的要求,當前有許多流式計算框架(如Spark streaming[10]、Storm[11]、Kafka Stream[12]、Flink[13]和PipelineDB[14]等)已經(jīng)廣泛應用于各行各業(yè),并且還在不斷迭代發(fā)展,適用的場景也各不相同。

3.1 Spark streaming

Spark是由加州大學伯克利分校AMP實驗室專門為大數(shù)據(jù)處理而設(shè)計的計算框架[6]。Spark Streaming是建立在Spark上的實時計算框架,是Spark的核心組件之一,通過它內(nèi)置的API和基于內(nèi)存的高效引擎,用戶可以結(jié)合流處理、批處理和交互式查詢開發(fā)應用。

Spark Streaming并不像其他流式處理框架每次只處理一條記錄,而是將流數(shù)據(jù)離散化處理,每次處理一批數(shù)據(jù)(DStream),使之能夠進行秒級以下的快速批處理,執(zhí)行流程如圖3所示。Spark Streaming的Receiver并行接收數(shù)據(jù),將數(shù)據(jù)緩存至內(nèi)存中,經(jīng)過延遲優(yōu)化后Spark引擎對短任務(wù)(幾十毫秒)進行批處理。這樣設(shè)計的好處讓Spark Streaming能夠同時處理離線處理和流處理問題。

基于流式計算的DPI數(shù)據(jù)處理方案

圖3 Spark Streaming執(zhí)行流程

Spark Streaming能在故障報錯下迅速恢復狀態(tài),整合了批處理與流處理,內(nèi)置豐富高級算法處理庫,發(fā)展迅速,社區(qū)活躍。毫無疑問,Spark Streaming是流式處理框架的佼佼者。缺點是由于需要累積一批小文件才處理,因此時延會稍大,是準實時系統(tǒng)。

3.2 Storm

Storm通常被比作“實時的Hadoop”,是Twitter開發(fā)的實時、分布式以及具備高容錯計算系統(tǒng),可以簡單、可靠地處理大量數(shù)據(jù)流,用戶可以采用任意編程語言來開發(fā)應用。

在Storm中,一個用于實時計算的圖狀結(jié)構(gòu)稱之為拓撲(topology),拓撲提交到集群,由集群中的主控節(jié)點分發(fā)代碼,分配任務(wù)到工作節(jié)點執(zhí)行。一個拓撲中包括spout和bolt兩種角色,其中spout發(fā)送消息,負責將數(shù)據(jù)流以tuple元組的形式發(fā)送出去;而bolt則負責轉(zhuǎn)換這些數(shù)據(jù)流,在bolt中可以完成映射map、過濾filter等操作,bolt自身也可以隨機將數(shù)據(jù)發(fā)送給其他bolt。

基于流式計算的DPI數(shù)據(jù)處理方案

圖4 Storm數(shù)據(jù)流動

Storm能將數(shù)據(jù)在不同的bolt中流動、移動數(shù)據(jù),真正實現(xiàn)流式處理,易于擴展,靈活性強,高度專注于流式處理。Storm在事件處理與增量計算方面表現(xiàn)突出,能夠以實時方式根據(jù)不斷變化的參數(shù)對數(shù)據(jù)流進行處理。

3.3 Kafka Stream

Kafka Stream是Apache Kafka開源項目的一個組成部分,是一個功能強大、易于使用的庫,它使得Apache Kafka擁有流處理的能力。

Kafka Stream是輕量級的流計算類庫,除了Apache Kafka之外沒有任何外部依賴,可以在任何Java程序中使用,使用Kafka作為內(nèi)部消息通訊存儲介質(zhì),因此不需要為流處理需求額外部署一個集群。

Kafka Stream入門簡單,并且不依賴其他組件,非常容易部署,支持容錯的本地狀態(tài),延遲低,非常適合一些輕量級流處理的場景。

3.4 Flink

Flink是一個面向分布式數(shù)據(jù)流處理和批量數(shù)據(jù)處理的開源計算平臺,同時支持批處理以及流處理,主要針對流數(shù)據(jù),將批數(shù)據(jù)視為流數(shù)據(jù)的一個極限特例。

Flink核心是一個流式的數(shù)據(jù)流執(zhí)行引擎,它提供了數(shù)據(jù)分布、數(shù)據(jù)通信以及容錯機制等功能。流執(zhí)行引擎之上,F(xiàn)link提供了更高層次的API以便用戶使用。Flink還針對某些領(lǐng)域提供了領(lǐng)域庫,例如Flink ML、Flink的機器學習庫等。

Flink適合有極高流處理需求,并有少量批處理任務(wù)的場景。該技術(shù)可兼容原生Storm和Hadoop程序,可在YARN管理的集群上運行。目前Flink最大的局限之一是在社區(qū)活躍度方面,該項目的大規(guī)模部署尚不如其他處理框架那么常見。

3.5 PipeLineDB

PipelineDB是基于PostgreSQL的一個流式計算數(shù)據(jù)庫,效率非常高,通過SQL對數(shù)據(jù)流做操作,并把操作結(jié)果儲存起來。其基本過程是:創(chuàng)建PipelineDB Stream、編寫SQL、對Stream做操作、操作結(jié)果被保存到continuous view。

PipelineDB特點是可以只使用SQL進行流式處理,不需要代碼,可以高效可持續(xù)自動處理流式數(shù)據(jù),只存儲處理后的數(shù)據(jù),因此非常適合流式數(shù)據(jù)處理,例如網(wǎng)站流量統(tǒng)計、網(wǎng)頁的瀏覽統(tǒng)計等。

3.6 架構(gòu)對比

上文提到的5種流式處理框架對比如表1所示:

表1 流式框架對比

基于流式計算的DPI數(shù)據(jù)處理方案

Storm的特點是成熟,是流式處理框架實際上的標準,模型、編程難度都比較復雜,框架采用循環(huán)處理數(shù)據(jù),對系統(tǒng)資源,尤其是CPU資源消耗很大,當任務(wù)空閑時,需要sleep程序,減少對資源的消耗。Spark Streaming兼顧了批處理以及流式處理,并且有Spark的強大支持,發(fā)展?jié)摿Υ?,但與Kafka的接口平滑性不夠。Kafka Stream是Kafka的一個開發(fā)庫,具有入門、編程、部署運維簡單的特點,并且不需要部署額外的組件,但對于多維度的統(tǒng)計來說,需要基于不同topic來做分區(qū),編程模型復雜。Flink跟Spark Streaming很像,不同的是Flink把所有任務(wù)當成流來處理,在迭代計算、內(nèi)存管理方面比Spark Streaming稍強,缺點是社區(qū)活躍度不高,還不夠成熟;PipelineDB是一個流式計算數(shù)據(jù)庫,能執(zhí)行簡單的流式計算任務(wù),優(yōu)勢是基本不需要開發(fā),只要熟悉SQL操作均可以輕松使用,但對于集群計算,需要商業(yè)上的支持。

4 DPI數(shù)據(jù)處理方案

基于實際任務(wù)需求以及上文流式框架的對比,由于Kafka Stream編程難度小,不需要另外安裝軟件,與Kafka等組件無縫連接,比較穩(wěn)定,并且各種性能均比較優(yōu)秀,因此本文選擇了Kafka Stream作為流式處理的核心組件。

4.1寬帶DPI處理

為了完成寬帶DPI數(shù)據(jù)的實時抓包、資料填補、清洗、轉(zhuǎn)換及并入庫等工作,應用了上述DPI數(shù)據(jù)處理方案。具體項目方案如圖5所示:

基于流式計算的DPI數(shù)據(jù)處理方案

圖5 廣州寬帶DPI處理方案

Mina進程是一個JAVA程序,基于mina框架開發(fā),主要接收AAA數(shù)據(jù)包,獲得用戶賬戶信息,解析計算,并持久化到redis,最后發(fā)送給抓包(Capture)程序。Capture程序由C語言編寫,使用開源pcap抓取網(wǎng)卡http包,解析,結(jié)合用戶帳號資料,把DPI寫入到Kafka中。Kafka stream完成DPI的實時清洗和轉(zhuǎn)換工作。

Flume[15]是Cloudera開源的分布式可靠、可用、高效的收集,聚合和移動不同數(shù)據(jù)源的海量數(shù)據(jù)系統(tǒng),配置簡單,基本無需開發(fā),資源消耗低,支持傳輸數(shù)據(jù)到HDFS,非常適合與大數(shù)據(jù)系統(tǒng)結(jié)合。本項目將流式處理完后的數(shù)據(jù)通過Flume從Kafka中寫入到HDFS,建立hive表,為上層應用提供數(shù)據(jù)。

Kafka Stream采用自主研發(fā)的ETL框架[16],負責數(shù)據(jù)過濾(圖片、視頻等去掉),數(shù)據(jù)處理(獲取網(wǎng)絡(luò)ID、字段解析等)。ETL框架采用JAVA語言開發(fā),支持多種數(shù)據(jù)源,包括普通文本、壓縮格式及xml立體格式等。支持多種大數(shù)據(jù)計算框架,包括Map/Reduce、Spark streaming、Kafka Stream和Flume等;具有擴展方便、字段校驗、支持字段的通配符及支持維表查詢等功能。在運維方面,支持變量引用以及出錯處理等功能。

4.24GDPI實時統(tǒng)計

以電信4G DPI信息作為數(shù)據(jù)源,通過流式處理,完成DPI的實時統(tǒng)計工作,包括多粒度(5分鐘/1小時/1天)去重用戶統(tǒng)計、多粒度去重不同號碼頭用戶統(tǒng)計、多粒度流量統(tǒng)計及多粒度去重域名統(tǒng)計等。4G DPI實時統(tǒng)計具體項目方案如圖6所示:

基于流式計算的DPI數(shù)據(jù)處理方案

圖6 4G DPI實時統(tǒng)計方案圖

數(shù)據(jù)源是gzip壓縮文件,因為flume原生不支持.gz或.tar.gz文件格式,所以修改了Flume底層代碼,實現(xiàn)對壓縮文件的處理,省去了解壓時間。Flume采集文件時以用戶手機號碼作為分區(qū)的key,將同一號碼的數(shù)據(jù)分到同一分區(qū),便于去重。通過Kafka集群管理工具,Kafka Manager[17]可以很好地監(jiān)測Kafka集群的狀態(tài)。Kafka集群生產(chǎn)者如圖7所示:

基于流式計算的DPI數(shù)據(jù)處理方案

圖7 Kafka集群生產(chǎn)者

Kafka Stream消費4GDPI的數(shù)據(jù),并行處理。在程序里設(shè)置不同的計數(shù)器,所有數(shù)據(jù)都經(jīng)過這些計數(shù)器處理,為了解決去重問題,引入了布隆過濾,雖然有一定的誤判率,但是還是能比較好的完成去重,同時保證系統(tǒng)的性能。同樣消費者也可以通過Kafka Manager進行管理,可以直觀觀察到消費者的落后程度。

為了滿足不同的輸出要求,程序設(shè)置了三種輸出供選擇。粒度為天的數(shù)據(jù)將會寫到MySQL作為備份,針對熱點區(qū)域的監(jiān)控數(shù)據(jù)將會輸出到Redis,同時,為了方便管理以及數(shù)據(jù)呈現(xiàn),還采用了ELK框架(ElasticSearch+Logstash+Kibana),將所有數(shù)據(jù)傳到Kibana做前端展示。Kibana界面如圖8所示:

圖8 Kibana界面

5 實踐及分析

5.1 部署實踐

上述兩個系統(tǒng)均已應用在實際的生產(chǎn)中,均有不錯的表現(xiàn),能夠滿足任務(wù)需求,并且已經(jīng)穩(wěn)定運行。

寬帶DPI處理項目有2臺采集機、1臺AAA服務(wù)器及5臺Kafka機器。采集機每臺每秒產(chǎn)生115 MB數(shù)據(jù),兩臺1.8 G流量。采集機寫Kafka 33萬條/秒,Kafka Stream寫Kafka 22萬條/秒,清洗率(清洗工作把諸如圖片、視頻及js請求等與業(yè)務(wù)無關(guān)的DPI信息去掉)為33%。Kafka Stream落后處理穩(wěn)定在500萬數(shù)據(jù),延遲處理在15 s之內(nèi),F(xiàn)lume寫HDFS落后保持在100萬左右,5 s內(nèi)的延遲。寬帶DPI處理項目性能如圖9所示:

基于流式計算的DPI數(shù)據(jù)處理方案

圖9 寬帶DPI處理項目性能

4G DPI實時統(tǒng)計項目共6臺機器,1臺為Flume采集機,其余5臺部署Kafka、Kafka Stream及ELK。采集機寫Kafka一般為10萬條/秒,峰值可達到25萬條/秒。ElasticSearch集群一共8個實例,每個實例配置2 G內(nèi)存。目前集群有13億條數(shù)據(jù),占361 G空間。通過Logstash導入數(shù)據(jù)到ElasticSearch峰值可以達到8~9萬條/秒。Kafka Stream處理數(shù)據(jù)落后在10 s內(nèi),Logstash寫ElasticSearch落后在5 s內(nèi),如圖10所示。目前4G DPI實時統(tǒng)計項目日均處理文件超過15 000個,大小達到1.6 T,日均處理記錄數(shù)超過100億。

基于流式計算的DPI數(shù)據(jù)處理方案

圖10 4G DPI實時統(tǒng)計項目性能

5.2 存在的問題

在4G DPI實時統(tǒng)計項目開發(fā)過程中,隨著項目的需求越來越多,后面增加了對域名和CGI的去重,而且同一域名或者CGI不在同一Kafka分區(qū),導致結(jié)果有偏差。為了解決這一問題,程序設(shè)計了二次去重,第一次去重的結(jié)果把CGI或者域名作為key輸出到Kafka集群,再做了一次去重工作,導致延遲時間變大和系統(tǒng)維護變復雜。

由于寬帶DPI處理中不涉及去重,只是數(shù)據(jù)過濾和數(shù)據(jù)轉(zhuǎn)換,因此Kafka Stream是非常適合的。但在涉及分區(qū)和去重的4G DPI實時統(tǒng)計項目中,應當采用Storm作為流式處理框架。在Storm中,數(shù)據(jù)從一個bolt流到另外一個bolt,這樣數(shù)據(jù)可以在一個bolt中按手機號碼分區(qū),在另外一個bolt中又可以按CGI或者域名分區(qū),可以避免二次去重問題,降低編程模型復雜度。

在程序設(shè)計之初,應根據(jù)應用場景需求選擇合適的技術(shù)框架。如果項目基礎(chǔ)結(jié)構(gòu)中涉及Spark,那Spark Streaming是不錯的選擇;如果像4G DPI實時統(tǒng)計項目一樣需要數(shù)據(jù)轉(zhuǎn)移或者去重,那么Storm是首選;如果是簡單的數(shù)據(jù)清洗和轉(zhuǎn)換處理,那么Kafka Stream是不錯的選擇。對于簡單小規(guī)模的實時統(tǒng)計,PipeLineDB足以勝任。

6 結(jié)束語

大數(shù)據(jù)流式計算和批處理適用于不同的業(yè)務(wù)場景,在對時效要求高的場景下,流式計算具有明顯的優(yōu)勢。本文首先概述了流式處理以及其與批處理的區(qū)別,然后對業(yè)界流行的流式計算框架進行了對比,根據(jù)業(yè)務(wù)需求提出了以Kafka Stream為流式處理框架的DPI數(shù)據(jù)處理方案,搭配Kafka、Flume及ELK等組件,具有入門迅速、編程難度低和部署維護簡單等特點。并且將方案應用到了寬帶DPI處理項目以及4G DPI實時統(tǒng)計項目中,完成了任務(wù)需求,性能優(yōu)異,運行穩(wěn)定。

在對實際項目實踐中,隨著任務(wù)需求的增多,發(fā)現(xiàn)Kafka Stream在應對多維度數(shù)據(jù)去重問題時表現(xiàn)不力,需要引入二次過濾來解決問題。因此在項目需求階段,便要在技術(shù)框架選型時充分考慮可能出現(xiàn)的問題,結(jié)合技術(shù)框架適用場景,綜合考慮。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)處理
    +關(guān)注

    關(guān)注

    0

    文章

    554

    瀏覽量

    28483
  • DPI
    DPI
    +關(guān)注

    關(guān)注

    0

    文章

    36

    瀏覽量

    11495
收藏 人收藏

    評論

    相關(guān)推薦

    計算與大數(shù)據(jù)_9.3數(shù)據(jù)處理方法2#硬聲創(chuàng)作季

    計算數(shù)據(jù)處理
    Hello,World!
    發(fā)布于 :2022年10月28日 19:53:55

    計算、大數(shù)據(jù)處理技術(shù)交流

    計算、大數(shù)據(jù)處理技術(shù)交流圖形圖像是數(shù)據(jù)處理量最大的版塊之一,也是當今云計算的重要課題之一,圖形圖像處理大會給大家?guī)碇T多名家
    發(fā)表于 09-16 14:18

    數(shù)據(jù)處理問題!

    數(shù)據(jù)處理基本包涵擬合,插值,濾波等,LabVIEW中一般處理的都是N行1列數(shù)據(jù),怎么處理N行,M列數(shù)據(jù),我現(xiàn)在需要將所有組
    發(fā)表于 05-08 22:43

    超聲波回波的數(shù)據(jù)處理

    對于精度要求很高的(ns級)回波時間的計算,我的采樣頻率最高只能達到50M左右,有什么數(shù)據(jù)處理方法能提高精度嗎?看了些文獻,感覺針對這種高精度的方法較少(插值法可靠嗎?),有很多利用包絡(luò)法處理
    發(fā)表于 05-23 20:46

    VHDL 基于FPGA的高速數(shù)據(jù)處理系統(tǒng)設(shè)計思路

    量很大,不過比較適合并行計算。系統(tǒng)的數(shù)據(jù)處理部分采用的是XC4VSX25,Virtex-4 SX系列是Virtex-4平臺中專門為了高性能數(shù)字信號處理(DSP)應用解決方案而設(shè)計的。X
    發(fā)表于 08-31 18:54

    FPGA的高速數(shù)據(jù)處理系統(tǒng)結(jié)構(gòu)和硬件設(shè)計

    量很大,不過比較適合并行計算。系統(tǒng)的數(shù)據(jù)處理部分采用的是XC4VSX25,Virtex-4 SX系列是Virtex-4平臺中專門為了高性能數(shù)字信號處理(DSP)應用解決方案而設(shè)計的。X
    發(fā)表于 09-04 09:56

    數(shù)據(jù)處理與控制策略

    數(shù)據(jù)處理與控制策略Data Processing &  Control Strategy數(shù)字控制器的設(shè)計技術(shù),數(shù)字濾波和數(shù)據(jù)處理,數(shù)控技術(shù)基礎(chǔ),數(shù)字PID控制算法常規(guī)控制方案,先進控制
    發(fā)表于 01-14 15:33 ?27次下載

    基于云計算數(shù)據(jù)處理平臺研究設(shè)計

    通過分析亞馬遜彈性MapReduce( EMR)平臺構(gòu)架,針對信息情報機構(gòu)內(nèi)部數(shù)據(jù)處理的迫切需求,提出通過開源技術(shù)Xen 和Hadoop平臺構(gòu)建基于云計算的動態(tài)可伸縮的海量數(shù)據(jù)處理平臺并給出實施
    發(fā)表于 09-30 10:06 ?6次下載
    基于云<b class='flag-5'>計算</b>的<b class='flag-5'>數(shù)據(jù)處理</b>平臺研究設(shè)計

    Thumb數(shù)據(jù)處理指令

    Thumb數(shù)據(jù)處理指令 數(shù)據(jù)處理指令是指那些操作寄存器中數(shù)據(jù)的指令。Thumb指令集中的數(shù)據(jù)處理指令是ARM指令集數(shù)據(jù)處理指令的一個子集,其
    發(fā)表于 10-19 10:04 ?0次下載

    基于大數(shù)據(jù)流式計算

    流式計算是大數(shù)據(jù)的一種重要計算模式,大數(shù)據(jù)流式計算已成為研究熱點。任務(wù)管理是大
    發(fā)表于 11-22 17:34 ?1次下載
    基于大<b class='flag-5'>數(shù)據(jù)</b>的<b class='flag-5'>流式</b><b class='flag-5'>計算</b>

    流式數(shù)據(jù)實時處理技術(shù)及應用

    數(shù)據(jù)處理系統(tǒng)根據(jù)其時效性可分為批式大數(shù)據(jù)流式數(shù)據(jù)兩類。上述兩類系統(tǒng)均無法滿足事中感知查詢分析處理模式的需求。為此,從分析大
    發(fā)表于 03-28 15:29 ?10次下載

    計算數(shù)據(jù)處理主要包括哪些方面

    計算機收集、記錄數(shù)據(jù),經(jīng)加工產(chǎn)生新的信息形式的技術(shù)。數(shù)據(jù)指數(shù)字、符號、字母和各種文字的集合。數(shù)據(jù)處理涉及的加工處理比一般的算術(shù)運算要廣泛得
    的頭像 發(fā)表于 01-01 10:47 ?3.8w次閱讀

    數(shù)據(jù)處理的基本問題

    計算機是進行數(shù)據(jù)處理、運算的機器(有點兒像機電系統(tǒng)中的電動機)。當我們回顧數(shù)據(jù)管理簡史并較深入理解計算機原理后會發(fā)現(xiàn),有兩個基本問題就包含在其中, 一是
    的頭像 發(fā)表于 02-21 16:12 ?987次閱讀
    <b class='flag-5'>數(shù)據(jù)處理</b>的基本問題

    虹科分享 | 什么是深度數(shù)據(jù)包檢測(DPI

    深度數(shù)據(jù)包檢測(DPI)是一種分析通過網(wǎng)絡(luò)發(fā)送的流量的高級方法。DPI使用數(shù)據(jù)處理來檢查數(shù)據(jù)包的特定細節(jié),作為
    的頭像 發(fā)表于 10-13 09:48 ?1489次閱讀
    虹科分享 | 什么是深度<b class='flag-5'>數(shù)據(jù)</b>包檢測(<b class='flag-5'>DPI</b>)

    邊緣計算物聯(lián)網(wǎng)關(guān)如何優(yōu)化數(shù)據(jù)處理流程

    在物聯(lián)網(wǎng)技術(shù)日新月異的今天,數(shù)據(jù)的產(chǎn)生、傳輸與處理已成為推動行業(yè)智能化轉(zhuǎn)型的關(guān)鍵。邊緣計算物聯(lián)網(wǎng)關(guān),作為這一生態(tài)系統(tǒng)中的核心組件,正以其獨特的優(yōu)勢,在數(shù)據(jù)處理效率、實時性、安全性及成本
    的頭像 發(fā)表于 07-30 17:27 ?249次閱讀
    邊緣<b class='flag-5'>計算</b>物聯(lián)網(wǎng)關(guān)如何優(yōu)化<b class='flag-5'>數(shù)據(jù)處理</b>流程