去年,NASA 選擇了亞馬遜云服務(wù)(AWS)來托管地球科學(xué)和 ESDIS 信息系統(tǒng)的數(shù)據(jù)。新數(shù)據(jù)庫(kù)可方便地整理相關(guān)任務(wù)信息,預(yù)計(jì)存儲(chǔ)需求會(huì)從當(dāng)前的 32PB 增長(zhǎng)到近 250PB 。然而除了額外的容量需求,該機(jī)構(gòu)似乎忘記了 AWS 的數(shù)據(jù)訪問和檢索成本,即所謂的“出口費(fèi)用”。
資料圖(來自:NASA)
當(dāng)將數(shù)據(jù)從云端移動(dòng)到另一個(gè)區(qū)域(比如供科學(xué)家進(jìn)行分析的本地工作站)時(shí),NASA 將不得不在按月收取的服務(wù)費(fèi)的基礎(chǔ)上,再支付一筆額外的費(fèi)用。
換言之,檢索的數(shù)據(jù)越多,相關(guān)的開銷舊越大。目前該機(jī)構(gòu)將數(shù)據(jù)本地存儲(chǔ)在 12 個(gè)分布式的活動(dòng)檔案中心(DAAC)中,但希望在未來幾年完成全面的云端遷移。
初次轉(zhuǎn)移計(jì)劃已在今年一季度開展,但相關(guān)數(shù)據(jù)都來自何處、NASA 又是如何精確到 215PB 的呢?
據(jù)悉,NASA 是根據(jù)該機(jī)構(gòu)即將開展的 15 次訪問來估算的,預(yù)計(jì)每日將產(chǎn)生 100TB 以上的信息。
其中包括 NASA-ISRO 合成孔徑雷達(dá)(NISAR)和地表水與海洋地形(SWOT)衛(wèi)星的數(shù)據(jù),這部分將率先上傳到 Earthdata Cloud 。
若該機(jī)構(gòu)可以負(fù)擔(dān)得起這部分?jǐn)?shù)據(jù)出口費(fèi)用,那將所有這些數(shù)據(jù)存儲(chǔ)在云端(而不是像現(xiàn)在這樣分散),將對(duì) NASA 研究人員大有裨益。
2017 ~ 2025 數(shù)據(jù)增長(zhǎng)量(藍(lán)色)/ 提取速度(橙色)
遺憾的是,根據(jù) NASA 監(jiān)察長(zhǎng)辦公室在今年 3 月份發(fā)布的一份審計(jì)報(bào)告,相關(guān)模擬并不能準(zhǔn)確地得出 ESDIS 和 EOSDIS 的出口費(fèi)用將有多高。
若 NASA 出于成本控制的原因而限制數(shù)據(jù)的輸出量,此舉也將帶來一些潛在的風(fēng)險(xiǎn),即科學(xué)數(shù)據(jù)對(duì)最終用戶的可訪問性將大大地降低。
基于此,該報(bào)告提出了三點(diǎn)建議:
首先,一旦 NISAR 和 SWOT 投入運(yùn)營(yíng)并提供了足夠的數(shù)據(jù),NASA 必須完成獨(dú)立的分析,以確定云遷移和保障當(dāng)前 DAAC 運(yùn)營(yíng)的長(zhǎng)期財(cái)務(wù)可持續(xù)性。
其次,適當(dāng)納入機(jī)構(gòu)指導(dǎo),以在制定數(shù)據(jù)管理計(jì)劃的早期階段,做好 ESDIS 和 OCIO 的協(xié)調(diào)工作。
第三,確保在 DAAC 分類過程中考慮所有適用的信息類型,在確定影響級(jí)別時(shí)考慮適當(dāng)?shù)那疤?,并?duì)相關(guān)流程做到標(biāo)準(zhǔn)化。
-
NASA
+關(guān)注
關(guān)注
0文章
427瀏覽量
30863 -
AWS
+關(guān)注
關(guān)注
0文章
423瀏覽量
24261
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論