0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息攜手北京英信 基于分布式存儲 助力求臻醫(yī)學(xué)解鎖生命密碼

全球TMT ? 來源: 全球TMT ? 作者: 全球TMT ? 2023-04-21 17:27 ? 次閱讀

北京2023年4月21日 /美通社/ -- "一花一世界",這句話在蛋白質(zhì)、DNA所在的微觀世界里體現(xiàn)得淋漓盡致,大到動植物、小到細(xì)菌,都蘊(yùn)含著獨(dú)特的DNA,例如人體內(nèi)就包含著23對染色體、30億個(gè)堿基對的數(shù)據(jù)量。探索這些堿基對蘊(yùn)藏的"生命密碼",對于腫瘤早篩、罕見病診治、靶向藥物研制、遺傳演化和精準(zhǔn)醫(yī)學(xué)研究等方面有重大助益。近期,北京英信未來科技有限公司(以下簡稱北京英信)聯(lián)合浪潮信息,為求臻醫(yī)學(xué)的高通量測序平臺提供了分布式存儲平臺,為全國數(shù)百家醫(yī)院的腫瘤患者提供了精準(zhǔn)、高效的腫瘤基因檢測服務(wù)。

腫瘤基因檢測 為何要跑在大數(shù)據(jù)上

基因檢測作為醫(yī)療領(lǐng)域的新應(yīng)用,不僅需要基于大數(shù)據(jù)平臺,利用極為精密的測序系統(tǒng)將基因序列解讀出來,還要通過大數(shù)據(jù)分析、比對,精確地了解每個(gè)基因片段發(fā)揮的作用。在這方面,求臻醫(yī)學(xué)擁有專業(yè)、豐富的經(jīng)驗(yàn)。

求臻醫(yī)學(xué)成立于2017年,以新一代基因測序和先進(jìn)信息挖掘技術(shù)為基礎(chǔ),依托《中國腫瘤基因圖譜計(jì)劃》和《腫瘤精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)平臺》項(xiàng)目,深度融合基因檢測和人工智能,致力于腫瘤液態(tài)活檢領(lǐng)域診斷產(chǎn)品的開發(fā)及智能迭代升級,業(yè)務(wù)涵蓋腫瘤早篩、伴隨診斷、動態(tài)監(jiān)測、預(yù)后評估等多場景應(yīng)用領(lǐng)域,同時(shí)不斷探索發(fā)現(xiàn)中國人腫瘤基線及特異的生物標(biāo)志物,助力抗腫瘤藥物的研發(fā)。

然而,隨著業(yè)務(wù)高速發(fā)展,求臻醫(yī)學(xué)服務(wù)的醫(yī)院、患者越來越多,數(shù)據(jù)量也相應(yīng)的急速增長,原有的數(shù)據(jù)存儲系統(tǒng)常常因巨量訪問而超過性能閾值,存儲系統(tǒng)也存在容量空間嚴(yán)重不足的情況。在這種情況下,求臻醫(yī)學(xué)計(jì)劃對原有的數(shù)據(jù)存儲平臺進(jìn)行升級,新建的數(shù)據(jù)存儲平臺將主要支持腫瘤精準(zhǔn)診療的生物醫(yī)學(xué)信息化平臺。

此平臺涵蓋了知識數(shù)據(jù)庫、臨床信息采集系統(tǒng)、數(shù)據(jù)注釋接口(API)等模塊系統(tǒng),可以基于大數(shù)據(jù)分析為基因檢測客戶生成個(gè)體化的檢測報(bào)告。整個(gè)信息平臺數(shù)據(jù)存儲的基礎(chǔ)設(shè)施有著較大的挑戰(zhàn)和要求:

首先,是存儲數(shù)據(jù)量的需求。一個(gè)完整的基因測序樣本會產(chǎn)生千萬量級的文件。據(jù)了解,目前一臺先進(jìn)的測序儀、分析儀等設(shè)備每天捕捉的測序數(shù)據(jù)平均水平已達(dá)到4TB,加之基因信息分析過程一般會產(chǎn)生原始數(shù)據(jù)量5倍左右的中間文件及結(jié)果,PB級別存儲空間已經(jīng)成為存儲設(shè)備的基本要求。

其次,是數(shù)據(jù)可靠性的需求。腫瘤基因檢測數(shù)據(jù)作為腫瘤精準(zhǔn)診療核心數(shù)據(jù),檢測數(shù)據(jù)通常需要長期保存多年,通過合理的生命周期管理系統(tǒng)進(jìn)行歸檔保留,數(shù)據(jù)的自動化遷移歸檔、數(shù)據(jù)的安全性、存儲的易擴(kuò)展性是數(shù)據(jù)歸檔存儲考慮的重要因素。

最后,基因測序訪問實(shí)時(shí)性要求高?;驕y序過程是一個(gè)超高并發(fā)的文件轉(zhuǎn)換過程,整個(gè)生產(chǎn)過程有非常密集的文件讀取和寫入。整個(gè)生物樣本的導(dǎo)入過程對文件存儲的性能有著極高的要求,滿足科研任務(wù)對不同文件高帶寬的存儲需求,既要文件系統(tǒng)必須提供超大文件數(shù)量的支持,同時(shí)必須在有限的時(shí)間內(nèi)完成海量小文件的導(dǎo)入。

分布式存儲:為基因測序構(gòu)建數(shù)據(jù)基座

針對求臻醫(yī)學(xué)基因測序應(yīng)用數(shù)據(jù)量增長快、性能和可靠性要求高的業(yè)務(wù)特點(diǎn),浪潮信息攜手合作伙伴北京英信為求臻醫(yī)學(xué)提供了專業(yè)化的存儲解決方案。方案采用AS13000高密分布式存儲,節(jié)點(diǎn)間管理網(wǎng)絡(luò)采用千兆交換機(jī),通過100GB高速IB網(wǎng)絡(luò)連接前端并行計(jì)算業(yè)務(wù)集群,為前端業(yè)務(wù)構(gòu)建了一套大容量、高可靠、高性能、低延遲的數(shù)據(jù)存儲平臺。

在容量方面,AS13000分布式存儲集群由5個(gè)節(jié)點(diǎn)組成,每節(jié)點(diǎn)采用35塊8T大容量硬盤配置,可提供PB級存儲容量,滿足海量數(shù)據(jù)存儲需求。值得一提的是,該解決方案可實(shí)現(xiàn)分鐘級擴(kuò)充,最大可擴(kuò)展至5120節(jié)點(diǎn),在擴(kuò)容同時(shí)可保障業(yè)務(wù)性能無明顯波動,性能與容量隨著節(jié)點(diǎn)的擴(kuò)展而線性增長,避免對現(xiàn)有計(jì)算任務(wù)讀寫訪問性能造成影響,使得存儲系統(tǒng)的容量、性能在未來可隨時(shí)按需擴(kuò)展。

在可靠性方面,浪潮信息分布式存儲平臺AS13000提供副本和糾刪碼兩種數(shù)據(jù)保護(hù)方式,為用戶提供多層級的數(shù)據(jù)保護(hù)及容災(zāi)功能,充分保證檢測任務(wù)以及前端計(jì)算任務(wù)7x24小時(shí)的連續(xù)讀寫訪問。結(jié)合信息平臺檢測數(shù)據(jù)需要長期保存的業(yè)務(wù)特點(diǎn),浪潮信息采用三副本的數(shù)據(jù)冗余保護(hù)方式,同時(shí),還可搭配InView智能統(tǒng)一存儲管理平臺,對基因測序數(shù)據(jù)中心的設(shè)備進(jìn)行管理,提供容量、性能、故障的智能化預(yù)測性分析,幫助運(yùn)維人員預(yù)防硬件潛在故障,降低了存儲的復(fù)雜性,同時(shí)也有效地降低了運(yùn)維成本。

在性能方面,浪潮信息分布式存儲解決方案針對基因測序數(shù)據(jù)特點(diǎn)采用冷熱數(shù)據(jù)分級存儲搭配全局緩存技術(shù),實(shí)現(xiàn)熱數(shù)據(jù)快速響應(yīng),延遲降低40%。對于對象類型數(shù)據(jù),采用對象聚合技術(shù),來提升單次落盤的對象大小,降低落盤操作次數(shù),單節(jié)點(diǎn)恒定聚合帶寬達(dá)2GB/s以上,確?;驕y序任務(wù)的讀寫性能。

目前,基因測序應(yīng)用范圍在大幅擴(kuò)展,從科研服務(wù)的基因圖譜、遺傳多樣性,到醫(yī)療服務(wù)的疾病早篩和治療都能涵蓋,這對未來提升醫(yī)療智慧水平意義重大。浪潮信息始終堅(jiān)持通過數(shù)據(jù)的力量,為基因測序基礎(chǔ)研究儲能,驅(qū)動精準(zhǔn)醫(yī)療應(yīng)用加速發(fā)展。

審核編輯黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 存儲
    +關(guān)注

    關(guān)注

    13

    文章

    4180

    瀏覽量

    85493
  • 分布式
    +關(guān)注

    關(guān)注

    1

    文章

    843

    瀏覽量

    74424
收藏 人收藏

    評論

    相關(guān)推薦

    浪潮信息:元腦企智EPAI助力金融大模型快速落地

    浪潮信息在AI算力底座建設(shè)、大模型開發(fā)領(lǐng)域積累的成熟、成功經(jīng)驗(yàn)工具化,助力金融機(jī)構(gòu)又快、又穩(wěn)地部署生成AI應(yīng)用,助力金融數(shù)智化跨越發(fā)展
    的頭像 發(fā)表于 09-20 16:07 ?244次閱讀
    <b class='flag-5'>浪潮信息</b>:元腦企智EPAI<b class='flag-5'>助力</b>金融大模型快速落地

    基于分布式存儲WDS的金融創(chuàng)云承載數(shù)據(jù)庫類關(guān)鍵應(yīng)用

    基于分布式存儲WDS的金融創(chuàng)云承載數(shù)據(jù)庫類關(guān)鍵應(yīng)用
    的頭像 發(fā)表于 08-16 09:42 ?190次閱讀
    基于<b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>WDS的金融<b class='flag-5'>信</b>創(chuàng)云承載數(shù)據(jù)庫類關(guān)鍵應(yīng)用

    澎湃認(rèn)證:浪潮信息集中式存儲攜手長擎安全操作系統(tǒng)24完成兼容性認(rèn)證

    北京2024年7月19日?/美通社/ -- 近日,長擎安全操作系統(tǒng)24與浪潮信息集中式存儲HF/AS系列產(chǎn)品完成并通過浪潮信息澎湃技術(shù)相互兼容性測試認(rèn)證,長擎安全操作系統(tǒng)24與
    的頭像 發(fā)表于 07-19 13:53 ?239次閱讀
    澎湃認(rèn)證:<b class='flag-5'>浪潮信息</b>集中式<b class='flag-5'>存儲</b><b class='flag-5'>攜手</b>長擎安全操作系統(tǒng)24完成兼容性認(rèn)證

    浪潮信息推出AIGC存儲解決方案

    隆重推出了基于其新一代分布式存儲平臺AS13000G7的AIGC存儲解決方案,這一創(chuàng)新成果無疑為當(dāng)前大模型應(yīng)用面臨的存儲挑戰(zhàn)提供了強(qiáng)有力的支持。
    的頭像 發(fā)表于 07-03 11:16 ?612次閱讀

    浪潮信息推出基于新一代分布式存儲平臺AS13000G7的AIGC存儲解決方案

    6月28日,浪潮信息“元腦中國行”全國巡展杭州站順利舉行。會上,浪潮信息重磅推出基于新一代分布式存儲平臺AS13000G7的AIGC存儲解決
    的頭像 發(fā)表于 07-01 19:00 ?1300次閱讀
    <b class='flag-5'>浪潮信息</b>推出基于新一代<b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>平臺AS13000G7的AIGC<b class='flag-5'>存儲</b>解決方案

    浪潮信息分布式存儲AS13000完成英特爾至強(qiáng)6能效核處理器適配

    近日,浪潮信息分布式存儲AS13000完成英特爾至強(qiáng)6能效核處理器適配,實(shí)現(xiàn)每瓦性能提升2.3倍,以更高的效率、更優(yōu)的成本滿足海量多態(tài)數(shù)據(jù)的存儲需求,充分釋放數(shù)據(jù)價(jià)值。
    的頭像 發(fā)表于 06-19 10:05 ?725次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>AS13000完成英特爾至強(qiáng)6能效核處理器適配

    CCF-TCIST走進(jìn)浪潮信息 共話AI時(shí)代存儲創(chuàng)新

    CCF信息存儲技術(shù)專委會走進(jìn)浪潮信息 共話大模型時(shí)代的存儲創(chuàng)新之道 北京2024年6月7日?/美通社/ -- 近日,中國計(jì)算機(jī)學(xué)會
    的頭像 發(fā)表于 06-07 14:27 ?243次閱讀
    CCF-TCIST走進(jìn)<b class='flag-5'>浪潮信息</b> 共話AI時(shí)代<b class='flag-5'>存儲</b>創(chuàng)新

    浪潮信息北京伙伴共筑AI新生態(tài)

    近日,2024浪潮信息區(qū)域ISP伙伴戰(zhàn)略簽約儀式在京圓滿落幕。此次盛會,浪潮信息與航天星橋、中天瑞合、圣世博泰、浩然泰同、浩普誠華、眾創(chuàng)佳業(yè)等20家北京元腦生態(tài)伙伴共襄盛舉,簽署了戰(zhàn)略合作協(xié)議。
    的頭像 發(fā)表于 05-31 11:33 ?679次閱讀

    浪潮信息發(fā)布AS13000G7-N系列分布式全閃存儲

    浪潮信息近日推出了專為大型AI模型優(yōu)化的AS13000G7-N系列分布式全閃存儲。該系列基于浪潮信息自研的分布式文件系統(tǒng),結(jié)合新一代數(shù)據(jù)加速
    的頭像 發(fā)表于 05-14 10:03 ?467次閱讀

    為大模型專門優(yōu)化 浪潮信息發(fā)布分布式全閃存儲AS13000G7-N系列

    北京2024年5月10日?/美通社/ -- 近日,浪潮信息發(fā)布為大模型專門優(yōu)化的分布式全閃存儲AS13000G7-N系列。該系列依托浪潮信息
    的頭像 發(fā)表于 05-10 16:37 ?384次閱讀
    為大模型專門優(yōu)化 <b class='flag-5'>浪潮信息</b>發(fā)布<b class='flag-5'>分布式</b>全閃<b class='flag-5'>存儲</b>AS13000G7-N系列

    浪潮信息發(fā)布為大模型專門優(yōu)化的分布式全閃存儲AS13000G7-N系列

    近日,浪潮信息發(fā)布為大模型專門優(yōu)化的分布式全閃存儲AS13000G7-N系列。該系列依托浪潮信息自研分布式文件系統(tǒng),搭載新一代數(shù)據(jù)加速引擎D
    的頭像 發(fā)表于 05-08 09:38 ?451次閱讀
    <b class='flag-5'>浪潮信息</b>發(fā)布為大模型專門優(yōu)化的<b class='flag-5'>分布式</b>全閃<b class='flag-5'>存儲</b>AS13000G7-N系列

    一圖讀懂浪潮信息新一代分布式全閃存儲AS13000G7-N系列

    一圖讀懂浪潮信息新一代分布式全閃存儲AS13000G7-N系列
    的頭像 發(fā)表于 05-08 09:35 ?1096次閱讀
    一圖讀懂<b class='flag-5'>浪潮信息</b>新一代<b class='flag-5'>分布式</b>全閃<b class='flag-5'>存儲</b>AS13000G7-N系列

    XEDP與KeyarchOS完成浪潮信息澎湃技術(shù)認(rèn)證

    北京2024年2月27日?/美通社/ -- 近日,北京星辰天合科技股份有限公司(簡稱"XSKY星辰天合")企業(yè)級分布式統(tǒng)一數(shù)據(jù)平臺XEDP與浪潮信息云巒操作系統(tǒng)KeyarchOS V5
    的頭像 發(fā)表于 02-27 17:56 ?426次閱讀
    XEDP與KeyarchOS完成<b class='flag-5'>浪潮信息</b>澎湃技術(shù)認(rèn)證

    2024 信心滿滿!19家元腦生態(tài)伙伴與浪潮信息簽署億元分銷協(xié)議

    北京2023年12月8日 /美通社/ -- 近日,2024年浪潮信息億級分銷合作伙伴簽約儀式成功舉辦。浪潮信息北京傳奇天地、上海華胄、北京
    的頭像 發(fā)表于 12-08 18:18 ?554次閱讀

    數(shù)聚AI ? 智慧未來 | 浪潮信息存儲助力企業(yè)基于大模型實(shí)現(xiàn)數(shù)字化創(chuàng)新

    ,更好地幫助企業(yè)實(shí)現(xiàn)數(shù)字化創(chuàng)新? 11月29日,由DOIT傳媒舉辦的“數(shù)智創(chuàng)新 · AI未來”—2023中國數(shù)據(jù)與存儲峰會在北京成功舉辦,浪潮信息存儲產(chǎn)品線副總經(jīng)理劉希猛和
    的頭像 發(fā)表于 11-30 16:25 ?391次閱讀
    數(shù)聚AI ? 智慧未來 | <b class='flag-5'>浪潮信息</b><b class='flag-5'>存儲</b><b class='flag-5'>助力</b>企業(yè)基于大模型實(shí)現(xiàn)數(shù)字化創(chuàng)新