0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

藍海大腦高性能深度學習GPU服務(wù)器助力生命科學發(fā)展

GPU視覺識別 ? 來源:GPU視覺識別 ? 作者:GPU視覺識別 ? 2022-08-17 14:51 ? 次閱讀

生命科學 | 藥物研發(fā) | 冷凍電鏡

靶點發(fā)現(xiàn) | 序列比對 | 晶體預(yù)測

隨著高性能計算、數(shù)據(jù)挖掘、數(shù)據(jù)分析、深度學習、冷凍電鏡、靶點發(fā)現(xiàn)、晶體預(yù)測等技術(shù)的快速發(fā)展,生命科學領(lǐng)域的醫(yī)藥研發(fā)、AI預(yù)測蛋白質(zhì)結(jié)構(gòu)、基因測序、小分子研究、疫苗研發(fā)得到快速發(fā)展。

2022年生命科學領(lǐng)域趨勢

2022年生命科學行業(yè)的趨勢主要分成三個層面,國家政策、資本市場和產(chǎn)業(yè)格局。

國家政策

藥品、高值醫(yī)用耗材集中帶量采購進入常態(tài)化、制度化新的階段;DRG/DIP的支付方式改革加快落地;國家積極引導應(yīng)對人口老齡化國家戰(zhàn)略。

poYBAGL8j9iAPvfeAAbYo2ESY2Q735.png

2018-2022年國家層面生物科學行業(yè)政策及重點內(nèi)容解讀

資本市場

二級市場開始回歸理性,重新構(gòu)建估值體系有利于行業(yè)的良性發(fā)展;投資人更加偏好早期階段,高潛力的初創(chuàng)企業(yè)更容易受到資本的青睞;美元投資人從初期的主力參與到目前的持幣觀望,人民幣資本這兩年強勢崛起。

pYYBAGL8j9mAK_tJAAKFLqDhs0c204.jpg

生物醫(yī)藥行業(yè)發(fā)展趨勢

產(chǎn)業(yè)格局

綜上所述,國家政策和資本市場帶動了產(chǎn)業(yè)格局的變化。在產(chǎn)業(yè)格局方面,新生代健康產(chǎn)業(yè)公司進入商業(yè)化階段;數(shù)字化和智能化正在深刻影響產(chǎn)業(yè)的發(fā)展。

近年來人工智能與各種數(shù)字化工具,已逐步滲透到健康產(chǎn)業(yè)的方方面面。在多個領(lǐng)域初步展現(xiàn)出突破瓶頸和降本增效的巨大潛力。

隨著數(shù)字化和智能化對整個健康產(chǎn)業(yè)賦能的不斷拓展與提升,整個健康產(chǎn)業(yè)中,很多傳統(tǒng)的技術(shù)和商業(yè)模式,都面臨著重構(gòu)的可能。

在AI賦能新藥研發(fā)方面,隨著深度學習能力和人工智能技術(shù)的快速發(fā)展,以及算力的大幅提升,AI在新藥研發(fā)方面正在取得長足的進步,并展示出令人驚嘆的潛力。

poYBAGL8j9mAdVpNAADYidcWuy4796.jpg

中國生物醫(yī)藥行業(yè)細分領(lǐng)域競爭情況

以蛋白質(zhì)結(jié)構(gòu)預(yù)測為例,DeepMind公司的AlphaFold2已經(jīng)預(yù)測出超過35萬種蛋白質(zhì)結(jié)構(gòu),涵蓋了98.5%的人類蛋白質(zhì)組以及20種生物的蛋白質(zhì)結(jié)構(gòu)。

全球TOP20跨國藥企均在Al領(lǐng)域有大量布局,包括諾華、輝瑞、GSK、阿斯利康、賽諾菲、復(fù)星醫(yī)藥在內(nèi)的大批國內(nèi)外企業(yè)紛紛試水AI新藥研發(fā),期待跨越式提升新藥研發(fā)的效率。與此同時,包括藍海大腦也在這個領(lǐng)域加速布局。

數(shù)字化診斷對傳統(tǒng)診斷加速賦能,數(shù)字療法成為傳統(tǒng)治療技術(shù)方案強有力的補充。

手術(shù)機器人在臨床手術(shù)端,得到更加廣泛的應(yīng)用,傳統(tǒng)醫(yī)院正在經(jīng)歷越來越徹底的數(shù)字化改造。醫(yī)療與消費正在更加緊密地走向融合的整體趨勢。

pYYBAGL8j9mAHK8VAACfw-sMA_s141.jpg

截止2022年6月中國生物醫(yī)藥行業(yè)

企業(yè)數(shù)量區(qū)域分布(單位:家)

2021年中國生命科學

2021年,在中國生命科學領(lǐng)域內(nèi)的大量數(shù)據(jù)顯示,中國健康產(chǎn)業(yè)規(guī)模達到10萬億元。我國60歲及以上人口已達2.7億。2021年健康領(lǐng)域投資為2522.8億元。

1000000億元。中國健康產(chǎn)業(yè)規(guī)模持續(xù)增長。隨著中國人口的進一步老齡化,以及政府和公眾對健康的重視和投入的不斷提高,據(jù)健康產(chǎn)業(yè)白皮書統(tǒng)計,2021年中國健康產(chǎn)業(yè)規(guī)模達到10萬億元。

其中,與藥品相關(guān)的市場模型約為2.9萬億元,醫(yī)療器械和診斷的市場規(guī)模約為1萬億元,醫(yī)療服務(wù)、數(shù)字醫(yī)療和一般健康的市場規(guī)模約為6.1萬億元。

2.7億人口。2021年,我國60歲及以上人口已達2.7億,占總?cè)丝诘?8.9%,比2020年增長0.2%;60歲及以上人口超過2億,占中國總?cè)丝诘?4.2%,比2020年上升0.7%,中國人口老齡化進一步加劇。

人口老齡化加劇。根據(jù)國家統(tǒng)計局發(fā)布的《中華人民共和國2021年國民經(jīng)濟和社會發(fā)展統(tǒng)計公報》數(shù)據(jù)。2021年,我國人口自然增長率僅為0.34%,比2020年下降1.11%。因此,中國社會人口結(jié)構(gòu)的老齡化仍然是中國健康產(chǎn)業(yè)最重要的核心底層驅(qū)動力之一。

2522.8億元。據(jù)統(tǒng)計,2020年中國健康領(lǐng)域融資額為2236.5億元,2021年為2522.8億元,同比增長12.8%。中國健康產(chǎn)業(yè)在資本市場趨于健康發(fā)展,估值體系發(fā)生變化,整體投資趨于理性。

2020年,中國大健康領(lǐng)域?qū)⒂?538個融資項目。2021年為1831輛,同比增長19.05%。A股市場2021年科技創(chuàng)新板健康醫(yī)療公司IPO數(shù)量為37家,上半年24家,下半年13家。在港股市場,2021年健康行業(yè)上市公司有34家??傮w來看,在資本市場上,健康產(chǎn)業(yè)呈現(xiàn)穩(wěn)步增長。

poYBAGL8j9mAMgXCAADEvCCAbfg903.jpg

生物醫(yī)藥行業(yè)產(chǎn)業(yè)鏈生態(tài)圖譜

高性能計算研究下

生命科學領(lǐng)域

生命科學行業(yè)發(fā)展至今,早已離不開高性能計算的輔助,從計算機輔助藥物設(shè)計、疫苗研發(fā),到通過基因檢測提供精準醫(yī)療服務(wù)、產(chǎn)前篩查等,高性能計算HPC在生命科學研究中扮演著十分重要的角色。

生物信息學是在生命科學的研究中,以計算機為工具對生物信息進行儲存、檢索和分析的科學。它是當今生命科學和自然科學的重大前沿領(lǐng)域之一,同時也將是21世紀自然科學的核心領(lǐng)域之一。其研究重點主要體現(xiàn)在基因組學(Genomics)和蛋白質(zhì)組學(Proteomics)兩方面,具體說就是從核酸和蛋白質(zhì)序列出發(fā),分析序列中表達的結(jié)構(gòu)功能的生物信息。生物信息學在短短十幾年間,已經(jīng)形成了多個研究方向,其中與高性能計算相關(guān)的主要研究重點如下。

序列比對

序列比對(Sequence Alignment)的基本問題是比較兩個或兩個以上符號序列的相似性或不相似性。從生物學的初衷來看,這一問題包含了以下幾個意義:從相互重疊的序列片斷中重構(gòu)DNA的完整序列。在各種試驗條件下從探測數(shù)據(jù)(probe data)中決定物理和基因圖存貯,遍歷和比較數(shù)據(jù)庫中的DNA序列,比較兩個或多個序列的相似性,在數(shù)據(jù)庫中搜索相關(guān)序列和子序列,尋找核苷酸(nucleotides)的連續(xù)產(chǎn)生模式,找出蛋白質(zhì)和DNA序列中的信息成分。在序列對比的過程中將會產(chǎn)生巨量的數(shù)據(jù),這對我們的存儲系統(tǒng)帶來了較大規(guī)模的挑戰(zhàn)。

現(xiàn)在用于存儲的硬盤容量每14個月會有一倍的增長,而基因序列的數(shù)據(jù)量則每5月左右會翻一番,例如:CeleraGenomics 和Sanger Centre 等主要基因研究機構(gòu)都在管理數(shù)以萬億字節(jié)計的數(shù)據(jù),其數(shù)據(jù)庫信息量超過了人類開展生物學研究以來積累的數(shù)據(jù)量。

序列拼接

序列拼接是將測序生成的reads短片段拼接起來,恢復(fù)出原始的序列。該問題是序列分析的基本任務(wù),是基因組研究成功與失敗的關(guān)鍵,拼接結(jié)果直接影響到序列標注,基因預(yù)測、基因組比較等后續(xù)任務(wù)。基因組序列的拼接也是基因組研究必須解決的首要難題。其困難不僅來自它的海量數(shù)據(jù)(以人類基因組序列為例,從數(shù)量為10兆級的片斷恢復(fù)出長度為億級的原始序列),而且源于它含有高度重復(fù)的序列。

從計算機方面來講,在拼接初期,會有大量的初始數(shù)據(jù)導入內(nèi)存,然后對這些數(shù)據(jù)進行處理。因此,序列拼接對于計算機的內(nèi)存量和計算能力都有非常大的需求。

基于結(jié)構(gòu)的藥物設(shè)計

人類基因工程的目的之一是要了解人體內(nèi)約10萬種蛋白質(zhì)的結(jié)構(gòu)功能,相互作用以及與各種人類疾病之間的關(guān)系,尋求各種治療和預(yù)防方法,包括藥物治療?;谏锎蠓肿咏Y(jié)構(gòu)及小分子結(jié)構(gòu)的藥物設(shè)計是生物信息學中的極為重要的研究領(lǐng)域。為了抑制某些酶或蛋白質(zhì)的活性,在已知其蛋白質(zhì)3級結(jié)構(gòu)的基礎(chǔ)上,可以利用分子對齊算法,在計算機上設(shè)計抑制劑分子,作為候選藥物。然后在數(shù)據(jù)庫中進行對比并且得到優(yōu)勢結(jié)構(gòu),選擇使用分子模擬的方法實現(xiàn)藥物分子的設(shè)計。

分子動力學

主要是浮點計算為主 ,非常適合大規(guī)模并行,但是對網(wǎng)絡(luò)需求比較大,節(jié)點間需要使用低延時,高帶寬的Infiniband高速網(wǎng)。

測序儀離線處理

相比計算量,存儲容量需求更大;作業(yè)運行需要與作業(yè)調(diào)度系統(tǒng)結(jié)合;測序離線處理往往有序列拼接的需求,目前最主流的序列拼接軟件denovo為多線程程序,單節(jié)點內(nèi)存容量需求非常大,往往需要達到256G甚至512GB,需要配置大容量內(nèi)存SMP胖節(jié)點。

電子顯微鏡圖像處理

主要為浮點計算,其中大量的單精度FFT計算;軟件加速比完全線性,對網(wǎng)絡(luò)依賴低;軟件內(nèi)存需求和IO需求較大,一般需要配置并行文件系統(tǒng);系統(tǒng)計算量大,計算時間長,系統(tǒng)穩(wěn)定性,可靠性要求高。

質(zhì)譜儀原始資料處理

軟件加速比接近線性,對網(wǎng)絡(luò)依賴低;系統(tǒng)計算量大,計算時間長,系統(tǒng)穩(wěn)定性,可靠性要求高。

藍海大腦高性能服務(wù)器

助力生命科學領(lǐng)域發(fā)展

方案介紹

藍海大腦高性能計算推出多樣化的架構(gòu)滿足不同計算需求,利用革新型的存儲和內(nèi)存技術(shù)和領(lǐng)先的軟件工具,建立廣泛的生態(tài)系統(tǒng),快速處理增長的大型復(fù)雜數(shù)據(jù)集,升級系統(tǒng)可用性以獲得更高吞吐率,確保高性能計算(HPC)應(yīng)用性能最優(yōu)化。

生命科學的性能挑戰(zhàn)

poYBAGL8k0CAUfssAAEhUrcFTbw767.png


poYBAGL8k12AYL_-AAFKo4xJj4c794.png

藍海大腦憑借多年在生命科學生物基因分析領(lǐng)域積累的經(jīng)驗,通過橫向擴展(scale-out)存儲系統(tǒng)、IB低延遲網(wǎng)絡(luò)、私有客戶端技術(shù)小文件聚合及使用自研PCI-E極速存儲等異構(gòu)介質(zhì)構(gòu)建冷熱數(shù)據(jù)分層等,滿足生物基因應(yīng)用中對海量數(shù)據(jù)存儲場景高可靠性、高性能低延遲和低能耗的存儲需求。

pYYBAGL8j9uAUgpOAAI5liPGK1U536.png

方案特點

poYBAGL8j9yAW8QRAAZltQ8jCCY203.png

客戶收益

生物基因分析研究產(chǎn)生的數(shù)據(jù)以每年10倍的速度快速增長,藍海分布式存儲通過卓越的系統(tǒng)架構(gòu),在為用戶提供海量的存儲空間。通過大比例糾刪功能,大幅提升容量利用率,為客戶提供更低的TCO。

DNA基因分析分布式存儲通過小文件聚合、對象聚合、全局緩存、多通道、硬件加速等技術(shù),為客戶提供創(chuàng)新的性能加速方案,全面提升存儲系統(tǒng)性能。

生物基因分析的數(shù)據(jù)具有極高的價值,藍海大腦分布式存儲通過業(yè)界領(lǐng)先的冗余設(shè)計,為用戶提供強大的數(shù)據(jù)保護能力和系統(tǒng)可用性數(shù)據(jù)可用性高達99.9999%。

節(jié)點級和硬盤級均衡,磁盤間容量誤差率不超5%,節(jié)點間誤差不超1%,可用容量利用率高達95%。同時高密度存儲節(jié)點滿足客戶存儲空間和能耗要求。

支持豐富的主機連接接口,支持 10/25/40Gb iSCSI、56/100 In?niBand主機連接,無縫接入用戶現(xiàn)有環(huán)境,滿足客戶對高帶寬及高性能計算的差異化需求,支持后端10GE 組網(wǎng)下的RDMA模式傳輸,支持TOE 卸載,提高系統(tǒng)性能。

節(jié)點并行處理數(shù)據(jù) IO、保障系統(tǒng)整體負載均衡,數(shù)據(jù)分散存儲,避免單節(jié)點故障帶來的風險,節(jié)點在線橫向擴展,滿足持續(xù)增長的容量和性能需求。

架構(gòu)的優(yōu)化設(shè)計,在文件場景下單一目錄可支持1000萬文件,文件系統(tǒng)支持千億級文件,單一命名空間支持20PB;支持5120節(jié)點擴展單集群可提供EB級容量空間。

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    27

    文章

    4632

    瀏覽量

    128442
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    8846

    瀏覽量

    84948
  • 生命科學
    +關(guān)注

    關(guān)注

    0

    文章

    24

    瀏覽量

    12312
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5434

    瀏覽量

    120790
收藏 人收藏

    評論

    相關(guān)推薦

    GPU高性能服務(wù)器配置

    GPU高性能服務(wù)器作為提升計算速度和效率的關(guān)鍵設(shè)備,在各大應(yīng)用場景中發(fā)揮著越來越重要的作用。在此,petacloud.ai小編為你介紹GPU高性能
    的頭像 發(fā)表于 10-21 10:42 ?64次閱讀

    AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感

    。 4. 對未來生命科學發(fā)展的展望 在閱讀這一章后,我對未來生命科學發(fā)展充滿了期待。我相信,在人工智能技術(shù)的推動下,生命科學將取得更加顯著的進展。例如,在藥物研發(fā)領(lǐng)域,AI技術(shù)將幫助
    發(fā)表于 10-14 09:21

    gpu服務(wù)器與cpu服務(wù)器的區(qū)別對比,終于知道怎么選了!

    gpu服務(wù)器與cpu服務(wù)器的區(qū)別主要體現(xiàn)在架構(gòu)設(shè)計、性能特點、能耗效率、應(yīng)用場景、市場定位等方面,在以上幾個方面均存在顯著差異。CPU服務(wù)器
    的頭像 發(fā)表于 08-01 11:41 ?376次閱讀

    算力服務(wù)器為什么選擇GPU

    隨著人工智能技術(shù)的快速普及,算力需求日益增長。智算中心的服務(wù)器作為支撐大規(guī)模數(shù)據(jù)處理和計算的核心設(shè)備,其性能優(yōu)化顯得尤為關(guān)鍵。而GPU服務(wù)器也進入了大眾的視野,成為
    的頭像 發(fā)表于 07-25 08:28 ?393次閱讀
    算力<b class='flag-5'>服務(wù)器</b>為什么選擇<b class='flag-5'>GPU</b>

    新手小白怎么學GPU服務(wù)器深度學習?

    新手小白想用GPU服務(wù)器深度學習應(yīng)該怎么做? 用個人主機通常pytorch可以跑但是LexNet,AlexNet可能就直接就跑不動,如何實現(xiàn)更經(jīng)濟便捷的實現(xiàn)
    發(fā)表于 06-11 17:09

    RISC-V在服務(wù)器方面應(yīng)用與發(fā)展前景

    院計算技術(shù)研究所等機構(gòu)發(fā)布的“香山”開源高性能RISC-V處理核,不僅性能卓越,而且有效匯聚了全球創(chuàng)新力量,加速了RISC-V在高性能計算領(lǐng)域的應(yīng)用進程。 在
    發(fā)表于 04-28 09:04

    單路高性能服務(wù)器主板

    服務(wù)器
    jf_10805031
    發(fā)布于 :2024年04月26日 14:23:58

    FPGA在深度學習應(yīng)用中或?qū)⑷〈?b class='flag-5'>GPU

    、筆記本電腦或機架式服務(wù)器上訓練神經(jīng)網(wǎng)絡(luò)時,這不是什么大問題。但是,許多部署深度學習模型的環(huán)境對 GPU 并不友好,比如自動駕駛汽車、工廠、機器人和許多智慧城市環(huán)境,在這些環(huán)境中硬件必
    發(fā)表于 03-21 15:19

    淺析推動生命科學發(fā)展的光泵半導體激光(OPSL)技術(shù)(三)

    OPSL在流式細胞儀及DNA測序領(lǐng)域的應(yīng)用及新進發(fā)展。 OPSL 擁有波長可靈活擴展、功率可調(diào)、體積小巧、高度可靠以及高光電轉(zhuǎn)換效率等特點,在許多生命科學應(yīng)用中大獲成功。此外,OPSL還具有噪聲低、光束質(zhì)量優(yōu)異、直接數(shù)字調(diào)制的特點以及光纖耦合選項,其緊湊型結(jié)構(gòu)、智能化即插
    的頭像 發(fā)表于 02-01 06:33 ?400次閱讀
    淺析推動<b class='flag-5'>生命科學發(fā)展</b>的光泵半導體激光(OPSL)技術(shù)(三)

    多波長激光引擎 - 生命科學儀器的未來

    流式細胞儀等生命科學儀器制造商越來越多地從分離的單臺激光轉(zhuǎn)向激光引擎,后者是一種可定制的緊湊型集成組件,以特定應(yīng)用形式提供成形聚焦光束。 激光會產(chǎn)生一束光,要么是脈沖光,要么是連續(xù)波光。 幾乎
    的頭像 發(fā)表于 01-31 06:31 ?234次閱讀

    淺析推動生命科學發(fā)展的OPSL技術(shù)(二)

    光泵半導體激光技術(shù)(Optically Pumped SemiconductorLasers)已經(jīng)從新一代連續(xù)激光技術(shù)迅速轉(zhuǎn)變成為生命科學領(lǐng)域內(nèi)的主導力量,其具備的一系列獨特優(yōu)勢使之成為非常
    的頭像 發(fā)表于 01-31 06:30 ?329次閱讀
    淺析推動<b class='flag-5'>生命科學發(fā)展</b>的OPSL技術(shù)(二)

    gpu服務(wù)器是干什么的 gpu服務(wù)器與cpu服務(wù)器的區(qū)別有哪些

    gpu服務(wù)器是干什么的 gpu服務(wù)器與cpu服務(wù)器的區(qū)別 GPU
    的頭像 發(fā)表于 01-30 15:31 ?754次閱讀

    淺析推動生命科學發(fā)展的光泵半導體激光(OPSL)技術(shù)(一)

    具備高性能、高可靠性、低使用成本等優(yōu)勢。 ▼ 應(yīng)用背景要求 數(shù)十年來,可見光和紫外光連續(xù)激光已在醫(yī)學診斷、生物成像和其他生命科學應(yīng)用領(lǐng)域的各種儀器中得到廣泛應(yīng)用。典型的應(yīng)用實例包括流式細胞儀、共聚焦顯微鏡、高通量基因測序、病毒
    的頭像 發(fā)表于 01-30 06:30 ?386次閱讀
    淺析推動<b class='flag-5'>生命科學發(fā)展</b>的光泵半導體激光(OPSL)技術(shù)(一)

    超微gpu服務(wù)器評測

    隨著科技的不斷發(fā)展和進步,GPU服務(wù)器在大數(shù)據(jù)分析、深度學習、人工智能等領(lǐng)域正變得越來越重要。而超微GP
    的頭像 發(fā)表于 01-10 10:37 ?1158次閱讀

    gpu服務(wù)器是干什么的 gpu服務(wù)器與cpu服務(wù)器的區(qū)別

     相比于傳統(tǒng)的CPU服務(wù)器,GPU服務(wù)器支持同時計算大量相似的計算操作,可以實現(xiàn)更強的并行計算性能。GPU
    的頭像 發(fā)表于 12-02 17:20 ?1793次閱讀