生命科學 | 藥物研發(fā) | 冷凍電鏡
靶點發(fā)現(xiàn) | 序列比對 | 晶體預(yù)測
隨著高性能計算、數(shù)據(jù)挖掘、數(shù)據(jù)分析、深度學習、冷凍電鏡、靶點發(fā)現(xiàn)、晶體預(yù)測等技術(shù)的快速發(fā)展,生命科學領(lǐng)域的醫(yī)藥研發(fā)、AI預(yù)測蛋白質(zhì)結(jié)構(gòu)、基因測序、小分子研究、疫苗研發(fā)得到快速發(fā)展。
2022年生命科學領(lǐng)域趨勢
2022年生命科學行業(yè)的趨勢主要分成三個層面,國家政策、資本市場和產(chǎn)業(yè)格局。
國家政策
藥品、高值醫(yī)用耗材集中帶量采購進入常態(tài)化、制度化新的階段;DRG/DIP的支付方式改革加快落地;國家積極引導應(yīng)對人口老齡化國家戰(zhàn)略。
2018-2022年國家層面生物科學行業(yè)政策及重點內(nèi)容解讀
資本市場
二級市場開始回歸理性,重新構(gòu)建估值體系有利于行業(yè)的良性發(fā)展;投資人更加偏好早期階段,高潛力的初創(chuàng)企業(yè)更容易受到資本的青睞;美元投資人從初期的主力參與到目前的持幣觀望,人民幣資本這兩年強勢崛起。
生物醫(yī)藥行業(yè)發(fā)展趨勢
產(chǎn)業(yè)格局
綜上所述,國家政策和資本市場帶動了產(chǎn)業(yè)格局的變化。在產(chǎn)業(yè)格局方面,新生代健康產(chǎn)業(yè)公司進入商業(yè)化階段;數(shù)字化和智能化正在深刻影響產(chǎn)業(yè)的發(fā)展。
近年來人工智能與各種數(shù)字化工具,已逐步滲透到健康產(chǎn)業(yè)的方方面面。在多個領(lǐng)域初步展現(xiàn)出突破瓶頸和降本增效的巨大潛力。
隨著數(shù)字化和智能化對整個健康產(chǎn)業(yè)賦能的不斷拓展與提升,整個健康產(chǎn)業(yè)中,很多傳統(tǒng)的技術(shù)和商業(yè)模式,都面臨著重構(gòu)的可能。
在AI賦能新藥研發(fā)方面,隨著深度學習能力和人工智能技術(shù)的快速發(fā)展,以及算力的大幅提升,AI在新藥研發(fā)方面正在取得長足的進步,并展示出令人驚嘆的潛力。
中國生物醫(yī)藥行業(yè)細分領(lǐng)域競爭情況
以蛋白質(zhì)結(jié)構(gòu)預(yù)測為例,DeepMind公司的AlphaFold2已經(jīng)預(yù)測出超過35萬種蛋白質(zhì)結(jié)構(gòu),涵蓋了98.5%的人類蛋白質(zhì)組以及20種生物的蛋白質(zhì)結(jié)構(gòu)。
全球TOP20跨國藥企均在Al領(lǐng)域有大量布局,包括諾華、輝瑞、GSK、阿斯利康、賽諾菲、復(fù)星醫(yī)藥在內(nèi)的大批國內(nèi)外企業(yè)紛紛試水AI新藥研發(fā),期待跨越式提升新藥研發(fā)的效率。與此同時,包括藍海大腦也在這個領(lǐng)域加速布局。
數(shù)字化診斷對傳統(tǒng)診斷加速賦能,數(shù)字療法成為傳統(tǒng)治療技術(shù)方案強有力的補充。
手術(shù)機器人在臨床手術(shù)端,得到更加廣泛的應(yīng)用,傳統(tǒng)醫(yī)院正在經(jīng)歷越來越徹底的數(shù)字化改造。醫(yī)療與消費正在更加緊密地走向融合的整體趨勢。
截止2022年6月中國生物醫(yī)藥行業(yè)
企業(yè)數(shù)量區(qū)域分布(單位:家)
2021年中國生命科學
2021年,在中國生命科學領(lǐng)域內(nèi)的大量數(shù)據(jù)顯示,中國健康產(chǎn)業(yè)規(guī)模達到10萬億元。我國60歲及以上人口已達2.7億。2021年健康領(lǐng)域投資為2522.8億元。
1000000億元。中國健康產(chǎn)業(yè)規(guī)模持續(xù)增長。隨著中國人口的進一步老齡化,以及政府和公眾對健康的重視和投入的不斷提高,據(jù)健康產(chǎn)業(yè)白皮書統(tǒng)計,2021年中國健康產(chǎn)業(yè)規(guī)模達到10萬億元。
其中,與藥品相關(guān)的市場模型約為2.9萬億元,醫(yī)療器械和診斷的市場規(guī)模約為1萬億元,醫(yī)療服務(wù)、數(shù)字醫(yī)療和一般健康的市場規(guī)模約為6.1萬億元。
2.7億人口。2021年,我國60歲及以上人口已達2.7億,占總?cè)丝诘?8.9%,比2020年增長0.2%;60歲及以上人口超過2億,占中國總?cè)丝诘?4.2%,比2020年上升0.7%,中國人口老齡化進一步加劇。
人口老齡化加劇。根據(jù)國家統(tǒng)計局發(fā)布的《中華人民共和國2021年國民經(jīng)濟和社會發(fā)展統(tǒng)計公報》數(shù)據(jù)。2021年,我國人口自然增長率僅為0.34%,比2020年下降1.11%。因此,中國社會人口結(jié)構(gòu)的老齡化仍然是中國健康產(chǎn)業(yè)最重要的核心底層驅(qū)動力之一。
2522.8億元。據(jù)統(tǒng)計,2020年中國健康領(lǐng)域融資額為2236.5億元,2021年為2522.8億元,同比增長12.8%。中國健康產(chǎn)業(yè)在資本市場趨于健康發(fā)展,估值體系發(fā)生變化,整體投資趨于理性。
2020年,中國大健康領(lǐng)域?qū)⒂?538個融資項目。2021年為1831輛,同比增長19.05%。A股市場2021年科技創(chuàng)新板健康醫(yī)療公司IPO數(shù)量為37家,上半年24家,下半年13家。在港股市場,2021年健康行業(yè)上市公司有34家??傮w來看,在資本市場上,健康產(chǎn)業(yè)呈現(xiàn)穩(wěn)步增長。
生物醫(yī)藥行業(yè)產(chǎn)業(yè)鏈生態(tài)圖譜
高性能計算研究下
生命科學領(lǐng)域
生命科學行業(yè)發(fā)展至今,早已離不開高性能計算的輔助,從計算機輔助藥物設(shè)計、疫苗研發(fā),到通過基因檢測提供精準醫(yī)療服務(wù)、產(chǎn)前篩查等,高性能計算HPC在生命科學研究中扮演著十分重要的角色。
生物信息學是在生命科學的研究中,以計算機為工具對生物信息進行儲存、檢索和分析的科學。它是當今生命科學和自然科學的重大前沿領(lǐng)域之一,同時也將是21世紀自然科學的核心領(lǐng)域之一。其研究重點主要體現(xiàn)在基因組學(Genomics)和蛋白質(zhì)組學(Proteomics)兩方面,具體說就是從核酸和蛋白質(zhì)序列出發(fā),分析序列中表達的結(jié)構(gòu)功能的生物信息。生物信息學在短短十幾年間,已經(jīng)形成了多個研究方向,其中與高性能計算相關(guān)的主要研究重點如下。
序列比對
序列比對(Sequence Alignment)的基本問題是比較兩個或兩個以上符號序列的相似性或不相似性。從生物學的初衷來看,這一問題包含了以下幾個意義:從相互重疊的序列片斷中重構(gòu)DNA的完整序列。在各種試驗條件下從探測數(shù)據(jù)(probe data)中決定物理和基因圖存貯,遍歷和比較數(shù)據(jù)庫中的DNA序列,比較兩個或多個序列的相似性,在數(shù)據(jù)庫中搜索相關(guān)序列和子序列,尋找核苷酸(nucleotides)的連續(xù)產(chǎn)生模式,找出蛋白質(zhì)和DNA序列中的信息成分。在序列對比的過程中將會產(chǎn)生巨量的數(shù)據(jù),這對我們的存儲系統(tǒng)帶來了較大規(guī)模的挑戰(zhàn)。
現(xiàn)在用于存儲的硬盤容量每14個月會有一倍的增長,而基因序列的數(shù)據(jù)量則每5月左右會翻一番,例如:CeleraGenomics 和Sanger Centre 等主要基因研究機構(gòu)都在管理數(shù)以萬億字節(jié)計的數(shù)據(jù),其數(shù)據(jù)庫信息量超過了人類開展生物學研究以來積累的數(shù)據(jù)量。
序列拼接
序列拼接是將測序生成的reads短片段拼接起來,恢復(fù)出原始的序列。該問題是序列分析的基本任務(wù),是基因組研究成功與失敗的關(guān)鍵,拼接結(jié)果直接影響到序列標注,基因預(yù)測、基因組比較等后續(xù)任務(wù)。基因組序列的拼接也是基因組研究必須解決的首要難題。其困難不僅來自它的海量數(shù)據(jù)(以人類基因組序列為例,從數(shù)量為10兆級的片斷恢復(fù)出長度為億級的原始序列),而且源于它含有高度重復(fù)的序列。
從計算機方面來講,在拼接初期,會有大量的初始數(shù)據(jù)導入內(nèi)存,然后對這些數(shù)據(jù)進行處理。因此,序列拼接對于計算機的內(nèi)存量和計算能力都有非常大的需求。
基于結(jié)構(gòu)的藥物設(shè)計
人類基因工程的目的之一是要了解人體內(nèi)約10萬種蛋白質(zhì)的結(jié)構(gòu)功能,相互作用以及與各種人類疾病之間的關(guān)系,尋求各種治療和預(yù)防方法,包括藥物治療?;谏锎蠓肿咏Y(jié)構(gòu)及小分子結(jié)構(gòu)的藥物設(shè)計是生物信息學中的極為重要的研究領(lǐng)域。為了抑制某些酶或蛋白質(zhì)的活性,在已知其蛋白質(zhì)3級結(jié)構(gòu)的基礎(chǔ)上,可以利用分子對齊算法,在計算機上設(shè)計抑制劑分子,作為候選藥物。然后在數(shù)據(jù)庫中進行對比并且得到優(yōu)勢結(jié)構(gòu),選擇使用分子模擬的方法實現(xiàn)藥物分子的設(shè)計。
分子動力學
主要是浮點計算為主 ,非常適合大規(guī)模并行,但是對網(wǎng)絡(luò)需求比較大,節(jié)點間需要使用低延時,高帶寬的Infiniband高速網(wǎng)。
測序儀離線處理
相比計算量,存儲容量需求更大;作業(yè)運行需要與作業(yè)調(diào)度系統(tǒng)結(jié)合;測序離線處理往往有序列拼接的需求,目前最主流的序列拼接軟件denovo為多線程程序,單節(jié)點內(nèi)存容量需求非常大,往往需要達到256G甚至512GB,需要配置大容量內(nèi)存SMP胖節(jié)點。
電子顯微鏡圖像處理
主要為浮點計算,其中大量的單精度FFT計算;軟件加速比完全線性,對網(wǎng)絡(luò)依賴低;軟件內(nèi)存需求和IO需求較大,一般需要配置并行文件系統(tǒng);系統(tǒng)計算量大,計算時間長,系統(tǒng)穩(wěn)定性,可靠性要求高。
質(zhì)譜儀原始資料處理
軟件加速比接近線性,對網(wǎng)絡(luò)依賴低;系統(tǒng)計算量大,計算時間長,系統(tǒng)穩(wěn)定性,可靠性要求高。
藍海大腦高性能服務(wù)器
助力生命科學領(lǐng)域發(fā)展
方案介紹
藍海大腦高性能計算推出多樣化的架構(gòu)滿足不同計算需求,利用革新型的存儲和內(nèi)存技術(shù)和領(lǐng)先的軟件工具,建立廣泛的生態(tài)系統(tǒng),快速處理增長的大型復(fù)雜數(shù)據(jù)集,升級系統(tǒng)可用性以獲得更高吞吐率,確保高性能計算(HPC)應(yīng)用性能最優(yōu)化。
生命科學的性能挑戰(zhàn)
藍海大腦憑借多年在生命科學生物基因分析領(lǐng)域積累的經(jīng)驗,通過橫向擴展(scale-out)存儲系統(tǒng)、IB低延遲網(wǎng)絡(luò)、私有客戶端技術(shù)小文件聚合及使用自研PCI-E極速存儲等異構(gòu)介質(zhì)構(gòu)建冷熱數(shù)據(jù)分層等,滿足生物基因應(yīng)用中對海量數(shù)據(jù)存儲場景高可靠性、高性能低延遲和低能耗的存儲需求。
方案特點
客戶收益
生物基因分析研究產(chǎn)生的數(shù)據(jù)以每年10倍的速度快速增長,藍海分布式存儲通過卓越的系統(tǒng)架構(gòu),在為用戶提供海量的存儲空間。通過大比例糾刪功能,大幅提升容量利用率,為客戶提供更低的TCO。
DNA基因分析分布式存儲通過小文件聚合、對象聚合、全局緩存、多通道、硬件加速等技術(shù),為客戶提供創(chuàng)新的性能加速方案,全面提升存儲系統(tǒng)性能。
生物基因分析的數(shù)據(jù)具有極高的價值,藍海大腦分布式存儲通過業(yè)界領(lǐng)先的冗余設(shè)計,為用戶提供強大的數(shù)據(jù)保護能力和系統(tǒng)可用性數(shù)據(jù)可用性高達99.9999%。
節(jié)點級和硬盤級均衡,磁盤間容量誤差率不超5%,節(jié)點間誤差不超1%,可用容量利用率高達95%。同時高密度存儲節(jié)點滿足客戶存儲空間和能耗要求。
支持豐富的主機連接接口,支持 10/25/40Gb iSCSI、56/100 In?niBand主機連接,無縫接入用戶現(xiàn)有環(huán)境,滿足客戶對高帶寬及高性能計算的差異化需求,支持后端10GE 組網(wǎng)下的RDMA模式傳輸,支持TOE 卸載,提高系統(tǒng)性能。
節(jié)點并行處理數(shù)據(jù) IO、保障系統(tǒng)整體負載均衡,數(shù)據(jù)分散存儲,避免單節(jié)點故障帶來的風險,節(jié)點在線橫向擴展,滿足持續(xù)增長的容量和性能需求。
架構(gòu)的優(yōu)化設(shè)計,在文件場景下單一目錄可支持1000萬文件,文件系統(tǒng)支持千億級文件,單一命名空間支持20PB;支持5120節(jié)點擴展單集群可提供EB級容量空間。
審核編輯 黃昊宇
-
gpu
+關(guān)注
關(guān)注
27文章
4632瀏覽量
128442 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
8846瀏覽量
84948 -
生命科學
+關(guān)注
關(guān)注
0文章
24瀏覽量
12312 -
深度學習
+關(guān)注
關(guān)注
73文章
5434瀏覽量
120790
發(fā)布評論請先 登錄
相關(guān)推薦
評論