您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

面向壓縮生物基因數(shù)據(jù)的查詢方法

大?。?/span>1.64 MB 人氣: 2018-01-12 需要積分:3

  隨著下一代、第三代等測(cè)序技術(shù)的快速發(fā)展,DNA等生物序列數(shù)據(jù)快速增長(zhǎng).如何高效地處理這些大數(shù)據(jù)是目前所面臨的一個(gè)挑戰(zhàn).研究發(fā)現(xiàn),這些生物序列數(shù)據(jù)盡管很大,但是不同數(shù)據(jù)之間具有很高的相似性.因此可以通過(guò)保存這些基因串同一個(gè)基準(zhǔn)序列之間的差異來(lái)減少存儲(chǔ)的代價(jià).最新的研究發(fā)現(xiàn),可以在這些壓縮的數(shù)據(jù)上直接進(jìn)行查詢,而不需要解壓縮.研究的目標(biāo)是進(jìn)一步提高索引和查詢的可伸縮性,從而滿足日益增長(zhǎng)的大數(shù)據(jù)需要.首先在現(xiàn)有方法的基礎(chǔ)上,對(duì)基準(zhǔn)序列進(jìn)行了壓縮存儲(chǔ),基于該壓縮數(shù)據(jù),提出了一系列優(yōu)化查詢方法以高效地支持任意長(zhǎng)度序列的精確和近似查詢.在此基礎(chǔ)上,進(jìn)一步對(duì)原有方法進(jìn)行改進(jìn),利用并行計(jì)算來(lái)提高對(duì)大數(shù)據(jù)的查詢效率.最后,實(shí)驗(yàn)研究展示了所提方法的高效性.

面向壓縮生物基因數(shù)據(jù)的高效的查詢方法

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?