目前我們正處于數(shù)據(jù)爆炸增長(zhǎng)的時(shí)代,像硬盤(pán)、內(nèi)存芯片等數(shù)據(jù)存儲(chǔ)容器已經(jīng)出現(xiàn)“負(fù)荷過(guò)重”的跡象?,F(xiàn)今看來(lái),要想將全球數(shù)據(jù)存儲(chǔ)起來(lái)似乎技術(shù)還遠(yuǎn)遠(yuǎn)沒(méi)達(dá)到這個(gè)水平。但是,最近有研究發(fā)現(xiàn)一種新的數(shù)據(jù)存儲(chǔ)方式——DNA 數(shù)據(jù)存儲(chǔ)。
其實(shí),這種存儲(chǔ)方式的研究早已進(jìn)行中了。
去年年底,法國(guó)一位16歲高中生Locatelli將《古蘭經(jīng)》和《圣經(jīng)》中的部分內(nèi)容存儲(chǔ)到DNA中并注入到自己的體內(nèi)。他把希伯來(lái)語(yǔ)和阿拉伯語(yǔ)的字符轉(zhuǎn)換成DNA堿基的特定組合,將轉(zhuǎn)換后的DNA鏈移接到購(gòu)買(mǎi)的病毒上,最后用注射器將病毒注入自己的大腿 。
從邏輯上來(lái)講,實(shí)現(xiàn)這項(xiàng)目標(biāo)并不難。Locatelli 首先用一個(gè)基本的系統(tǒng)將文本翻譯為構(gòu)成 DNA 的核酸。
在圣經(jīng)《創(chuàng)世紀(jì)》中,他將22個(gè)希伯來(lái)字母轉(zhuǎn)換成四種可能的核酸:胞嘧啶、胸腺嘧啶、鳥(niǎo)嘌呤或腺嘌呤。胞嘧啶和胸腺嘧啶分別代表五個(gè)字母,鳥(niǎo)嘌呤和腺嘌呤分別代表六個(gè)字母。
在阿拉伯語(yǔ)文本中,Locatelli 去掉了 28 個(gè)字母中的 5 個(gè),并給了其中 3 個(gè)獨(dú)特的核酸,允許 Ra 和 Sad 共享胸腺嘧啶。在這兩種情況下,Locatelli 都忽略空格、標(biāo)點(diǎn)符號(hào)和變音符號(hào)。
然后,他分別從VectorBuilder和ProteoGenix公司購(gòu)買(mǎi)了定制的DNA鏈,以及用于將新DNA插入細(xì)胞的良性病毒。他買(mǎi)了一些生理鹽水和注射器就出發(fā)去參加了比賽。注射后,他只出現(xiàn)了輕微的過(guò)敏反應(yīng)。
但是,加州大學(xué)洛杉磯分校的生物化學(xué)家Sriram Kosuri表示,他不能確定Locatelli的方法是否真的有效; 也無(wú)法評(píng)估病毒載體是否成功地將合成的DNA導(dǎo)入Locatelli細(xì)胞。
除了這位高中生的研究成果外之外,最近,一家位于波士頓的初創(chuàng)公司Catalog宣布,他們成功將維基百科英文版一共16G的文本內(nèi)容存儲(chǔ)在了一個(gè)DNA分子上!
一個(gè)DNA分子即可輕松存儲(chǔ)16g內(nèi)容
計(jì)算機(jī)存儲(chǔ)容器已經(jīng)從帶磁鐵的電線變成硬盤(pán),如今發(fā)展到3D存儲(chǔ)芯片。為了追求更小占用空間卻有更多的存儲(chǔ)空間,下一代存儲(chǔ)容器也許會(huì)回溯到與地球上的生命一樣古老的方法:DNA。
企業(yè)Catalog近日宣布,他們將維基百科英文版的所有文本一共16G的內(nèi)容存儲(chǔ)在了一個(gè)DNA分子上!
Catalog用它的第一個(gè)DNA書(shū)寫(xiě)器完成了這項(xiàng)壯舉。
這個(gè)DNA書(shū)寫(xiě)器有多大呢?大小大概與一輛現(xiàn)代 SUV 差不多。盡管它目前看起來(lái)不太可能可以有機(jī)會(huì)打倒手機(jī)的存儲(chǔ)芯片,但Catalog認(rèn)為,它對(duì)一些需要將數(shù)據(jù)存檔的客戶來(lái)說(shuō)已經(jīng)很有用了。
DNA鏈雖然很小,也很難管理,但是生物分子可以存儲(chǔ)在除了控制細(xì)胞如何發(fā)芽或?yàn)槭裁葱尚蓵?huì)是猩猩的基因外的其他DNA區(qū)域。Catalog使用了比人類DNA短但更多的預(yù)制合成DNA鏈,因此它可以存儲(chǔ)更多的數(shù)據(jù)。
可能聽(tīng)起來(lái)像是倒退,但DNA是緊密的,在化學(xué)上以穩(wěn)定的形式存在,同時(shí)由于它是地球生物學(xué)的基礎(chǔ),可能不會(huì)像硬盤(pán)驅(qū)動(dòng)器或CD那樣過(guò)時(shí),也不會(huì)像軟盤(pán)驅(qū)動(dòng)器那樣被市場(chǎng)淘汰而消失。
由于傳統(tǒng)的DNA測(cè)序產(chǎn)品已經(jīng)在生物技術(shù)市場(chǎng)上銷售,可以以此讀取DNA數(shù)據(jù)。研究人員認(rèn)為“這一全新的序列技術(shù)用例將有助于(大大)降低成本”,Catalog認(rèn)為DNA存儲(chǔ)方式在計(jì)算業(yè)務(wù)中潛在一個(gè)巨大市場(chǎng)。
Catalog也使用了尋址系統(tǒng),這意味著當(dāng)DNA以長(zhǎng)序列存儲(chǔ)數(shù)據(jù)時(shí),也可以使用分子探針讀取存儲(chǔ)在任何地方的信息。就是一種硬盤(pán)一樣的隨機(jī)存取存儲(chǔ)器,而不是像半個(gè)世紀(jì)前大型計(jì)算機(jī)鼎盛時(shí)期的磁帶盤(pán)那樣的順序存取。
有人會(huì)認(rèn)為DNA會(huì)被射線破壞,但 Catalog 認(rèn)為它是一種比其他方法更穩(wěn)定的介質(zhì)。畢竟幾千年前滅絕動(dòng)物依然能發(fā)現(xiàn)其DNA。
DNA存儲(chǔ)數(shù)據(jù)有什么意義?
《科學(xué)美國(guó)人》與世界經(jīng)濟(jì)論壇聯(lián)合發(fā)布了 2019 年全球十大新興技術(shù),其中一項(xiàng)就是用 DNA 儲(chǔ)存數(shù)據(jù)。那么,DNA存儲(chǔ)數(shù)據(jù)的意義何在呢?
據(jù)軟件公司Domo稱,在2018 年,谷歌每分鐘都有388 萬(wàn)次搜索、YouTube被觀看的視頻有433萬(wàn)個(gè)、有159362760封電子郵件被發(fā)送、推特有47.3萬(wàn)條,在 Instagram上也發(fā)布了49000張照片。
預(yù)計(jì)到2020年,全球人均每秒將產(chǎn)生大約1.7兆字節(jié)的數(shù)據(jù),假設(shè)世界人口為78億,一年就會(huì)產(chǎn)生約418個(gè) zettabytes。如果放在容量為1TB的硬盤(pán)上,則需要4180億個(gè)!
這種情況下,目前的數(shù)據(jù)存儲(chǔ)系統(tǒng)根本撐不過(guò)一個(gè)世紀(jì)。此外,運(yùn)行這些數(shù)據(jù)也需要消耗大量的能量。因此,我們將面臨一個(gè)嚴(yán)重的數(shù)據(jù)存儲(chǔ)問(wèn)題,并且隨著時(shí)間的推移,這個(gè)問(wèn)題只會(huì)變得越來(lái)越嚴(yán)重!
所以硬盤(pán)存儲(chǔ)的一種替代方案——基于DNA的數(shù)據(jù)存儲(chǔ)才顯得尤為重要。由核苷酸A,T,C和G的長(zhǎng)鏈組成的DNA 序列是生命的信息存儲(chǔ)材料。數(shù)據(jù)可以按照這些字母的順序存儲(chǔ),從而將DNA轉(zhuǎn)變?yōu)橐环N新的信息技術(shù)形式。
目前DNA已經(jīng)可以常規(guī)排序(讀取),合成(寫(xiě)入)并且可以輕松準(zhǔn)確地復(fù)制。DNA本身結(jié)構(gòu)也是非常穩(wěn)定的,正如生活在50多萬(wàn)年前的化石馬的完整基因組測(cè)序所證明的那樣,存儲(chǔ)它不需要太多能量。
另外,DNA的存儲(chǔ)容量是讓人驚訝的。DNA可以以遠(yuǎn)超過(guò)電子設(shè)備的密度精確存儲(chǔ)大量數(shù)據(jù)。例如,根據(jù)哈佛大學(xué)George Church及其同事2016年發(fā)表在“Nature Materials”雜志上的計(jì)算,簡(jiǎn)單的大腸桿菌的存儲(chǔ)密度約為每立方厘米1019比特。
在這樣的密度下,僅僅需要一個(gè)邊長(zhǎng)約一米的DNA立方體便可很好地滿足全世界一年的數(shù)據(jù)儲(chǔ)存需要,簡(jiǎn)單來(lái)說(shuō)就是1kg DNA就能儲(chǔ)存全球數(shù)據(jù)。
DNA 數(shù)據(jù)存儲(chǔ)的前景不僅僅是理論上的。例如,2017 年,哈佛大學(xué)的Church小組采用CRISPR DNA編輯技術(shù),將人手的圖像記錄到大腸桿菌的基因組中,并以高于90%的準(zhǔn)確率讀出。華盛頓大學(xué)和微軟研究院的研究人員已經(jīng)開(kāi)發(fā)出一個(gè)完全自動(dòng)化的系統(tǒng),用于編寫(xiě)、存儲(chǔ)和讀取 DNA 編碼的數(shù)據(jù)。包括微軟和Twist Bioscience在內(nèi)的一些公司正在致力于推進(jìn) DNA 存儲(chǔ)技術(shù)。
與此同時(shí),DNA已經(jīng)被研究人員用來(lái)以不同的方式管理數(shù)據(jù),這些研究人員努力處理海量的數(shù)據(jù)。新一代測(cè)序技術(shù)的最新進(jìn)展使得數(shù)十億個(gè)DNA序列可以輕松同時(shí)讀取。有了這種能力,研究人員可以使用 DNA 序列的條形碼作為分子識(shí)別“標(biāo)簽”,以跟蹤實(shí)驗(yàn)結(jié)果。另外DNA條形碼正被用于大大加快化學(xué)工程、材料科學(xué)和納米技術(shù)等領(lǐng)域的研究步伐。例如,在佐治亞理工學(xué)院,James E. Dahlman的實(shí)驗(yàn)室正在迅速確定更安全的基因療法;其他人正在研究如何對(duì)抗耐藥性和防止癌癥轉(zhuǎn)移。
不過(guò)目前阻礙DNA數(shù)據(jù)存儲(chǔ)方式普及的原因之一便是讀取和寫(xiě)入DNA的成本太高、速度還不夠快,要與電子存儲(chǔ)競(jìng)爭(zhēng),就必須進(jìn)一步降低這些成本和提高速度。
-
存儲(chǔ)器
+關(guān)注
關(guān)注
38文章
7402瀏覽量
163389 -
硬盤(pán)
+關(guān)注
關(guān)注
3文章
1276瀏覽量
57161 -
內(nèi)存芯片
+關(guān)注
關(guān)注
0文章
124瀏覽量
21815 -
數(shù)據(jù)存儲(chǔ)
+關(guān)注
關(guān)注
5文章
950瀏覽量
50811
原文標(biāo)題:將數(shù)據(jù)存儲(chǔ)到身體?下一代的存儲(chǔ)容器也許會(huì)是DNA。
文章出處:【微信號(hào):luomajqrxt,微信公眾號(hào):機(jī)器人學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論