DNA存儲及其研究進(jìn)展
發(fā)布時(shí)間:2021-08-08 02:46
DNA存儲是一種以生物大分子DNA作為信息載體的一種新的存儲技術(shù)。與傳統(tǒng)的電子信息存儲相比,DNA存儲具有容量大、密度高、低能耗等優(yōu)點(diǎn)。隨著DNA合成、測序技術(shù)的發(fā)展以及大數(shù)據(jù)時(shí)代對數(shù)據(jù)存儲需求的指數(shù)增長,近年來DNA存儲在存儲容量、密度以及可靠性等方面都取得了巨大的進(jìn)展。該文主要介紹了DNA存儲的發(fā)展歷史、DNA存儲的基本流程、DNA存儲在數(shù)據(jù)庫、文檔存儲以及體內(nèi)存儲的研究進(jìn)展。最后,總結(jié)了DNA存儲未來面臨的挑戰(zhàn)以及發(fā)展方向。
【文章來源】:電子與信息學(xué)報(bào). 2020,42(06)北大核心EICSCD
【文章頁數(shù)】:6 頁
【部分圖文】:
DNA存儲的主要流程
圖2 檢索鏈和信息存貯鏈?zhǔn)疽鈭DDNA序列一般由數(shù)據(jù)區(qū)、索引編碼區(qū)以及兩端的擴(kuò)增引物區(qū)組成。DNA存儲的“寫”(即合成)、“讀”(即測序)過程往往容易產(chǎn)生核酸堿基的替換(substitutions)、插入(insertions)和刪除(deletions)。此外,在數(shù)據(jù)的存儲及檢索過程的PCR擴(kuò)增過程中,也可能產(chǎn)生擴(kuò)增不平衡導(dǎo)致信息丟失現(xiàn)象。因此,編碼技術(shù)對于DNA存儲系統(tǒng)的穩(wěn)定性、可靠性及效率至關(guān)重要。已有的各種存儲研究都采用序列隨機(jī)化、糾錯碼以及信息冗余等技術(shù)來降低“讀”、“寫”、“存”過程的錯誤影響。隨著存儲容量的增大,構(gòu)建DNA存儲系統(tǒng)所需的碼字(codeword)也隨之增大。Lenz等人[32]研究了DNA編碼數(shù)量的上下限問題。Anavy等人[31]提出了DNA組合碼的編碼方法降低編碼的冗余性。最近,Benner率領(lǐng)的研究團(tuán)隊(duì)[13]人工合成了另外4種核苷酸,突破性地創(chuàng)造出具有8個(gè)字母的DNA分子。堿基數(shù)的增加將進(jìn)一步增加DNA編碼的靈活性、魯棒性以及編碼空間。
首先,從大規(guī)模工業(yè)化應(yīng)用的角度,目前的合成及測序成本還太高,特別是合成的費(fèi)用大約是測序的4個(gè)數(shù)量級。從存儲的角度長序列片段的存儲效率更高,但是目前合成序列長度一般為100~300堿基,超過此長度的合成成本將急劇增加,同時(shí)合成和測序的錯誤率也會隨之增加。因此,合成和測序技術(shù)的進(jìn)步是DNA存儲走向?qū)嶋H應(yīng)用的技術(shù)基礎(chǔ)。其次,從DNA存儲信道模型的角度,編碼理論及方法是DNA存儲的核心理論問題,高效魯棒的編碼將有望克服目前DNA存儲合成、PCR擴(kuò)增及測序技術(shù)的不足,而且可能降低存儲的費(fèi)用。目前的編碼基本的流程是將加入糾錯冗余信息的二進(jìn)制字符串直接翻譯為DNA序列,這一編碼方式將是基于二進(jìn)制流的糾錯,如何結(jié)合DNA生化特性,直接研究基于DNA信息流上的組合DNA編碼理論將有望解決DNA存儲信息到的高可信信息存儲問題。
【參考文獻(xiàn)】:
期刊論文
[1]音視頻文件的DNA信息存儲[J]. 陳為剛,黃剛,李炳志,尹燁,元英進(jìn). 中國科學(xué):生命科學(xué). 2020(01)
[2]DNA計(jì)算中的單模板編碼方法改進(jìn)研究[J]. 王向紅,劉文斌,朱翔鷗,章林溪. 電子學(xué)報(bào). 2009(12)
[3]一種優(yōu)化DNA計(jì)算模板性能的新方法[J]. 劉文斌,朱翔鷗,王向紅,張強(qiáng),馬潤年. 電子與信息學(xué)報(bào). 2008(05)
[4]DNA計(jì)算中的模板框優(yōu)化方法研究[J]. 劉文斌,陳麗春,白寶鋼,朱翔鷗,張強(qiáng),馬潤年. 電子學(xué)報(bào). 2007(08)
本文編號:3329057
【文章來源】:電子與信息學(xué)報(bào). 2020,42(06)北大核心EICSCD
【文章頁數(shù)】:6 頁
【部分圖文】:
DNA存儲的主要流程
圖2 檢索鏈和信息存貯鏈?zhǔn)疽鈭DDNA序列一般由數(shù)據(jù)區(qū)、索引編碼區(qū)以及兩端的擴(kuò)增引物區(qū)組成。DNA存儲的“寫”(即合成)、“讀”(即測序)過程往往容易產(chǎn)生核酸堿基的替換(substitutions)、插入(insertions)和刪除(deletions)。此外,在數(shù)據(jù)的存儲及檢索過程的PCR擴(kuò)增過程中,也可能產(chǎn)生擴(kuò)增不平衡導(dǎo)致信息丟失現(xiàn)象。因此,編碼技術(shù)對于DNA存儲系統(tǒng)的穩(wěn)定性、可靠性及效率至關(guān)重要。已有的各種存儲研究都采用序列隨機(jī)化、糾錯碼以及信息冗余等技術(shù)來降低“讀”、“寫”、“存”過程的錯誤影響。隨著存儲容量的增大,構(gòu)建DNA存儲系統(tǒng)所需的碼字(codeword)也隨之增大。Lenz等人[32]研究了DNA編碼數(shù)量的上下限問題。Anavy等人[31]提出了DNA組合碼的編碼方法降低編碼的冗余性。最近,Benner率領(lǐng)的研究團(tuán)隊(duì)[13]人工合成了另外4種核苷酸,突破性地創(chuàng)造出具有8個(gè)字母的DNA分子。堿基數(shù)的增加將進(jìn)一步增加DNA編碼的靈活性、魯棒性以及編碼空間。
首先,從大規(guī)模工業(yè)化應(yīng)用的角度,目前的合成及測序成本還太高,特別是合成的費(fèi)用大約是測序的4個(gè)數(shù)量級。從存儲的角度長序列片段的存儲效率更高,但是目前合成序列長度一般為100~300堿基,超過此長度的合成成本將急劇增加,同時(shí)合成和測序的錯誤率也會隨之增加。因此,合成和測序技術(shù)的進(jìn)步是DNA存儲走向?qū)嶋H應(yīng)用的技術(shù)基礎(chǔ)。其次,從DNA存儲信道模型的角度,編碼理論及方法是DNA存儲的核心理論問題,高效魯棒的編碼將有望克服目前DNA存儲合成、PCR擴(kuò)增及測序技術(shù)的不足,而且可能降低存儲的費(fèi)用。目前的編碼基本的流程是將加入糾錯冗余信息的二進(jìn)制字符串直接翻譯為DNA序列,這一編碼方式將是基于二進(jìn)制流的糾錯,如何結(jié)合DNA生化特性,直接研究基于DNA信息流上的組合DNA編碼理論將有望解決DNA存儲信息到的高可信信息存儲問題。
【參考文獻(xiàn)】:
期刊論文
[1]音視頻文件的DNA信息存儲[J]. 陳為剛,黃剛,李炳志,尹燁,元英進(jìn). 中國科學(xué):生命科學(xué). 2020(01)
[2]DNA計(jì)算中的單模板編碼方法改進(jìn)研究[J]. 王向紅,劉文斌,朱翔鷗,章林溪. 電子學(xué)報(bào). 2009(12)
[3]一種優(yōu)化DNA計(jì)算模板性能的新方法[J]. 劉文斌,朱翔鷗,王向紅,張強(qiáng),馬潤年. 電子與信息學(xué)報(bào). 2008(05)
[4]DNA計(jì)算中的模板框優(yōu)化方法研究[J]. 劉文斌,陳麗春,白寶鋼,朱翔鷗,張強(qiáng),馬潤年. 電子學(xué)報(bào). 2007(08)
本文編號:3329057
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3329057.html
最近更新
教材專著