面向乳腺癌數(shù)據(jù)的基因存儲方法與拓撲數(shù)據(jù)分析
發(fā)布時間:2021-01-22 04:57
乳腺癌是發(fā)生在乳腺腺上皮組織的惡性腫瘤,居女性惡性腫瘤的第一位,乳腺癌信息的存儲和預判具有重要意義。mRNA和乳腺鉬靶X線攝影成像能夠?qū)θ橄侔┻M行早期診斷。本文對乳腺組織數(shù)據(jù)依次做了存儲、因子篩選與分類,形成一套完整的存儲與分析的流程;谌橄侔┙M織和正常組織的mRNA表達水平數(shù)據(jù)和乳腺鉬靶X線攝影成像,將乳腺組織信息以基因的信息存儲在試管中。將數(shù)字信息轉(zhuǎn)化為三進制基因編碼,首尾相連地將長鏈基因分割為基因片段,并添加前引物、后引物和糾錯位?紤]到一個信息存儲試驗管的“不安全性”,本文采取了分布式的存儲方法。將信息存儲在若干個試管中,依照同余數(shù)錯位剔除信息的方法提出每個試管中的一點信息,這樣只有在所有試管都存在的時候才能夠恢復原始信息。添加一定的人為擾動后,通過基因池中的基因序列逐相對比可以恢復為原來的信息。進行計算機模擬,發(fā)現(xiàn)錯誤率非常低,魯棒性高且安全性強。利用乳腺組織的開源數(shù)據(jù)集——來自不同乳腺組織的mRNA表達數(shù)據(jù)進行拓撲數(shù)據(jù)分析,用線性判別方法進行降維。構(gòu)建1133維mRNA數(shù)據(jù)的單純復形及其鏈復形,計算其邊界算子尋找鏈復形的所有邊緣,計算化簡后的邊界算子的秩的差得到了 Bet...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【部分圖文】:
圖2-2?首尾相連”的基因存儲樓型??在這個模型中f每一條鏈與前面一條鏈有75%的重合,當前面一條鏈確定后,??后面一條鏈S然而然可以確定,并且有很高的概率不會與其他鏈重合
??.?哈第窮:£業(yè)大_學■娜位論文??綜合上述幾點要求,模型示意圖如下圖2-4所示,其中,黑色區(qū)域為刪除的基??CDN^?!???!?j?i?i?;?i?|?;?i?|??_;r筆編‘?J?|??丨雜??V?V.V.4V?乂?J.寺.??刪除部分位點?1??a)存儲在第一個試驗管中的核糖核苷酸鏈??CDNA長篳????1?|?|?I?|?|???DNA?片段?|J|?H??V?V?'?4V?'?V?'?V?W?Y??刪除部分位點??b)存儲在第一個試驗管中的核糖核苷酸鏈??CD,_?。。。。!?f?i?i??dna|?片?t?—f?Etijd?J?:?;?1?:??l??。!?wV?。觯。!?w?。妫。椋??刪除部分位點?I??c)存儲在第一個試驗管中的核糖核苷酸鏈??CDN今長蘋?|?|?i?::?:??'■…丨丨「rr??!?W?。?!?Vs?w?。?!?J??刪除部分位點?I??d)存儲在第一個試驗管中的核糖核苷酸鏈??圖2-4分布式菌.因存儲模塑??存儲的時候,一份信息會存入到四個實驗管中,每個實驗管按上述模型存儲內(nèi)??容。為了區(qū)分這四個存儲模型,在模型中添加兩條特殊的鏈。在第_個模型中,重??復“GTCA”得到長度為100的鏈,該鏈翻譯過來就是“534,?437,?291,437,?”,??-9-??
?轉(zhuǎn)灣隹歡???若使用該模型,1克DNA不到指尖上^滴露珠大小,卻能夠存儲175?TB的??數(shù)據(jù)。相爾于3500張50?GB容量的藍光光盤,或58個3?TB的硬盤(其質(zhì)最大約??有38?kg)。該模型將為海聾信息提供安全高效的存儲環(huán)境。??2.3.3編碼效果分析??首先建立了一個0重復糾錯模型”,將某份70?KB的文本的數(shù)據(jù)進行轉(zhuǎn)換,變??成_因數(shù)據(jù)A、T、C、G;重復若干次;模報存儲池中的擾動一即以低于p?=?0.03??的概率讓每個基因發(fā)生突變;進行重復糾錯,恢復數(shù)據(jù),檢查“重復糾錯模型1勺糾??錯能力,得到下圖2-5:??|:)??。°??圖2-5重復次數(shù)、擾動概率與錯誤率的三._關(guān)系圖??從上面的三維圖中,我們可以看到重復8次的效果是完美的。制作上圖的橫??截面,并觀察8次針對不同千擾概率的糾錯效果,如圖2-6所示《可以觀察到當擾??動概率小于0.04的時候,存儲錯誤率小于1(T5,這個時候存儲效率是接近無損的。??0.04??1?1?1?1?1?1?1?1?1?1??0.035?-??0.03?-?/?A??0.025?-?/?-\??I??4^?〇.〇2?-??0.015?-?/?-j??0.01?-?j??0.005?-?,??〇0?0.02?0.04?0.06?0.08?0.1?0.12?0.14?0.16?0.18?0.2??擾動概率??圖2-6重復8次的存儲效率圖??-11-??
【參考文獻】:
期刊論文
[1]DNA計算機中基于順序存儲方式的二叉樹數(shù)據(jù)結(jié)構(gòu)[J]. 朱雅莉,李肯立. 計算機應用. 2008(06)
[2]數(shù)據(jù)存儲新方向:DNA分子存儲技術(shù)[J]. 崔光照,劉玉琳,張勛才. 計算機工程與應用. 2006(26)
碩士論文
[1]面向乳腺癌數(shù)據(jù)的單純復形建模方法及拓撲不變量分析[D]. 陳劍楠.哈爾濱工業(yè)大學 2018
[2]機器學習的拓撲結(jié)構(gòu)研究[D]. 謝子雨.復旦大學 2013
本文編號:2992597
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【部分圖文】:
圖2-2?首尾相連”的基因存儲樓型??在這個模型中f每一條鏈與前面一條鏈有75%的重合,當前面一條鏈確定后,??后面一條鏈S然而然可以確定,并且有很高的概率不會與其他鏈重合
??.?哈第窮:£業(yè)大_學■娜位論文??綜合上述幾點要求,模型示意圖如下圖2-4所示,其中,黑色區(qū)域為刪除的基??CDN^?!???!?j?i?i?;?i?|?;?i?|??_;r筆編‘?J?|??丨雜??V?V.V.4V?乂?J.寺.??刪除部分位點?1??a)存儲在第一個試驗管中的核糖核苷酸鏈??CDNA長篳????1?|?|?I?|?|???DNA?片段?|J|?H??V?V?'?4V?'?V?'?V?W?Y??刪除部分位點??b)存儲在第一個試驗管中的核糖核苷酸鏈??CD,_?。。。。!?f?i?i??dna|?片?t?—f?Etijd?J?:?;?1?:??l??。!?wV?。觯。!?w?。妫。椋??刪除部分位點?I??c)存儲在第一個試驗管中的核糖核苷酸鏈??CDN今長蘋?|?|?i?::?:??'■…丨丨「rr??!?W?。?!?Vs?w?。?!?J??刪除部分位點?I??d)存儲在第一個試驗管中的核糖核苷酸鏈??圖2-4分布式菌.因存儲模塑??存儲的時候,一份信息會存入到四個實驗管中,每個實驗管按上述模型存儲內(nèi)??容。為了區(qū)分這四個存儲模型,在模型中添加兩條特殊的鏈。在第_個模型中,重??復“GTCA”得到長度為100的鏈,該鏈翻譯過來就是“534,?437,?291,437,?”,??-9-??
?轉(zhuǎn)灣隹歡???若使用該模型,1克DNA不到指尖上^滴露珠大小,卻能夠存儲175?TB的??數(shù)據(jù)。相爾于3500張50?GB容量的藍光光盤,或58個3?TB的硬盤(其質(zhì)最大約??有38?kg)。該模型將為海聾信息提供安全高效的存儲環(huán)境。??2.3.3編碼效果分析??首先建立了一個0重復糾錯模型”,將某份70?KB的文本的數(shù)據(jù)進行轉(zhuǎn)換,變??成_因數(shù)據(jù)A、T、C、G;重復若干次;模報存儲池中的擾動一即以低于p?=?0.03??的概率讓每個基因發(fā)生突變;進行重復糾錯,恢復數(shù)據(jù),檢查“重復糾錯模型1勺糾??錯能力,得到下圖2-5:??|:)??。°??圖2-5重復次數(shù)、擾動概率與錯誤率的三._關(guān)系圖??從上面的三維圖中,我們可以看到重復8次的效果是完美的。制作上圖的橫??截面,并觀察8次針對不同千擾概率的糾錯效果,如圖2-6所示《可以觀察到當擾??動概率小于0.04的時候,存儲錯誤率小于1(T5,這個時候存儲效率是接近無損的。??0.04??1?1?1?1?1?1?1?1?1?1??0.035?-??0.03?-?/?A??0.025?-?/?-\??I??4^?〇.〇2?-??0.015?-?/?-j??0.01?-?j??0.005?-?,??〇0?0.02?0.04?0.06?0.08?0.1?0.12?0.14?0.16?0.18?0.2??擾動概率??圖2-6重復8次的存儲效率圖??-11-??
【參考文獻】:
期刊論文
[1]DNA計算機中基于順序存儲方式的二叉樹數(shù)據(jù)結(jié)構(gòu)[J]. 朱雅莉,李肯立. 計算機應用. 2008(06)
[2]數(shù)據(jù)存儲新方向:DNA分子存儲技術(shù)[J]. 崔光照,劉玉琳,張勛才. 計算機工程與應用. 2006(26)
碩士論文
[1]面向乳腺癌數(shù)據(jù)的單純復形建模方法及拓撲不變量分析[D]. 陳劍楠.哈爾濱工業(yè)大學 2018
[2]機器學習的拓撲結(jié)構(gòu)研究[D]. 謝子雨.復旦大學 2013
本文編號:2992597
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/2992597.html
最近更新
教材專著