基于深度學(xué)習(xí)網(wǎng)絡(luò)的剪接位點(diǎn)及蛋白質(zhì)相互作用預(yù)測(cè)方法研究
發(fā)布時(shí)間:2021-10-29 08:00
生物學(xué)中心法則包括DNA轉(zhuǎn)錄、RNA翻譯和蛋白質(zhì)表達(dá)。選擇性剪接是轉(zhuǎn)錄后期的關(guān)鍵步驟,剪接過程的正確執(zhí)行很大程度在于剪接位點(diǎn)的正確識(shí)別,它使得一種編碼蛋白質(zhì)的基因可以產(chǎn)生多種轉(zhuǎn)錄變體。因此,錯(cuò)誤的剪接位點(diǎn)經(jīng)常會(huì)導(dǎo)致各種疾病的發(fā)生。選擇性剪接通過產(chǎn)生不同的剪接變體翻譯成不同特定生物功能的蛋白產(chǎn)物,而蛋白質(zhì)的變異或者某些蛋白質(zhì)發(fā)生異常相互作用也同樣會(huì)導(dǎo)致疾病甚至癌癥的發(fā)生。鑒于剪接位點(diǎn)及蛋白質(zhì)相互作用預(yù)測(cè)在生物領(lǐng)域的重要性,本論文著重基于深度學(xué)習(xí)技術(shù)來研究剪接位點(diǎn)和蛋白質(zhì)相互作用這兩個(gè)問題的預(yù)測(cè)方法,主要內(nèi)容包括:1.剪接位點(diǎn)及剪接模式的探索對(duì)于理解基因轉(zhuǎn)錄過程非常重要,F(xiàn)有的計(jì)算方法在剪接位點(diǎn)預(yù)測(cè)問題上取得了較大成功,但是不可避免存在特征提取、模型可解釋性差等缺點(diǎn),由此本文提出基于深度卷積神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)剪接位點(diǎn),該網(wǎng)絡(luò)主要由剪接位點(diǎn)預(yù)測(cè)模塊和揭示剪接位點(diǎn)序列模式的模型解釋模塊組成。和傳統(tǒng)機(jī)器學(xué)習(xí)方法相比,剪接位點(diǎn)預(yù)測(cè)模塊在六個(gè)不同公共供體/受體剪接位點(diǎn)數(shù)據(jù)源上取得了更精確的分類性能。此外,為了解釋深度學(xué)習(xí)的識(shí)別過程,模型解釋模塊對(duì)卷積特征進(jìn)行了可視化,展現(xiàn)了特征映射從底層到高層的抽象過程...
【文章來源】:安徽大學(xué)安徽省 211工程院校
【文章頁數(shù)】:82 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3.1DeepSS模型的框架圖
圖3.2?12個(gè)數(shù)據(jù)集上的不同深度框架的10折交叉驗(yàn)證結(jié)果??Figure?3.2?The?performance?of?different?depth?architectures?with?10-flod?cross?validation?on??12?datasets??表3.2?DeepSS-C在平衡受體/供體數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果??Table?3.2?Performance?of?DeepSS-C?with?balanced?acceptor/donor?datasets??HS-D?CE?NN269??Measure?Acceptor?Donor?Acceptor?Donor?Acceptor?Donor??AUC-ROC?98.50±0.42?98.89±0.41?99.32±0.49?99.19±0.54?98.98±0.51?98.47±0.65??AUC-PR?98.22土0?70?98.79±0.52?99?27±0.63?99?I5±0.72?98.87±0?66?98?20±0.96??表3.3?DeepSS-C在非平衡受體/供體數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)*??Table?3.3?Perfonnance?of?DeepSS-C?with?imbalanced?acceptor/donor?datasets??HS-D?CE?NN269??Measure??Acceptor?Donor?Acceptor?Donor?Acceptor?Donor??
?100??AUC?PR??圖3.6各數(shù)據(jù)集上的不同長度序列對(duì)剪接位點(diǎn)預(yù)測(cè)的AUC-PR值的影響(1代表原始??序列的長度)??Figure?3.6?The?effect?o
【參考文獻(xiàn)】:
期刊論文
[1]面向微博短文本分類的文本向量化方法比較研究[J]. 李心蕾,王昊,劉小敏,鄧三鴻. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2018(08)
[2]基于卷積神經(jīng)網(wǎng)絡(luò)模型的互聯(lián)網(wǎng)短文本情感分類[J]. 劉小明,張英,鄭秋生. 計(jì)算機(jī)與現(xiàn)代化. 2017(04)
[3]基于特征融合的選擇性剪切外顯子預(yù)測(cè)[J]. 袁芳,范金坪. 計(jì)算機(jī)與數(shù)字工程. 2014(11)
碩士論文
[1]基于機(jī)器學(xué)習(xí)方法的可變剪接位點(diǎn)預(yù)測(cè)研究[D]. 郭倩含.云南大學(xué) 2015
[2]真核基因剪接位點(diǎn)識(shí)別算法研究[D]. 呂俊杰.哈爾濱工程大學(xué) 2010
本文編號(hào):3464281
【文章來源】:安徽大學(xué)安徽省 211工程院校
【文章頁數(shù)】:82 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3.1DeepSS模型的框架圖
圖3.2?12個(gè)數(shù)據(jù)集上的不同深度框架的10折交叉驗(yàn)證結(jié)果??Figure?3.2?The?performance?of?different?depth?architectures?with?10-flod?cross?validation?on??12?datasets??表3.2?DeepSS-C在平衡受體/供體數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果??Table?3.2?Performance?of?DeepSS-C?with?balanced?acceptor/donor?datasets??HS-D?CE?NN269??Measure?Acceptor?Donor?Acceptor?Donor?Acceptor?Donor??AUC-ROC?98.50±0.42?98.89±0.41?99.32±0.49?99.19±0.54?98.98±0.51?98.47±0.65??AUC-PR?98.22土0?70?98.79±0.52?99?27±0.63?99?I5±0.72?98.87±0?66?98?20±0.96??表3.3?DeepSS-C在非平衡受體/供體數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)*??Table?3.3?Perfonnance?of?DeepSS-C?with?imbalanced?acceptor/donor?datasets??HS-D?CE?NN269??Measure??Acceptor?Donor?Acceptor?Donor?Acceptor?Donor??
?100??AUC?PR??圖3.6各數(shù)據(jù)集上的不同長度序列對(duì)剪接位點(diǎn)預(yù)測(cè)的AUC-PR值的影響(1代表原始??序列的長度)??Figure?3.6?The?effect?o
【參考文獻(xiàn)】:
期刊論文
[1]面向微博短文本分類的文本向量化方法比較研究[J]. 李心蕾,王昊,劉小敏,鄧三鴻. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2018(08)
[2]基于卷積神經(jīng)網(wǎng)絡(luò)模型的互聯(lián)網(wǎng)短文本情感分類[J]. 劉小明,張英,鄭秋生. 計(jì)算機(jī)與現(xiàn)代化. 2017(04)
[3]基于特征融合的選擇性剪切外顯子預(yù)測(cè)[J]. 袁芳,范金坪. 計(jì)算機(jī)與數(shù)字工程. 2014(11)
碩士論文
[1]基于機(jī)器學(xué)習(xí)方法的可變剪接位點(diǎn)預(yù)測(cè)研究[D]. 郭倩含.云南大學(xué) 2015
[2]真核基因剪接位點(diǎn)識(shí)別算法研究[D]. 呂俊杰.哈爾濱工程大學(xué) 2010
本文編號(hào):3464281
本文鏈接:http://sikaile.net/projectlw/swxlw/3464281.html
最近更新
教材專著