基于序列深度學(xué)習(xí)的生物醫(yī)學(xué)大數(shù)據(jù)分析研究
發(fā)布時間:2023-09-16 18:47
生物醫(yī)學(xué)大數(shù)據(jù)中存在著許多類型的數(shù)據(jù),包括序列數(shù)據(jù)。序列數(shù)據(jù)中有兩類典型數(shù)據(jù):一是生物信息領(lǐng)域的DNA序列數(shù)據(jù),DNA上存在許多功能片段,基于序列信息預(yù)測功能片段對于理解基因的調(diào)控機制至關(guān)重要;二是醫(yī)學(xué)信息領(lǐng)域的電子病歷數(shù)據(jù),電子病歷記錄了病人的疾病信息,對理解病患特征和患者預(yù)后至關(guān)重要。本文基于卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、詞向量模型等深度學(xué)習(xí)的技術(shù),對這兩類序列數(shù)據(jù)進行了深入的研究。本文的主要研究內(nèi)容和創(chuàng)新點為:1.針對用生物實驗手段預(yù)測增強子的時間和金錢成本高的問題,提出了基于卷積神經(jīng)網(wǎng)絡(luò)的Deep Enhancer計算模型。該模型采用遷移學(xué)習(xí)策略進行訓(xùn)練,根據(jù)堿基序列信息進行增強子識別,相對傳統(tǒng)k-mer方法取得了大約7%的預(yù)測性能提升。該模型能夠自動學(xué)習(xí)捕捉到有效的模體特征,具有良好的可解釋性,為大規(guī)模高精度的增強子識別提供了可靠的計算模型。2.為了在深度學(xué)習(xí)模型中融合有效的k-mer信息,首次提出了特征融合的卷積長短時記憶神經(jīng)網(wǎng)絡(luò)模型。該模型通過無監(jiān)督學(xué)習(xí)訓(xùn)練k-mer的嵌入表示,通過監(jiān)督學(xué)習(xí)訓(xùn)練卷積長短時記憶神經(jīng)網(wǎng)絡(luò),在染色質(zhì)開放性的預(yù)測問題中取得了分類性能的進一步提升。此...
【文章頁數(shù)】:112 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
abstract
主要符號對照表
第1章 引言
1.1 研究背景
1.1.1 生物醫(yī)學(xué)大數(shù)據(jù)
1.1.2 理論研究價值
1.1.3 應(yīng)用研究價值
1.2 研究現(xiàn)狀
1.2.1 生物信息學(xué)中的研究現(xiàn)狀
1.2.2 醫(yī)學(xué)信息學(xué)中的研究現(xiàn)狀
1.3 本文研究內(nèi)容和貢獻
1.4 本文各章節(jié)安排
1.5 本章小結(jié)
第2章 基于序列的深度學(xué)習(xí)相關(guān)理論
2.1 本章引言
2.2 卷積神經(jīng)網(wǎng)絡(luò)模型
2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)模型
2.4 詞向量模型
2.5 本章小結(jié)
第3章 基于卷積神經(jīng)網(wǎng)絡(luò)的增強子序列識別算法
3.1 本章引言
3.1.1 研究背景
3.1.2 研究動機
3.2 模型與方法
3.2.1 模型結(jié)構(gòu)
3.2.2 卷積核與模體
3.3 實驗結(jié)果
3.3.1 實驗數(shù)據(jù)集
3.3.2 寬泛增強子的預(yù)測
3.3.3 細(xì)胞系特異增強子的預(yù)測
3.3.4 模體可視化
3.3.5 模型的時間效率
3.4 實驗討論
3.5 本章小結(jié)
第4章 特征融合的染色質(zhì)開放性識別算法
4.1 本章引言
4.1.1 研究背景
4.1.2 研究動機
4.2 模型與方法
4.2.1 總體網(wǎng)絡(luò)結(jié)構(gòu)
4.2.2 k-mer嵌入
4.2.3 雙向LSTM
4.3 實驗結(jié)果
4.3.1 實驗設(shè)定
4.3.2 模型評價
4.3.3 k-mer嵌入的可視化
4.3.4 k-mer嵌入的作用
4.3.5 卷積層的作用
4.3.6 雙向LSTM層的作用
4.3.7 敏感性分析
4.4 本章小結(jié)
第5章 醫(yī)學(xué)概念的嵌入表示學(xué)習(xí)及其應(yīng)用
5.1 本章引言
5.1.1 研究背景
5.1.2 研究動機
5.2 模型與方法
5.2.1 基本模型
5.2.2 醫(yī)學(xué)概念嵌入模型
5.2.3 多尺度卷積神經(jīng)網(wǎng)絡(luò)模型
5.3 實驗結(jié)果
5.3.1 實驗數(shù)據(jù)集
5.3.2 病人費用預(yù)測
5.3.3 嵌入表示的可視化
5.3.4 多尺度嵌入模型
5.4 本章小結(jié)
第6章 基于醫(yī)療保險記錄的病人再入院預(yù)測
6.1 本章引言
6.1.1 研究背景
6.1.2 研究動機
6.2 基本模型與方法
6.2.1 傳統(tǒng)方法
6.2.2 深度學(xué)習(xí)方法
6.3 實驗結(jié)果
6.3.1 數(shù)據(jù)預(yù)處理
6.3.2 傳統(tǒng)方法結(jié)果
6.3.3 深度學(xué)習(xí)結(jié)果
6.4 實驗討論
6.5 本章小結(jié)
第7章 總結(jié)與展望
7.1 本文總結(jié)
7.2 未來展望
參考文獻
致謝
個人簡歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文與研究成果
本文編號:3846995
【文章頁數(shù)】:112 頁
【學(xué)位級別】:博士
【文章目錄】:
摘要
abstract
主要符號對照表
第1章 引言
1.1 研究背景
1.1.1 生物醫(yī)學(xué)大數(shù)據(jù)
1.1.2 理論研究價值
1.1.3 應(yīng)用研究價值
1.2 研究現(xiàn)狀
1.2.1 生物信息學(xué)中的研究現(xiàn)狀
1.2.2 醫(yī)學(xué)信息學(xué)中的研究現(xiàn)狀
1.3 本文研究內(nèi)容和貢獻
1.4 本文各章節(jié)安排
1.5 本章小結(jié)
第2章 基于序列的深度學(xué)習(xí)相關(guān)理論
2.1 本章引言
2.2 卷積神經(jīng)網(wǎng)絡(luò)模型
2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)模型
2.4 詞向量模型
2.5 本章小結(jié)
第3章 基于卷積神經(jīng)網(wǎng)絡(luò)的增強子序列識別算法
3.1 本章引言
3.1.1 研究背景
3.1.2 研究動機
3.2 模型與方法
3.2.1 模型結(jié)構(gòu)
3.2.2 卷積核與模體
3.3 實驗結(jié)果
3.3.1 實驗數(shù)據(jù)集
3.3.2 寬泛增強子的預(yù)測
3.3.3 細(xì)胞系特異增強子的預(yù)測
3.3.4 模體可視化
3.3.5 模型的時間效率
3.4 實驗討論
3.5 本章小結(jié)
第4章 特征融合的染色質(zhì)開放性識別算法
4.1 本章引言
4.1.1 研究背景
4.1.2 研究動機
4.2 模型與方法
4.2.1 總體網(wǎng)絡(luò)結(jié)構(gòu)
4.2.2 k-mer嵌入
4.2.3 雙向LSTM
4.3 實驗結(jié)果
4.3.1 實驗設(shè)定
4.3.2 模型評價
4.3.3 k-mer嵌入的可視化
4.3.4 k-mer嵌入的作用
4.3.5 卷積層的作用
4.3.6 雙向LSTM層的作用
4.3.7 敏感性分析
4.4 本章小結(jié)
第5章 醫(yī)學(xué)概念的嵌入表示學(xué)習(xí)及其應(yīng)用
5.1 本章引言
5.1.1 研究背景
5.1.2 研究動機
5.2 模型與方法
5.2.1 基本模型
5.2.2 醫(yī)學(xué)概念嵌入模型
5.2.3 多尺度卷積神經(jīng)網(wǎng)絡(luò)模型
5.3 實驗結(jié)果
5.3.1 實驗數(shù)據(jù)集
5.3.2 病人費用預(yù)測
5.3.3 嵌入表示的可視化
5.3.4 多尺度嵌入模型
5.4 本章小結(jié)
第6章 基于醫(yī)療保險記錄的病人再入院預(yù)測
6.1 本章引言
6.1.1 研究背景
6.1.2 研究動機
6.2 基本模型與方法
6.2.1 傳統(tǒng)方法
6.2.2 深度學(xué)習(xí)方法
6.3 實驗結(jié)果
6.3.1 數(shù)據(jù)預(yù)處理
6.3.2 傳統(tǒng)方法結(jié)果
6.3.3 深度學(xué)習(xí)結(jié)果
6.4 實驗討論
6.5 本章小結(jié)
第7章 總結(jié)與展望
7.1 本文總結(jié)
7.2 未來展望
參考文獻
致謝
個人簡歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文與研究成果
本文編號:3846995
本文鏈接:http://sikaile.net/shoufeilunwen/yxlbs/3846995.html
最近更新
教材專著