基于RDF的肺癌醫(yī)學(xué)大數(shù)據(jù)的藥物治療分析研究
發(fā)布時間:2021-02-12 14:33
近年來,伴隨著知識工程的持續(xù)發(fā)展,研究發(fā)現(xiàn)基于語義網(wǎng)的數(shù)據(jù)集規(guī)模呈指數(shù)級增長,尤其是在這些大規(guī)模的語義數(shù)據(jù)集中相當(dāng)大一部分是生物醫(yī)學(xué)數(shù)據(jù)集。這些生物醫(yī)學(xué)數(shù)據(jù)集中蘊涵了豐富的語義信息,是面向生物醫(yī)學(xué)領(lǐng)域進行深入數(shù)據(jù)分析的重要基礎(chǔ)。但這些數(shù)據(jù)集側(cè)重點不同,數(shù)據(jù)格式、標(biāo)準(zhǔn)不統(tǒng)一,需要進行有效的知識融合和組織表示。因此如何將這些生物醫(yī)學(xué)數(shù)據(jù)集中的知識以統(tǒng)一的標(biāo)準(zhǔn)組織存儲、挖掘知識并加以分析利用是我們研究的方向和主題。目前,肺癌不管是在國內(nèi)還是國外都有極高的發(fā)病率及致死率,同時肺癌及心血管疾病一直是寧夏地區(qū)的醫(yī)療重點研究方向。本文以肺癌的藥物治療為視角,從多個生物醫(yī)學(xué)數(shù)據(jù)集中獲取與肺癌相關(guān)的基因,蛋白質(zhì),藥物,代謝通路等信息,通過有效的數(shù)據(jù)融合方法建立語義豐富的肺癌醫(yī)學(xué)知識網(wǎng)絡(luò),并在此基礎(chǔ)上探索發(fā)現(xiàn)語義網(wǎng)絡(luò)中的重要結(jié)點、計算結(jié)點的相似度、進行聚類分析,為疾病治療的研究發(fā)展提供新的解決方案。本文首先介紹了近年來網(wǎng)絡(luò)生物學(xué)的研究現(xiàn)狀,介紹了非結(jié)構(gòu)化語義數(shù)據(jù)的存儲現(xiàn)狀,總結(jié)了近年來關(guān)于網(wǎng)絡(luò)鏈接分析方法的算法和研究現(xiàn)狀以及其存在的問題等;接下來以醫(yī)學(xué)領(lǐng)域中的肺癌RDF大數(shù)據(jù)為研究對象,探索在分布式系統(tǒng)下...
【文章來源】:寧夏大學(xué)寧夏回族自治區(qū) 211工程院校
【文章頁數(shù)】:49 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1肺癌藥物治療通路RDF示例??
第二章相關(guān)理論與技術(shù)??許用戶瀏覽它,還可以設(shè)置各種規(guī)則或視圖,以便使用者從不同的角度對數(shù)據(jù)進行分析。界??面如圖2-2所示:??>:.???上???g?Ki3??9S?■?m^sns?;?:M5?awr.?;??u*Bi?mm?-?m?:?swk?:.?*se??x??ir?vtwr?v%rr?\' ̄r:-<:?Tr.?^????;r???'??ii^isa:?ivr??C--?>?@Sr?H0OZj?j?Leam?about?Neo4j?Jump?into?code??.''t'::?■.-?*?^?AnVv7.???as&?veu?at*?Cyp^?'iwtf-?vtr,???-■j?)?Ca-r??,,-??'><?r???\r—rz?nwew'lajry*?M?-t?]?RXUSKSocr??、>W:,.心先聲,fk%?辦:?Z^ywr^,??'?'?Mwi?d<i?omqK?do?voi??:)titoi;-??fll^83BS3SEBi?SSES^SES^^SB!??'::-,lL'?Monitor?the?system??Ktj?firKS-???****%?£>????l?H^N?I?Cidm?acsxn??圖2-2Neo4j界面展示??2.5小結(jié)??本章介紹了圖的定義和一些基礎(chǔ)理論;概述了?RDF圖模型的定義并通過一個肺癌數(shù)據(jù)??三元組的示例詳細(xì)解釋了?RDF三元組;接著介紹了本文所涉及的三種網(wǎng)絡(luò)鏈接分析方法的??理論知識
通過對比分析現(xiàn)有數(shù)據(jù)集的內(nèi)容和權(quán)威性,我們在互聯(lián)網(wǎng)中選擇了以下5個生物醫(yī)學(xué)數(shù)??據(jù)庫:ChEMBL、KEGG、DrugBank、UniPort和PubMed獲取本文所需的肺癌相關(guān)信息。??圖3-1說明了這些數(shù)據(jù)集之間的關(guān)聯(lián)關(guān)系。在這些數(shù)據(jù)集中,每個數(shù)據(jù)記錄都有自己的ID,??通過分析發(fā)現(xiàn),這些ID在五個數(shù)據(jù)集中相互包含,具有相互引用關(guān)系,可以作為分析數(shù)據(jù)??集關(guān)聯(lián)的重要途徑。其中KEGG數(shù)據(jù)集中的基因與UniProt數(shù)據(jù)集里的蛋白質(zhì)具有編碼關(guān)系,??它們之間通過UniProt?ID連接;ChEMBL數(shù)據(jù)集為化合物信息,它與UniProt數(shù)據(jù)集中肺癌??蛋白信息通過ChEMBL?ID連接;從DrugBank數(shù)據(jù)集提取的有關(guān)治療肺癌的藥物與UniProt??數(shù)據(jù)集的蛋白質(zhì)具有作用關(guān)系,通過UniProt?ID連接。??I?KEGG?N.??V?Disease?^?????、、1一’,?、、??/?KEGG?S,?T?/?KEG6?)??CH&MBL1DUniProtlD??f?CHEMBL?W——A:HEMBUD3?=W?Un.prot?)??J?UniProtiD?PMID??\??CHEMBLID/?PM,D??UniProtlP^jkA??(DrugBank?f?PubMed?)??V?y??圖3-1肺癌醫(yī)學(xué)數(shù)據(jù)集之間的關(guān)聯(lián)關(guān)系??ChEMBL[57]由歐洲分子生物學(xué)實驗室(EMBL)的歐洲生物信息學(xué)研宄所(EBI)維護
【參考文獻】:
期刊論文
[1]基于學(xué)習(xí)自動機和用戶興趣的PageRank算法研究[J]. 姜金川,王沖. 計算機工程與應(yīng)用. 2020(03)
[2]基于PageRank與HITS的改進算法的網(wǎng)頁排名優(yōu)化[J]. 庫珊,劉釗. 武漢科技大學(xué)學(xué)報. 2019(02)
[3]Hadoop2.0平臺概述[J]. 司雅楠. 科技與創(chuàng)新. 2019(05)
[4]文本相似度計算方法研究綜述[J]. 王春柳,楊永輝,鄧霏,賴輝源. 情報科學(xué). 2019(03)
[5]一種基于異構(gòu)網(wǎng)絡(luò)算法的藥物-蛋白關(guān)聯(lián)性研究方法[J]. 徐婷,龔家瑜,宋暉. 智能計算機與應(yīng)用. 2019(01)
[6]面向大規(guī)模時序圖SimRank的計算方法[J]. 苗壯,袁野,喬百友,王一舒,馬玉亮,王國仁. 清華大學(xué)學(xué)報(自然科學(xué)版). 2018(12)
[7]生物信息學(xué)研究進展[J]. 李洪東,朱曉姝,王建新. 玉林師范學(xué)院學(xué)報. 2018(05)
[8]基于P2P分布式網(wǎng)絡(luò)的類FTP共享系統(tǒng)的設(shè)計實現(xiàn)[J]. 杜慶宣. 電子測試. 2018(18)
[9]網(wǎng)絡(luò)鏈接分析的研究現(xiàn)狀及其發(fā)展趨勢[J]. 夏琦. 現(xiàn)代商貿(mào)工業(yè). 2018(26)
[10]基于上下文特征的領(lǐng)域文獻實體消歧算法[J]. 王靜,譚紹峰,賀東東,陳建輝,閆健卓. 北京生物醫(yī)學(xué)工程. 2018(04)
碩士論文
[1]基于HITS算法的微博采集系統(tǒng)設(shè)計與實現(xiàn)[D]. 喬靜軒.山東師范大學(xué) 2018
[2]問答社區(qū)中的動態(tài)演化推薦算法研究[D]. 林政.華南理工大學(xué) 2018
[3]協(xié)同過濾算法在藥物重定位中的研究與應(yīng)用[D]. 章嘯.東華大學(xué) 2017
[4]基于科研論文合作者關(guān)系圖的同名排歧方法研究[D]. 陳未路.杭州電子科技大學(xué) 2017
[5]基于上下文建模的協(xié)同過濾算法研究[D]. 宋爽.廣西師范大學(xué) 2016
[6]圖上的智能隨機游走分類算法研究及應(yīng)用[D]. 陸林.揚州大學(xué) 2014
[7]面向在線分析的語義網(wǎng)數(shù)據(jù)存儲系統(tǒng)研究[D]. 常冰琳.華中科技大學(xué) 2009
本文編號:3031008
【文章來源】:寧夏大學(xué)寧夏回族自治區(qū) 211工程院校
【文章頁數(shù)】:49 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1肺癌藥物治療通路RDF示例??
第二章相關(guān)理論與技術(shù)??許用戶瀏覽它,還可以設(shè)置各種規(guī)則或視圖,以便使用者從不同的角度對數(shù)據(jù)進行分析。界??面如圖2-2所示:??>:.???上???g?Ki3??9S?■?m^sns?;?:M5?awr.?;??u*Bi?mm?-?m?:?swk?:.?*se??x??ir?vtwr?v%rr?\' ̄r:-<:?Tr.?^????;r???'??ii^isa:?ivr??C--?>?@Sr?H0OZj?j?Leam?about?Neo4j?Jump?into?code??.''t'::?■.-?*?^?AnVv7.???as&?veu?at*?Cyp^?'iwtf-?vtr,???-■j?)?Ca-r??,,-??'><?r???\r—rz?nwew'lajry*?M?-t?]?RXUSKSocr??、>W:,.心先聲,fk%?辦:?Z^ywr^,??'?'?Mwi?d<i?omqK?do?voi??:)titoi;-??fll^83BS3SEBi?SSES^SES^^SB!??'::-,lL'?Monitor?the?system??Ktj?firKS-???****%?£>????l?H^N?I?Cidm?acsxn??圖2-2Neo4j界面展示??2.5小結(jié)??本章介紹了圖的定義和一些基礎(chǔ)理論;概述了?RDF圖模型的定義并通過一個肺癌數(shù)據(jù)??三元組的示例詳細(xì)解釋了?RDF三元組;接著介紹了本文所涉及的三種網(wǎng)絡(luò)鏈接分析方法的??理論知識
通過對比分析現(xiàn)有數(shù)據(jù)集的內(nèi)容和權(quán)威性,我們在互聯(lián)網(wǎng)中選擇了以下5個生物醫(yī)學(xué)數(shù)??據(jù)庫:ChEMBL、KEGG、DrugBank、UniPort和PubMed獲取本文所需的肺癌相關(guān)信息。??圖3-1說明了這些數(shù)據(jù)集之間的關(guān)聯(lián)關(guān)系。在這些數(shù)據(jù)集中,每個數(shù)據(jù)記錄都有自己的ID,??通過分析發(fā)現(xiàn),這些ID在五個數(shù)據(jù)集中相互包含,具有相互引用關(guān)系,可以作為分析數(shù)據(jù)??集關(guān)聯(lián)的重要途徑。其中KEGG數(shù)據(jù)集中的基因與UniProt數(shù)據(jù)集里的蛋白質(zhì)具有編碼關(guān)系,??它們之間通過UniProt?ID連接;ChEMBL數(shù)據(jù)集為化合物信息,它與UniProt數(shù)據(jù)集中肺癌??蛋白信息通過ChEMBL?ID連接;從DrugBank數(shù)據(jù)集提取的有關(guān)治療肺癌的藥物與UniProt??數(shù)據(jù)集的蛋白質(zhì)具有作用關(guān)系,通過UniProt?ID連接。??I?KEGG?N.??V?Disease?^?????、、1一’,?、、??/?KEGG?S,?T?/?KEG6?)??CH&MBL1DUniProtlD??f?CHEMBL?W——A:HEMBUD3?=W?Un.prot?)??J?UniProtiD?PMID??\??CHEMBLID/?PM,D??UniProtlP^jkA??(DrugBank?f?PubMed?)??V?y??圖3-1肺癌醫(yī)學(xué)數(shù)據(jù)集之間的關(guān)聯(lián)關(guān)系??ChEMBL[57]由歐洲分子生物學(xué)實驗室(EMBL)的歐洲生物信息學(xué)研宄所(EBI)維護
【參考文獻】:
期刊論文
[1]基于學(xué)習(xí)自動機和用戶興趣的PageRank算法研究[J]. 姜金川,王沖. 計算機工程與應(yīng)用. 2020(03)
[2]基于PageRank與HITS的改進算法的網(wǎng)頁排名優(yōu)化[J]. 庫珊,劉釗. 武漢科技大學(xué)學(xué)報. 2019(02)
[3]Hadoop2.0平臺概述[J]. 司雅楠. 科技與創(chuàng)新. 2019(05)
[4]文本相似度計算方法研究綜述[J]. 王春柳,楊永輝,鄧霏,賴輝源. 情報科學(xué). 2019(03)
[5]一種基于異構(gòu)網(wǎng)絡(luò)算法的藥物-蛋白關(guān)聯(lián)性研究方法[J]. 徐婷,龔家瑜,宋暉. 智能計算機與應(yīng)用. 2019(01)
[6]面向大規(guī)模時序圖SimRank的計算方法[J]. 苗壯,袁野,喬百友,王一舒,馬玉亮,王國仁. 清華大學(xué)學(xué)報(自然科學(xué)版). 2018(12)
[7]生物信息學(xué)研究進展[J]. 李洪東,朱曉姝,王建新. 玉林師范學(xué)院學(xué)報. 2018(05)
[8]基于P2P分布式網(wǎng)絡(luò)的類FTP共享系統(tǒng)的設(shè)計實現(xiàn)[J]. 杜慶宣. 電子測試. 2018(18)
[9]網(wǎng)絡(luò)鏈接分析的研究現(xiàn)狀及其發(fā)展趨勢[J]. 夏琦. 現(xiàn)代商貿(mào)工業(yè). 2018(26)
[10]基于上下文特征的領(lǐng)域文獻實體消歧算法[J]. 王靜,譚紹峰,賀東東,陳建輝,閆健卓. 北京生物醫(yī)學(xué)工程. 2018(04)
碩士論文
[1]基于HITS算法的微博采集系統(tǒng)設(shè)計與實現(xiàn)[D]. 喬靜軒.山東師范大學(xué) 2018
[2]問答社區(qū)中的動態(tài)演化推薦算法研究[D]. 林政.華南理工大學(xué) 2018
[3]協(xié)同過濾算法在藥物重定位中的研究與應(yīng)用[D]. 章嘯.東華大學(xué) 2017
[4]基于科研論文合作者關(guān)系圖的同名排歧方法研究[D]. 陳未路.杭州電子科技大學(xué) 2017
[5]基于上下文建模的協(xié)同過濾算法研究[D]. 宋爽.廣西師范大學(xué) 2016
[6]圖上的智能隨機游走分類算法研究及應(yīng)用[D]. 陸林.揚州大學(xué) 2014
[7]面向在線分析的語義網(wǎng)數(shù)據(jù)存儲系統(tǒng)研究[D]. 常冰琳.華中科技大學(xué) 2009
本文編號:3031008
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3031008.html
最近更新
教材專著