數(shù)據(jù)挖掘在蛋白質(zhì)翻譯后修飾及疾病診斷和預(yù)后中的應(yīng)用
本文選題:數(shù)據(jù)挖掘 + 乙;; 參考:《華東理工大學(xué)》2017年博士論文
【摘要】:在生物醫(yī)學(xué)領(lǐng)域,基于各種組學(xué)的轉(zhuǎn)錄組、蛋白質(zhì)組以及臨床上患者病理記錄等數(shù)據(jù)層出不窮,如何從海量生物醫(yī)學(xué)數(shù)據(jù)中挖掘出新穎且有用的信息來(lái)揭示生物醫(yī)學(xué)機(jī)制已成為人們關(guān)注的熱點(diǎn)之一。數(shù)據(jù)挖掘已廣泛地運(yùn)用到生物信息的各個(gè)方向中,但仍面臨各種挑戰(zhàn)和機(jī)遇。本課題分別從蛋白質(zhì)、microRNA和臨床醫(yī)學(xué)數(shù)據(jù)層面對(duì)蛋白質(zhì)翻譯后修飾、疾病的診斷和預(yù)后進(jìn)行了數(shù)據(jù)挖掘分析。在本課題中,我們盡可能多地收集賴氨酸乙;臄(shù)據(jù),在蛋白質(zhì)和肽段水平都做了去冗余處理,整合了氨基酸物化屬性(AAPP)、位置特異性組成(PSSC)以及相鄰氨基酸之間的轉(zhuǎn)換概率(TPM)等生物學(xué)特征,并構(gòu)建預(yù)測(cè)模型LAceP。與其他已有的方法比較,LAceP模型準(zhǔn)確率最高,而且能預(yù)測(cè)分析多種生物的乙;稽c(diǎn),模型的穩(wěn)定性更高,應(yīng)用性更廣。另外,為了便于生物科學(xué)家使用,LAceP做成了公開(kāi)且免費(fèi)的網(wǎng)絡(luò)服務(wù)器,用戶可以在網(wǎng)上簡(jiǎn)單快速地輸入序列進(jìn)行預(yù)測(cè)分析。LAceP模型為蛋白質(zhì)乙;揎椦芯刻峁┝诵碌姆治龇椒,有助于科研人員更好地理解蛋白質(zhì)的作用機(jī)制。高通量測(cè)序的方法為某些疾病的診斷提供了新的研究思路。在本課題中,基于microRNA的高通量測(cè)序技術(shù),我們提出了一種新穎的基于兩層邏輯回歸模型的HBV相關(guān)疾病診斷方法。通過(guò)樣本收集、數(shù)據(jù)處理、模型選擇、特征選擇和模型優(yōu)化過(guò)程,我們篩選到9個(gè)microRNAs可作為HBV相關(guān)疾病診斷的潛在標(biāo)志物。第一層模型利用3個(gè)microRNAs區(qū)分HBV相關(guān)疾病和健康對(duì)照組。第二層模型通過(guò)8個(gè)microRNAs將HBV相關(guān)疾病進(jìn)一步分為肝硬化和慢乙肝。兩組獨(dú)立測(cè)試集的驗(yàn)證結(jié)果顯示,我們的模型具有高的準(zhǔn)確率和魯棒性。通過(guò)對(duì)篩選到的microRNAs和它們的靶基因進(jìn)行功能富集分析,這些microRNAs顯著性地富集到了 HBV相關(guān)疾病和相關(guān)的功能通路。除了疾病的診斷,疾病預(yù)后也是生物醫(yī)學(xué)領(lǐng)域最為關(guān)心的話題之一。而影響預(yù)后的因素除了病人的身體素質(zhì)外,還有治療方式、病情以及社會(huì)生活等因素。在課題中,我們收集了 SEER數(shù)據(jù)庫(kù)中近十年50歲以下的Ⅰ期子宮內(nèi)膜樣腺癌(EEAC)患者的臨床病理學(xué)診斷和治療記錄數(shù)據(jù)。采用傾向得分匹配以及一些統(tǒng)計(jì)學(xué)方法對(duì)其進(jìn)行數(shù)據(jù)挖掘,回顧性地分析了年輕患者保留或切除卵巢對(duì)其生存預(yù)后的影響。研究結(jié)果表明,與切除卵巢的患者相比,保留卵巢的患者顯著性地傾向于更小的診斷年齡、更早的癌癥分期和分化更好的腫瘤組織,她們的腫瘤更小,接受放療和淋巴結(jié)切除術(shù)的可能性更低。經(jīng)過(guò)傾向得分匹配隨機(jī)化的過(guò)程后,保留卵巢和切除卵巢組間排除許多潛在的混雜因素,去除許多數(shù)據(jù)間的噪音,兩組間各臨床特征的差異也將不再顯著。對(duì)降噪之后的數(shù)據(jù)進(jìn)行多因素統(tǒng)計(jì)分析結(jié)果顯示,保留卵巢以及切除卵巢對(duì)總體生存和腫瘤特異性生存均無(wú)顯著性差異。保留卵巢對(duì)于年輕的Ⅰ期患者可能是安全的,患者可以在確保治療效果的情況下,考慮接受較為保守的治療方式從而保障其正常的生活質(zhì)量。以上結(jié)果對(duì)臨床診斷和治療具有一定的指導(dǎo)意義?傮w而言,本文從蛋白質(zhì)、microRNA和臨床醫(yī)療信息等層面對(duì)數(shù)據(jù)進(jìn)行挖掘分析,提出了 LAceP模型對(duì)賴氨酸乙;稽c(diǎn)預(yù)測(cè),準(zhǔn)確率較高,穩(wěn)定性良好,網(wǎng)絡(luò)服務(wù)器版本的預(yù)測(cè)工具,具有一定的實(shí)用性。論文基于兩層模型利用9個(gè)microRNA標(biāo)志物對(duì)HBV相關(guān)肝病進(jìn)行診斷,模型具有較高的準(zhǔn)確率和魯棒性,能明確區(qū)分HBV相關(guān)慢性肝炎和肝硬化,具有一定的臨床應(yīng)用價(jià)值。另外,論文基于傾向得分匹配算法,提出的Ⅰ期年輕子宮內(nèi)膜樣腺癌患者保留卵巢具有一定安全性的建議,具有良好的臨床指導(dǎo)意義。
[Abstract]:This paper presents a novel method for the diagnosis and prognosis of HBV related diseases from the data of protein , microRNA and clinical medicine . This paper analyses the data from the aspects of protein , microRNA , clinical medical information and so on , and puts forward the application value of LAceP model in diagnosis of HBV - related liver diseases .
【學(xué)位授予單位】:華東理工大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:R363;Q51
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 傅嵐;在數(shù)據(jù)海洋中打撈信息數(shù)據(jù)挖掘[J];科技廣場(chǎng);2002年11期
2 黃宏濤,陳陽(yáng);數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用[J];中國(guó)西部科技;2005年07期
3 董大鴻,何海青;淺談數(shù)據(jù)挖掘語(yǔ)言[J];江西科學(xué);2005年03期
4 曾瑩,陳曉柱;數(shù)據(jù)挖掘及算法淺談[J];中國(guó)科技信息;2005年14期
5 譚建中;淺析實(shí)施數(shù)據(jù)挖掘項(xiàng)目需要考慮的問(wèn)題[J];大眾科技;2005年09期
6 石峰,周紹梅;數(shù)據(jù)挖掘語(yǔ)言及其標(biāo)準(zhǔn)化淺析[J];江西科學(xué);2005年01期
7 周忠眉;數(shù)據(jù)挖掘課程大綱的建設(shè)[J];漳州師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2005年01期
8 王秀麗;數(shù)據(jù)挖掘功能特性及其應(yīng)用流程分析[J];科技創(chuàng)業(yè)月刊;2005年05期
9 劉曉華;;數(shù)據(jù)挖掘在銀行中的應(yīng)用[J];科技資訊;2006年32期
10 張敏;;數(shù)據(jù)挖掘在數(shù)字化校園建設(shè)中的應(yīng)用分析[J];內(nèi)江科技;2007年04期
相關(guān)會(huì)議論文 前10條
1 史東輝;蔡慶生;張春陽(yáng);;一種新的數(shù)據(jù)挖掘多策略方法研究[A];第十七屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2000年
2 張弦;;數(shù)據(jù)挖掘在農(nóng)業(yè)中的應(yīng)用[A];紀(jì)念中國(guó)農(nóng)業(yè)工程學(xué)會(huì)成立30周年暨中國(guó)農(nóng)業(yè)工程學(xué)會(huì)2009年學(xué)術(shù)年會(huì)(CSAE 2009)論文集[C];2009年
3 魏順平;;教育數(shù)據(jù)挖掘:現(xiàn)狀與趨勢(shì)[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計(jì)算機(jī)模擬與信息技術(shù)學(xué)術(shù)會(huì)議論文集[C];2011年
4 關(guān)清平;沉培輝;;概率網(wǎng)絡(luò)在數(shù)據(jù)挖掘上的應(yīng)用[A];科技、工程與經(jīng)濟(jì)社會(huì)協(xié)調(diào)發(fā)展——中國(guó)科協(xié)第五屆青年學(xué)術(shù)年會(huì)論文集[C];2004年
5 丁瑾;;基于Web數(shù)據(jù)挖掘的綜述[A];山西省科學(xué)技術(shù)情報(bào)學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C];2004年
6 聶茹;田森平;;Web數(shù)據(jù)挖掘及其在電子商務(wù)中的應(yīng)用[A];中南六省(區(qū))自動(dòng)化學(xué)會(huì)第24屆學(xué)術(shù)年會(huì)會(huì)議論文集[C];2006年
7 李菊;王軍;;數(shù)據(jù)挖掘在客戶關(guān)系管理的應(yīng)用[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
8 肖陽(yáng);李啟賢;;數(shù)據(jù)挖掘在中國(guó)鋼鐵行業(yè)中的應(yīng)用[A];中國(guó)計(jì)量協(xié)會(huì)冶金分會(huì)2012年會(huì)暨能源計(jì)量與節(jié)能降耗經(jīng)驗(yàn)交流會(huì)論文集[C];2012年
9 楊磊;王貴成;汪勇;張占勝;;SQL Server 2005在數(shù)據(jù)挖掘中的應(yīng)用[A];2009年中國(guó)智能自動(dòng)化會(huì)議論文集(第二分冊(cè))[C];2009年
10 謝中;邱玉輝;;面向商務(wù)網(wǎng)站有效性的數(shù)據(jù)挖掘方法[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2001年
相關(guān)重要報(bào)紙文章 前10條
1 本報(bào)記者褚寧;數(shù)據(jù)挖掘如“挖金”[N];解放日?qǐng)?bào);2002年
2 周蓉蓉;數(shù)據(jù)挖掘需要點(diǎn)想像力[N];計(jì)算機(jī)世界;2004年
3 □中國(guó)電信股份有限公司北京研究院 張舒博 □北京郵電大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 牛琨;走出數(shù)據(jù)挖掘的誤區(qū)[N];人民郵電;2006年
4 《網(wǎng)絡(luò)世界》記者 王瑩;數(shù)據(jù)挖掘保險(xiǎn)業(yè)的新藍(lán)海[N];網(wǎng)絡(luò)世界;2012年
5 劉俊麗;基于地理化的網(wǎng)絡(luò)數(shù)據(jù)挖掘與分析提升投資有效性[N];人民郵電;2014年
6 本報(bào)記者 連曉東;數(shù)據(jù)挖掘:金融信息化新熱點(diǎn)[N];中國(guó)電子報(bào);2002年
7 本報(bào)記者 鳳小華 朱仁康;“數(shù)字挖掘軟件”引領(lǐng)中國(guó)信息化新浪潮[N];中國(guó)電子報(bào);2003年
8 本報(bào)記者 史延廷;“成功企業(yè)數(shù)據(jù)挖掘暨數(shù)量化管理論壇”在京舉辦[N];中國(guó)旅游報(bào);2002年
9 朱小寧;數(shù)據(jù)挖掘:信息化戰(zhàn)爭(zhēng)的基礎(chǔ)工程[N];解放軍報(bào);2005年
10 本報(bào)記者 王小平;從“大集中”走向數(shù)據(jù)挖掘[N];金融時(shí)報(bào);2002年
相關(guān)博士學(xué)位論文 前10條
1 于自強(qiáng);海量流數(shù)據(jù)挖掘相關(guān)問(wèn)題研究[D];山東大學(xué);2015年
2 張馨;全基因組SNP芯片應(yīng)用于CNV和L0H分析的軟件比對(duì)與數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年
3 彭計(jì)紅;基于數(shù)據(jù)挖掘的癡呆中醫(yī)證的研究[D];南京中醫(yī)藥大學(xué);2015年
4 李秋虹;基于MapReduce的大規(guī)模數(shù)據(jù)挖掘技術(shù)研究[D];復(fù)旦大學(xué);2013年
5 鄔文帥;基于多目標(biāo)決策的數(shù)據(jù)挖掘方法評(píng)估與應(yīng)用[D];電子科技大學(xué);2015年
6 謝邦彥;整合數(shù)據(jù)挖掘與TRIZ理論的質(zhì)量管理方法研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2010年
7 何偉全;云南高校學(xué)生意外傷害因素關(guān)聯(lián)規(guī)則挖掘及風(fēng)險(xiǎn)管控體系研究[D];昆明理工大學(xué);2015年
8 段功豪;基于多結(jié)構(gòu)數(shù)據(jù)挖掘的滑坡災(zāi)害預(yù)測(cè)模型研究[D];中國(guó)地質(zhì)大學(xué);2016年
9 白曉明;基于數(shù)據(jù)挖掘的復(fù)合材料宏—細(xì)觀力學(xué)模型研究[D];哈爾濱工業(yè)大學(xué);2016年
10 藍(lán)永豪(LAM Wing Ho);基于數(shù)據(jù)挖掘技術(shù)分析當(dāng)代中醫(yī)名家痤瘡驗(yàn)方經(jīng)驗(yàn)研究[D];南京中醫(yī)藥大學(xué);2016年
相關(guān)碩士學(xué)位論文 前10條
1 林仁紅;基于數(shù)據(jù)挖掘的機(jī)遇識(shí)別與評(píng)價(jià)研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2007年
2 張彥俊;游戲運(yùn)營(yíng)中的數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年
3 焦亞召;基于多核函數(shù)FCM算法在數(shù)據(jù)挖掘聚類(lèi)中的應(yīng)用研究[D];昆明理工大學(xué);2015年
4 王杰鋒;物聯(lián)網(wǎng)能耗數(shù)據(jù)智能分析及其應(yīng)用平臺(tái)設(shè)計(jì)[D];江南大學(xué);2015年
5 劉學(xué)建;數(shù)據(jù)挖掘在電子商務(wù)推薦系統(tǒng)中的應(yīng)用研究[D];昆明理工大學(xué);2015年
6 戴陽(yáng)陽(yáng);基于數(shù)據(jù)挖掘的金融時(shí)間序列預(yù)測(cè)研究與應(yīng)用[D];江南大學(xué);2015年
7 石思優(yōu);基于主題模型的醫(yī)療數(shù)據(jù)挖掘研究[D];廣東技術(shù)師范學(xué)院;2015年
8 陳丹;移動(dòng)互聯(lián)網(wǎng)信令挖掘?qū)崿F(xiàn)智慧營(yíng)銷(xiāo)的設(shè)計(jì)與實(shí)現(xiàn)應(yīng)用研究[D];華南理工大學(xué);2015年
9 陳思;基于數(shù)據(jù)挖掘的大學(xué)生客戶識(shí)別模型的研究[D];昆明理工大學(xué);2015年
10 位長(zhǎng)帥;基于客戶數(shù)據(jù)挖掘的電信客戶關(guān)系管理研究[D];西南交通大學(xué);2015年
,本文編號(hào):1813307
本文鏈接:http://sikaile.net/yixuelunwen/jichuyixue/1813307.html