基于人血漿microRNAs的數(shù)據(jù)挖掘技術(shù)構(gòu)建肺癌預測系統(tǒng)
本文關(guān)鍵詞: 血漿microRNAs 數(shù)據(jù)挖掘 肺癌 預測 出處:《鄭州大學》2017年碩士論文 論文類型:學位論文
【摘要】:肺癌位居中國惡性腫瘤發(fā)病率和死亡率首位,肺癌預防的重要手段是開展早期發(fā)現(xiàn)、早期診斷和早期治療,有必要研究高敏感性和特異性的腫瘤生物標志物。microRNAs(mi RNAs)可調(diào)控基因參與細胞的生長、增殖、分化和凋亡等過程,大量的研究表明循環(huán)miRNAs和多種腫瘤的發(fā)生和發(fā)展有關(guān),具有作為包括肺癌在內(nèi)的疾病診斷生物標志物的潛力。目的該研究應用決策樹(Decision Tree,DT)、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neual Networks,ANN)和支持向量機(Support Vector Machines,SVM)等數(shù)據(jù)挖掘方法聯(lián)合血漿miRNA生物標志、流行病學參數(shù)和臨床癥狀資料建立肺癌預測模型。對象和方法1.研究對象:肺癌組為2016年6月至2017年2月取自鄭州大學第一附屬醫(yī)院呼吸內(nèi)科、河南省腫瘤醫(yī)院胸外科、河南省胸科醫(yī)院呼吸內(nèi)科和胸外科的148例初診的原發(fā)性肺癌患者;對照組為2016年7月取自淇縣疾病預防控制中心體檢的148例健康人群。經(jīng)知情同意后收集研究對象的信息和血液標本。2.實驗方法:血漿miRNAs(mi R-16、miR-21、miR-20a、mi R-210、miR-145、miR-126、miR-223、mi R-197、miR-30a、mi R-30d、miR-25)表達水平的檢測采用實時熒光定量PCR法。3.數(shù)據(jù)挖掘:采用SPSS Clementine 21.0軟件;趩我蛩胤治鼋Y(jié)果和Logistic回歸分析優(yōu)化結(jié)果,先將數(shù)據(jù)預處理,按3:1的比例將所有樣本隨機分成訓練集和預測集,用訓練好的模型對預測集進行預測,應用Fisher判別分析、DT C5.0、ANN和SVM算法分別建立模型,并采用診斷試驗評價指標比較模型的預測結(jié)果。4.統(tǒng)計學分析:Excel 2010建立數(shù)據(jù)庫,采用SPSS 21.0軟件進行統(tǒng)計分析。定量資料分析符合正態(tài)分布時采用兩獨立樣本t檢驗,不符合正態(tài)分布時采用Mann-Whitney U檢驗;定性資料間的比較采用χ2檢驗;肺癌的影響因素采用二分類Logistic回歸分析。檢驗水準為α=0.05。結(jié)果1.血漿miRNAs表達水平檢測結(jié)果:肺癌組的10種血漿miRNAs(miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、miR-197、miR-30a、miR-30d、miR-25)的表達水平高于對照組,差異有統(tǒng)計學意義(P0.05)。11種血漿miRNAs(miR-16、miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、mi R-197、miR-30a、mi R-30d、miR-25)的表達水平與年齡、肺癌的組織學類型無關(guān)(P0.05);血漿中miR-30a和miR-21表達水平與性別有關(guān)(P0.05);血漿中mi R-21和miR-25表達水平與吸煙程度、飲酒有關(guān)(P0.05)。血漿中miR-210的表達水平和肺癌的分期有關(guān)(P0.05);血漿中miR-126的表達水平和肺癌淋巴結(jié)轉(zhuǎn)移有關(guān)(P0.05)。2.肺癌影響因素分析結(jié)果:單因素分析結(jié)果顯示肺癌組和對照組間的流行病學參數(shù)和臨床癥狀(吸煙程度、發(fā)熱、胸悶胸痛、咳嗽、痰中帶血、咯血)的分布的差異和10種血漿miRNAs(miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、mi R-197、miR-30a、mi R-30d、miR-25)的表達水平的差異有統(tǒng)計學意義(P0.05);多因素Logistic回歸分析結(jié)果顯示,發(fā)熱、胸悶胸痛、咳嗽、血漿中miR-20a(P=0.016)和miR-223(P=0.001)相對表達量升高可能是肺癌的危險因素。3.數(shù)據(jù)挖掘模型的評價結(jié)果:由吸煙程度、發(fā)熱、胸悶胸痛、咳嗽、痰中帶血、咯血、10種血漿mi RNAs(miR-21、miR-20a、miR-210、mi R-145、miR-126、miR-223、mi R-197、miR-30a、miR-30d、mi R-25)的表達水平這16個變量建立的16項DT C5.0模型和由發(fā)熱、胸悶胸痛、咳嗽、痰中帶血、咯血、血漿中miR-20a和miR-223表達水平建立的優(yōu)化DT C5.0模型的準確度分別為98.78%和87.80%,AUC分別為0.985和0.883;16項SVM模型和優(yōu)化SVM模型的準確度分別為98.78%和89.02%,AUC分別為0.985和0.893;16項ANN模型和優(yōu)化ANN模型的準確度分別為87.80%和84.15%,AUC分別為0.879和0.835;16項Fisher判別分析模型和優(yōu)化Fisher判別分析模型的準確度分別為82.93%和82.93%,AUC分別為0.828和0.824。16項DT C5.0模型和16項SVM模型的AUC均優(yōu)于其他6種模型(P0.05);其他6種模型的AUC之間的差異沒有統(tǒng)計學意義(P0.05)。結(jié)論1.人血漿中10種miRNAs(miR-21、miR-20a、miR-210、miR-145、miR-126、miR-223、mi R-197、miR-30a、mi R-30d、miR-25)的表達水平與肺癌相關(guān)。血漿中miR-20a、mi R-223相對表達量可作為肺癌預測的重要指標。2.本研究建立了基于人血漿中的microRNAs的Fisher判別分析、決策樹、神經(jīng)網(wǎng)絡(luò)和支持向量機肺癌預測模型;決策樹模型和支持向量機模型對肺癌的預測效果最好。
[Abstract]:Lung cancer is the first in Chinese malignant tumor incidence and mortality . The important means of prevention of lung cancer is to carry out early detection , early diagnosis and early treatment , and it is necessary to study the biological markers of lung cancer with high sensitivity and specificity . The expression level of miR - 21 and miR - 21 in plasma was significantly higher than that of control group ( P0.05 ) . The expression level of miR - 21 and miR - 21 in plasma was significantly higher than that of control group ( P0.05 ) . There was significant difference in the expression level of miR - 21 , miR - 20a , miR - 210 , miR - 145 , miR - 126 , miR - 223 , mi R - 197 , miR - 30a , mi R - 30d , and miR - 25 in 10 plasma microRNAs ( miR - 21 , miR - 22 , miR - 210 , mi R - 197 , miR - 30a , and mi R - 25 ) . The accuracy of the 16 SVM models and the optimized ANN models were 98.78 % and 89.02 % , the AUC were 0.985 and 0.893 , respectively . The accuracy of the 16 model of ANN and the optimized ANN model was 82.93 % and 84.15 % , AUC 0 . 828 and 0 . 824.16 . The Fisher discriminant analysis , decision tree , neural network and support vector machine lung cancer prediction model were established .
【學位授予單位】:鄭州大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP311.13;R734.2
【相似文獻】
相關(guān)期刊論文 前10條
1 胡婷婷;董玲;張丹瑛;;microRNAs與原發(fā)性肝細胞肝癌相關(guān)性的研究進展[J];中國臨床醫(yī)學;2013年04期
2 張昌明;張婉芬;劉春蓓;曾科;劉志紅;;循環(huán)microRNAs與局灶節(jié)段性腎小球硬化患者疾病活動的關(guān)系[J];腎臟病與透析腎移植雜志;2013年04期
3 魏麗萍;許振坤;姚朱華;;MicroRNAs在冠狀動脈粥樣硬化性心臟病中的作用及研究進展[J];醫(yī)學綜述;2011年16期
4 任景怡;許寧;韓冠平;陳紅;;microRNAs參與動脈粥樣硬化疾病的發(fā)生[J];中國生物化學與分子生物學報;2011年06期
5 丁婧;孟雁;;microRNAs與糖尿病[J];中國糖尿病雜志;2010年07期
6 徐莎;劉厚奇;;MicroRNAs與信號轉(zhuǎn)導及轉(zhuǎn)錄激活因子[J];第二軍醫(yī)大學學報;2013年04期
7 張婉芬;張昌明;劉春蓓;秦衛(wèi)松;鄭春霞;曾科;劉志紅;;尿液microRNAs作為局灶節(jié)段性腎小球硬化疾病活動生物標志物的研究[J];腎臟病與透析腎移植雜志;2013年04期
8 譚勝;朱濤;;MicroRNAs在消化系相關(guān)腫瘤中的研究[J];胃腸病學和肝病學雜志;2009年03期
9 何相宜;袁耀宗;;胰腺癌與糖尿病、胃腸道微生態(tài)和microRNAs關(guān)系的研究現(xiàn)狀[J];胃腸病學;2014年04期
10 曹美群;陳德珩;張春虎;吳正治;;抑郁模型大鼠海馬內(nèi)特異性microRNAs的篩選以及柴胡疏肝散的干預作用[J];中國中藥雜志;2013年10期
相關(guān)會議論文 前10條
1 王蕓;陶筱川;呂應堂;;水稻MicroRNAs在水稻發(fā)育過程中的功能研究[A];湖北省植物生理學會第十五次學術(shù)研討會論文集[C];2007年
2 周寧;陳寶元;曹潔;湯華;劉民;鄧園;王彥;;microRNAs在阻塞性睡眠呼吸暫停低通氣綜合征患者血清中的表達及意義[A];中華醫(yī)學會呼吸病學年會——2013第十四次全國呼吸病學學術(shù)會議論文匯編[C];2013年
3 韋暉;王成;范鈺;許琪;張辰宇;沈巖;;偏執(zhí)型精神分裂癥血漿microRNAs表達譜的篩查[A];第七屆全國醫(yī)學生物化學與分子生物學和第四屆全國臨床應用生物化學與分子生物學聯(lián)合學術(shù)研討會暨醫(yī)學生化分會會員代表大會論文集[C];2011年
4 單志新;余細勇;林秋雄;符永恒;鄧春玉;楊敏;林曙光;;microRNAs、炎癥因子及其受體基因在自發(fā)性高血壓大鼠中的表達[A];第九屆全國心血管藥理學術(shù)會議論文集[C];2007年
5 郭士偉;劉藹民;;小RNA(MicroRNAs)的發(fā)現(xiàn)、結(jié)構(gòu)和功能[A];2006年中國植物逆境生理生態(tài)與分子生物學學術(shù)研討會論文摘要匯編[C];2006年
6 鄭宗基;劉曉萌;張雷;趙倩偉;李晨鐘;薛耀明;;β3腎上腺素受體激動劑對C57BL/6J小鼠脂肪組織棕色化相關(guān)基因和microRNAs的影響[A];中華醫(yī)學會第十二次全國內(nèi)分泌學學術(shù)會議論文匯編[C];2013年
7 李海怡;高璐;左洪亮;鐘國華;;昆蟲microRNAs功能研究進展[A];公共植保與綠色防控[C];2010年
8 劉紅;韓璐璐;謝爽;婁瑩;蔣娟娟;田蕾;許莉;李一石;;連續(xù)口服厄貝沙坦對健康中國志愿者血漿MicroRNAs表達的影響[A];中國心臟大會(CHC)2011暨北京國際心血管病論壇論文集[C];2011年
9 方巧云;楊森;張學軍;;MicroRNAs及其在皮膚病上的應用[A];中華醫(yī)學會第14次全國皮膚性病學術(shù)年會論文匯編[C];2008年
10 韓璐璐;劉紅;康健;邊文彥;龐會敏;李一石;;凍存血漿中MicroRNAs穩(wěn)定性評價[A];中國心臟大會(CHC)2011暨北京國際心血管病論壇論文集[C];2011年
相關(guān)重要報紙文章 前10條
1 本報記者褚寧;數(shù)據(jù)挖掘如“挖金”[N];解放日報;2002年
2 周蓉蓉;數(shù)據(jù)挖掘需要點想像力[N];計算機世界;2004年
3 □中國電信股份有限公司北京研究院 張舒博 □北京郵電大學計算機科學與技術(shù)學院 牛琨;走出數(shù)據(jù)挖掘的誤區(qū)[N];人民郵電;2006年
4 《網(wǎng)絡(luò)世界》記者 王瑩;數(shù)據(jù)挖掘保險業(yè)的新藍海[N];網(wǎng)絡(luò)世界;2012年
5 劉俊麗;基于地理化的網(wǎng)絡(luò)數(shù)據(jù)挖掘與分析提升投資有效性[N];人民郵電;2014年
6 本報記者 連曉東;數(shù)據(jù)挖掘:金融信息化新熱點[N];中國電子報;2002年
7 本報記者 鳳小華 朱仁康;“數(shù)字挖掘軟件”引領(lǐng)中國信息化新浪潮[N];中國電子報;2003年
8 本報記者 史延廷;“成功企業(yè)數(shù)據(jù)挖掘暨數(shù)量化管理論壇”在京舉辦[N];中國旅游報;2002年
9 朱小寧;數(shù)據(jù)挖掘:信息化戰(zhàn)爭的基礎(chǔ)工程[N];解放軍報;2005年
10 本報記者 王小平;從“大集中”走向數(shù)據(jù)挖掘[N];金融時報;2002年
相關(guān)博士學位論文 前10條
1 詹蕓;MicroRNAs在乳腺癌侵襲轉(zhuǎn)移過程中的功能與機制研究[D];北京協(xié)和醫(yī)學院;2015年
2 譚明;血小板源外泌小體中microRNAs作為預測動脈粥樣硬化血栓形成的機制研究[D];北京協(xié)和醫(yī)學院;2016年
3 戴欣;microRNAs在胰腺癌相關(guān)性糖尿病中的表達及相關(guān)機制研究[D];上海交通大學;2013年
4 周可樹;MicroRNAs在慢性淋巴增殖性疾病中的表達及其在慢性淋巴細胞白血病預后中的意義研究[D];中國協(xié)和醫(yī)科大學;2010年
5 劉雯靜;胰腺癌特異性microRNAs的篩選及機制研究[D];北京協(xié)和醫(yī)學院;2011年
6 于雙妮;胰腺癌差異表達microRNAs的鑒定及功能研究[D];北京協(xié)和醫(yī)學院;2008年
7 熊薇;微泡microRNAs在肝癌診斷及發(fā)病機制中的作用研究[D];華中科技大學;2012年
8 陳娜;STAT3介導microRNAs調(diào)控的IL-9過表達在慢性淋巴細胞性白血病免疫調(diào)節(jié)機制中的研究[D];山東大學;2014年
9 高剛;氡致肺癌及肺損傷相關(guān)microRNAs的研究[D];中國疾病預防控制中心;2010年
10 張彩彩;硫化氫通過microRNAs調(diào)控血管新生的機制研究[D];復旦大學;2011年
相關(guān)碩士學位論文 前10條
1 譚志軍;microRNAs在人骨髓間充質(zhì)干細胞向汗腺樣細胞分化中的作用研究[D];天津醫(yī)科大學;2015年
2 王倩;基于雙鏈特異性核酸酶介導的MicroRNAs檢測新方法的研究[D];華東理工大學;2016年
3 唐千捷;血漿microRNAs預測氯吡格雷抗血小板療效及心血管不良事件的研究[D];廣東藥科大學;2016年
4 楊翠云;基于信號放大的高靈敏腺苷與MicroRNAs電化學生物傳感器的制備及研究[D];西南大學;2016年
5 杜彥麗;microRNAs對黃牛和水牛朊病毒基因轉(zhuǎn)錄后調(diào)控研究[D];云南大學;2016年
6 楊丹鳳;以microRNAs為靶標結(jié)核病新型檢測方法的建立[D];吉林農(nóng)業(yè)大學;2016年
7 王曉鈺;基于microRNAs對上皮連接蛋白的調(diào)控探討升麻素抗過敏性炎癥復發(fā)的機制[D];南京中醫(yī)藥大學;2016年
8 劉瀟;慢性阻塞性肺疾病差異表達microRNAs及其臨床意義[D];山東大學;2017年
9 黃麗敏;MicroRNAs在動脈粥樣硬化血管中的異常表達[D];寧夏醫(yī)科大學;2013年
10 梅麗麗;食管鱗癌中差異表達microRNAs的致癌機制研究[D];昆明理工大學;2017年
,本文編號:1476867
本文鏈接:http://sikaile.net/yixuelunwen/zlx/1476867.html