天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

肺腺癌基因分類分析

發(fā)布時(shí)間:2021-12-10 16:12
  肺癌是世界公認(rèn)的發(fā)病率和死亡率較高的惡性腫瘤之一.肺癌在中國的形勢則更為嚴(yán)峻,其發(fā)病率和死亡率已躍居第一位.其中,肺腺癌(Lung Adenocarcinoma,LUAD)的發(fā)病率逐年增高且呈現(xiàn)激增趨勢,又因其病灶易轉(zhuǎn)移、患者就診不及時(shí),往往難以治愈.隨著基因檢測和基因診斷的興起,肺腺癌的早期預(yù)防和診療出現(xiàn)了新的契機(jī).然而,基因的數(shù)量成千上萬,若對每一位患者的全基因組進(jìn)行測序,存在效率低和成本高的弊端.若能對基因進(jìn)行分類,利用同類基因在表達(dá)上具有相似性的特點(diǎn),則可以減少基因檢測的工作量.本文以美國國立生物技術(shù)信息中心(NCBI)中肺腺癌患者基因數(shù)據(jù)為研究對象,運(yùn)用統(tǒng)計(jì)方法和機(jī)器學(xué)習(xí)方法構(gòu)建分類器,對致病關(guān)鍵基因進(jìn)行分類.在研究過程中,創(chuàng)新性地提出因子分析-SMOTE-KNN/邏輯回歸/AdaBoost分類模型,因子分析用于分類和標(biāo)注,SMOTE采樣用于平衡數(shù)據(jù),分類算法用于構(gòu)建多類別分類器,提高了分類效果,為指導(dǎo)臨床基因篩選節(jié)省經(jīng)濟(jì)成本和時(shí)間成本提供依據(jù).本文的主要工作如下:(1)對肺腺癌基因數(shù)據(jù)進(jìn)行預(yù)處理.首先,本文在P<0.001水平下,采用倍數(shù)法,選取了 |logFC|&g... 

【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:78 頁

【學(xué)位級別】:碩士

【部分圖文】:

肺腺癌基因分類分析


圖2.1:?KNN基本思想??

基因,樣本


>t??j-?■?*?;rW>*??i*?入:》v?V?iv#?W?V*n?<??*.W?'P?JJ???????)<^<AOI?i>*:?I.?1V<?H?>:?M?W,?^TV?U?is??,??0??'*???wr?.v*v??I*????*?w?uia?v?w.as#M?-5?fc..?M??*?a?usmj??a?.?i?:??r??k??.iv?v?/mMM%?*??f〇ei*???n?t<a?a?u?>????;??(a)?(b)?(c)??圖3.2:差異基因部分截圖??假設(shè)腫瘤樣本為而e?Rd,?i?=?1,2,???????,?57,確定采樣倍數(shù)iV,使得新的樣本??數(shù)為變量5倍以上.近鄰樣本個(gè)數(shù)=?5,近鄰樣本確定方法采用歐氏距離.操??作步驟如下:??(1)在歐氏距離下,找到距離樣本而,最近的5個(gè)樣本,記為而(near),?near?£??{1,2,…?,5}.??(2)隨機(jī)選擇nn?£?{1,2,…,5},得到樣本叫??(3)隨機(jī)生成向量?c?=?(6,&,…,6i)T,其中?6:?£?(〇,1),i?=?i,2,...,d,合成新??樣本?Xjneit).???^inew?_?工i?+?C?.(工i(nn)?一?-^i)????⑷將步驟⑵-⑶重復(fù)iv次,即從Xi出發(fā)得到TV個(gè)新合成樣本而_,neio?e??{1,2,...,iV}.??(5)將步驟(1)-(4)重復(fù)57次,即得到57?*?TV個(gè)新合成樣本.??(6)將原腫瘤樣本與新合成樣本合并,作為新的原始樣本.??對于新的原始樣本采用極值處理法進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化,消除量綱和量級的影??響.??3.6評價(jià)標(biāo)準(zhǔn)??

評價(jià)指標(biāo),數(shù)據(jù)集,準(zhǔn)確率


?山東大學(xué)碩士學(xué)位論文???數(shù)據(jù)ms3??1?■??——宏褚輯半??09?—宏召涔率??0.8?.?|…鐲罕-??Q.7?+_+.+?+■?+?.+.+?+.+?‘丄??+?+?+?+?++十+?++?+.+?+?+?+?+■+??^?〇e??蠢〇5‘??—0.4?.??0.3?■??〇.2\兩一、??〇1????0??1?'?1?'?1?'??5?10?15?20?25?30??K的取值??圖4.1:?KNN評價(jià)指標(biāo)??可以看到,四個(gè)評價(jià)指標(biāo)隨著K值的增大,呈現(xiàn)先下降后上升再下降的趨??勢.?dāng)?shù)據(jù)集&各項(xiàng)指標(biāo)波動較大,這是因?yàn)閿?shù)據(jù)集&較小,在*5折交叉驗(yàn)證??中,各項(xiàng)指標(biāo)對訓(xùn)練集和驗(yàn)證集劃分的依賴性較大.相比較之下,數(shù)據(jù)集&和??&各項(xiàng)指標(biāo)在K值超過一個(gè)數(shù)值后趨于平穩(wěn).??根據(jù)圖像,在此將K?=?1,2,...,10時(shí)的準(zhǔn)確率和宏R值做對比.由??表4.10可知,數(shù)據(jù)集&在K?=?1,9,10時(shí)有較高的準(zhǔn)確率,數(shù)據(jù)集&在K?=?1,4??時(shí)有較高的準(zhǔn)確率,數(shù)據(jù)集而在K?=?1,3時(shí)有較高的準(zhǔn)確率.但K?=?1時(shí)容??易分類結(jié)果容易受到周圍噪聲的影響,實(shí)際運(yùn)用時(shí)不建議選取.??|1丨2?丨3丨4?一?5丨6?7?|?8?|?9?|?10 ̄??|?準(zhǔn)確率?0.6171?0.5045?0.5450?0.5135?0.5180?0.5811?0.5405?0.5811?0.6081?0.6081??S'?宏?G?0.4079?0.2482?0.2556?0.2241?0.2334?0.2802?0.2665?0.2744?0.2859?0.2867??準(zhǔn)

【參考文獻(xiàn)】:
期刊論文
[1]樹狀高分子載體在前列腺癌基因治療中的應(yīng)用[J]. 竇小鋒,林梅.  臨床誤診誤治. 2019(12)
[2]綜合評價(jià)中數(shù)據(jù)標(biāo)準(zhǔn)化方法比較研究[J]. 劉競妍,張可,王桂華.  數(shù)字技術(shù)與應(yīng)用. 2018(06)
[3]肺腺癌的治療現(xiàn)狀[J]. 王斌,張雨潔.  世界最新醫(yī)學(xué)信息文摘. 2018(45)
[4]基于HBase的多分類邏輯回歸算法研究[J]. 劉黎志,鄧介一,吳云韜.  計(jì)算機(jī)應(yīng)用研究. 2018(10)
[5]大數(shù)據(jù)背景下的生物信息學(xué)研究現(xiàn)狀[J]. 王俊,郭麗,吳建盛,湯麗華,胡棟.  南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(04)
[6]生物信息學(xué)研究概述[J]. 李淮.  開封教育學(xué)院學(xué)報(bào). 2017(06)
[7]腺病毒介導(dǎo)基因治療與病毒治療前列腺癌的靶向研究進(jìn)展[J]. 蔡忠林,劉強(qiáng)照,周川,李慧,李文娟,魏緒磐,周逢海.  現(xiàn)代泌尿外科雜志. 2017(11)
[8]線性無量綱化方法比較研究[J]. 詹敏,廖志高,徐玖平.  統(tǒng)計(jì)與信息論壇. 2016(12)
[9]癌癥基因診斷的現(xiàn)狀與未來[J]. 鄭大為,鄭文嶺.  家庭醫(yī)學(xué). 2016(08)
[10]基因表達(dá)差異譜數(shù)據(jù)的顯著性分析方法[J]. 劉正龍,王洪平,楊艷梅,羅玉軍.  數(shù)理醫(yī)藥學(xué)雜志. 2015(02)



本文編號:3532961

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3532961.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fb96d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com