面向多類別腫瘤分類的基因選擇算法研究
發(fā)布時間:2024-03-25 04:26
癌癥已成為威脅人類生命健康最重要的疾病之一。腫瘤診斷是醫(yī)學(xué)領(lǐng)域的一大難題。DNA微陣列技術(shù)的出現(xiàn)使得腫瘤在基因表達(dá)水平上的研究得以實現(xiàn),這為腫瘤分類提供了另外一種重要手段。然而基因表達(dá)數(shù)據(jù)集包含了大量與腫瘤分類不相關(guān)的基因和冗余,如果不進(jìn)行基因選擇,即使借用最好的分類器也無法獲得準(zhǔn)確的分類結(jié)果;蜻x擇不但可以提升腫瘤的分類精度,降低基因個數(shù),還有助于發(fā)現(xiàn)疾病機(jī)制,降低診斷成本。本文將根據(jù)基因表達(dá)數(shù)據(jù)的特點(diǎn),對基因選擇算法進(jìn)行深入研究,主要內(nèi)容如下:(1)提出一種面向基因選擇的結(jié)合信息增益和支持向量機(jī)的自適應(yīng)粒子群優(yōu)化算法(IG-SVM-APSO)。首先利用信息增益對基因進(jìn)行初步過濾,排除掉大量無關(guān)基因和噪聲。針對粒子群優(yōu)化算法容易陷入局部最優(yōu)、過早收斂的問題,引入自適應(yīng)慣性權(quán)重來增強(qiáng)粒子群優(yōu)化算法的全局搜索能力。然后,以SVM為適應(yīng)度函數(shù),使用自適應(yīng)粒子群優(yōu)化算法對基因進(jìn)行選擇。實驗表明,IG-SVM-APSO擁有較高的分類精度和較少的基因選擇個數(shù)。(2)信息增益雖然很好的利用了類別信息,但沒有考慮到特征間的相互信息。為了降低基因間的冗余,選出相似性較小的基因,提出了一種結(jié)合信息增益...
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文編號:3938538
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖4.1混合過濾算法IG&PCC示意圖
中國計量大學(xué)碩士學(xué)位論文21基因?qū)⒈环譃閮山M。對于基因i,它與其余基因間的相互信息值定義如下:=∑||=11,≠(41)上式中,表示基因的原始維度。從上式中可以看出,當(dāng)值較小時,表明基因i和其余基因間的相關(guān)性較小,顯得比較獨(dú)特;當(dāng)值較大時,表明基因i和其余基因較相似,即相關(guān)性較大....
圖4.2粒子結(jié)構(gòu)示意圖
中國計量大學(xué)碩士學(xué)位論文22的基因選擇過程如圖4.1所示,標(biāo)記D和標(biāo)記S分別表示屬于組和組的基因。4.2引入局部搜索的改進(jìn)簡化群優(yōu)化算法盡管SSO是一種比較高效的啟發(fā)式搜索算法,但仍然存在著一些缺點(diǎn),比如由于選擇相似基因引起的冗余,缺乏對基因選擇個數(shù)的關(guān)注等。為克服這些缺點(diǎn),提高....
本文編號:3938538
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3938538.html
最近更新
教材專著