基于智能算法的高維生物醫(yī)學(xué)數(shù)據(jù)集的特征選擇策略研究
發(fā)布時(shí)間:2023-08-11 17:56
隨著基因芯片技術(shù)在醫(yī)學(xué)領(lǐng)域被廣泛應(yīng)用,大量微陣列數(shù)據(jù)被迅速積累,通過(guò)對(duì)這些數(shù)據(jù)進(jìn)行分析并構(gòu)建有效的分類模型,對(duì)一些潛在病患的早期診斷和臨床治療具有重要的研究意義和應(yīng)用價(jià)值。然而,基因微陣列數(shù)據(jù)具有“高維小樣本”的特點(diǎn),如結(jié)腸微陣列數(shù)據(jù)集包含了兩千多個(gè)基因特征。面對(duì)如此大規(guī)模的微陣列數(shù)據(jù)集,專家在短時(shí)間內(nèi)不能直接進(jìn)行分析和診斷治療。此外,大多基因數(shù)據(jù)通常含有一些冗余或噪聲數(shù)據(jù),可能會(huì)導(dǎo)致疾病診斷算法的建模和訓(xùn)練時(shí)間過(guò)長(zhǎng)時(shí)的過(guò)度擬合而誤導(dǎo),從而導(dǎo)致錯(cuò)誤的醫(yī)療診斷。作為一種有效的降維方式,特征選擇在生物醫(yī)學(xué)領(lǐng)域已經(jīng)引起廣泛的關(guān)注并成為近年來(lái)生物信息學(xué)領(lǐng)域的研究熱點(diǎn)。特征選擇技術(shù)是對(duì)微陣列基因數(shù)據(jù)進(jìn)行適當(dāng)分析和分類的關(guān)鍵步驟,如果沒(méi)有合適的特征選擇方法,現(xiàn)有的模型很難準(zhǔn)確捕獲重要信息。本質(zhì)上,特征選擇問(wèn)題可以被視為一個(gè)雙目標(biāo)優(yōu)化問(wèn)題,即在保持或提高預(yù)測(cè)精度的同時(shí)優(yōu)化特征子集。目前已經(jīng)存在一些針對(duì)微陣列生物醫(yī)學(xué)數(shù)據(jù)的特征選擇方法。其中,基于Wrapper的特征選擇方法在搜索過(guò)程中旨在獲得較高的分類精度而吸引了越來(lái)越多研究學(xué)者的注意。搜索策略是Wrapper方法中最重要的步驟,基于種群機(jī)制的元啟發(fā)...
【文章頁(yè)數(shù)】:84 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文主要研究工作
1.4 章節(jié)安排
2 相關(guān)理論知識(shí)
2.1 特征選擇
2.1.1 特征選擇的搜索策略
2.1.2 特征選擇的評(píng)估標(biāo)準(zhǔn)
2.2 分類算法概述
2.2.1 KNN分類器
2.2.2 SVM分類器
2.2.3 NB分類器
2.2.4 ELM分類器
2.3 公開(kāi)數(shù)據(jù)集描述
2.4 基于智能算法的特征選擇流程
2.5 本章小結(jié)
3 基于改進(jìn)克隆花授粉算法的疾病特征選擇研究
3.1 引言
3.2 克隆花授粉算法(CFPA)
3.3 二進(jìn)制編碼
3.4 改進(jìn)策略的設(shè)計(jì)
3.4.1 絕對(duì)平衡分組策略(ABGS)
3.4.2 自適應(yīng)高斯突變
3.5 基于改進(jìn)的克隆花授粉算法(IBCFPA)的特征選擇
3.6 實(shí)驗(yàn)分析
3.6.1 不同算法的性能比較
3.6.2 不同分類器的驗(yàn)證
3.7 本章小結(jié)
4 基于改進(jìn)珊瑚礁算法的疾病特征選擇研究
4.1 引言
4.2 珊瑚礁優(yōu)化算法(CRO)
4.3 模擬退火算法(SA)
4.4 基于珊瑚礁優(yōu)化算法結(jié)合模擬退火(BCROSAT)的特征選擇
4.4.1 初始化編碼
4.4.2 錦標(biāo)賽選擇策略(TS)
4.4.3 BCROSAT的實(shí)現(xiàn)步驟
4.5 實(shí)驗(yàn)分析
4.5.1 實(shí)驗(yàn)設(shè)置
4.5.2 算法性能比較
4.5.3 分類器驗(yàn)證
4.6 本章小結(jié)
5 基于增強(qiáng)的WRAPPER模式的疾病特征選擇研究
5.1 引言
5.2 卡方檢測(cè)算法
5.3 基于卡方檢驗(yàn)和WRAPPER算法的特征選擇
5.4 實(shí)驗(yàn)結(jié)果分析
5.4.1 不同混合模式算法的性能比較
5.4.2 比較基于混合模式和Wrapper的特征選擇性能
5.5 本章小結(jié)
6 總結(jié)與展望
6.1 本文總結(jié)
6.2 本文展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間科研成果
本文編號(hào):3841493
【文章頁(yè)數(shù)】:84 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文主要研究工作
1.4 章節(jié)安排
2 相關(guān)理論知識(shí)
2.1 特征選擇
2.1.1 特征選擇的搜索策略
2.1.2 特征選擇的評(píng)估標(biāo)準(zhǔn)
2.2 分類算法概述
2.2.1 KNN分類器
2.2.2 SVM分類器
2.2.3 NB分類器
2.2.4 ELM分類器
2.3 公開(kāi)數(shù)據(jù)集描述
2.4 基于智能算法的特征選擇流程
2.5 本章小結(jié)
3 基于改進(jìn)克隆花授粉算法的疾病特征選擇研究
3.1 引言
3.2 克隆花授粉算法(CFPA)
3.3 二進(jìn)制編碼
3.4 改進(jìn)策略的設(shè)計(jì)
3.4.1 絕對(duì)平衡分組策略(ABGS)
3.4.2 自適應(yīng)高斯突變
3.5 基于改進(jìn)的克隆花授粉算法(IBCFPA)的特征選擇
3.6 實(shí)驗(yàn)分析
3.6.1 不同算法的性能比較
3.6.2 不同分類器的驗(yàn)證
3.7 本章小結(jié)
4 基于改進(jìn)珊瑚礁算法的疾病特征選擇研究
4.1 引言
4.2 珊瑚礁優(yōu)化算法(CRO)
4.3 模擬退火算法(SA)
4.4 基于珊瑚礁優(yōu)化算法結(jié)合模擬退火(BCROSAT)的特征選擇
4.4.1 初始化編碼
4.4.2 錦標(biāo)賽選擇策略(TS)
4.4.3 BCROSAT的實(shí)現(xiàn)步驟
4.5 實(shí)驗(yàn)分析
4.5.1 實(shí)驗(yàn)設(shè)置
4.5.2 算法性能比較
4.5.3 分類器驗(yàn)證
4.6 本章小結(jié)
5 基于增強(qiáng)的WRAPPER模式的疾病特征選擇研究
5.1 引言
5.2 卡方檢測(cè)算法
5.3 基于卡方檢驗(yàn)和WRAPPER算法的特征選擇
5.4 實(shí)驗(yàn)結(jié)果分析
5.4.1 不同混合模式算法的性能比較
5.4.2 比較基于混合模式和Wrapper的特征選擇性能
5.5 本章小結(jié)
6 總結(jié)與展望
6.1 本文總結(jié)
6.2 本文展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間科研成果
本文編號(hào):3841493
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/3841493.html
最近更新
教材專著