基于智能算法的高維生物醫(yī)學(xué)數(shù)據(jù)集的特征選擇策略研究
發(fā)布時間:2023-08-11 17:56
隨著基因芯片技術(shù)在醫(yī)學(xué)領(lǐng)域被廣泛應(yīng)用,大量微陣列數(shù)據(jù)被迅速積累,通過對這些數(shù)據(jù)進行分析并構(gòu)建有效的分類模型,對一些潛在病患的早期診斷和臨床治療具有重要的研究意義和應(yīng)用價值。然而,基因微陣列數(shù)據(jù)具有“高維小樣本”的特點,如結(jié)腸微陣列數(shù)據(jù)集包含了兩千多個基因特征。面對如此大規(guī)模的微陣列數(shù)據(jù)集,專家在短時間內(nèi)不能直接進行分析和診斷治療。此外,大多基因數(shù)據(jù)通常含有一些冗余或噪聲數(shù)據(jù),可能會導(dǎo)致疾病診斷算法的建模和訓(xùn)練時間過長時的過度擬合而誤導(dǎo),從而導(dǎo)致錯誤的醫(yī)療診斷。作為一種有效的降維方式,特征選擇在生物醫(yī)學(xué)領(lǐng)域已經(jīng)引起廣泛的關(guān)注并成為近年來生物信息學(xué)領(lǐng)域的研究熱點。特征選擇技術(shù)是對微陣列基因數(shù)據(jù)進行適當(dāng)分析和分類的關(guān)鍵步驟,如果沒有合適的特征選擇方法,現(xiàn)有的模型很難準(zhǔn)確捕獲重要信息。本質(zhì)上,特征選擇問題可以被視為一個雙目標(biāo)優(yōu)化問題,即在保持或提高預(yù)測精度的同時優(yōu)化特征子集。目前已經(jīng)存在一些針對微陣列生物醫(yī)學(xué)數(shù)據(jù)的特征選擇方法。其中,基于Wrapper的特征選擇方法在搜索過程中旨在獲得較高的分類精度而吸引了越來越多研究學(xué)者的注意。搜索策略是Wrapper方法中最重要的步驟,基于種群機制的元啟發(fā)...
【文章頁數(shù)】:84 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文主要研究工作
1.4 章節(jié)安排
2 相關(guān)理論知識
2.1 特征選擇
2.1.1 特征選擇的搜索策略
2.1.2 特征選擇的評估標(biāo)準(zhǔn)
2.2 分類算法概述
2.2.1 KNN分類器
2.2.2 SVM分類器
2.2.3 NB分類器
2.2.4 ELM分類器
2.3 公開數(shù)據(jù)集描述
2.4 基于智能算法的特征選擇流程
2.5 本章小結(jié)
3 基于改進克隆花授粉算法的疾病特征選擇研究
3.1 引言
3.2 克隆花授粉算法(CFPA)
3.3 二進制編碼
3.4 改進策略的設(shè)計
3.4.1 絕對平衡分組策略(ABGS)
3.4.2 自適應(yīng)高斯突變
3.5 基于改進的克隆花授粉算法(IBCFPA)的特征選擇
3.6 實驗分析
3.6.1 不同算法的性能比較
3.6.2 不同分類器的驗證
3.7 本章小結(jié)
4 基于改進珊瑚礁算法的疾病特征選擇研究
4.1 引言
4.2 珊瑚礁優(yōu)化算法(CRO)
4.3 模擬退火算法(SA)
4.4 基于珊瑚礁優(yōu)化算法結(jié)合模擬退火(BCROSAT)的特征選擇
4.4.1 初始化編碼
4.4.2 錦標(biāo)賽選擇策略(TS)
4.4.3 BCROSAT的實現(xiàn)步驟
4.5 實驗分析
4.5.1 實驗設(shè)置
4.5.2 算法性能比較
4.5.3 分類器驗證
4.6 本章小結(jié)
5 基于增強的WRAPPER模式的疾病特征選擇研究
5.1 引言
5.2 卡方檢測算法
5.3 基于卡方檢驗和WRAPPER算法的特征選擇
5.4 實驗結(jié)果分析
5.4.1 不同混合模式算法的性能比較
5.4.2 比較基于混合模式和Wrapper的特征選擇性能
5.5 本章小結(jié)
6 總結(jié)與展望
6.1 本文總結(jié)
6.2 本文展望
參考文獻
致謝
攻讀學(xué)位期間科研成果
本文編號:3841493
【文章頁數(shù)】:84 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
1 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文主要研究工作
1.4 章節(jié)安排
2 相關(guān)理論知識
2.1 特征選擇
2.1.1 特征選擇的搜索策略
2.1.2 特征選擇的評估標(biāo)準(zhǔn)
2.2 分類算法概述
2.2.1 KNN分類器
2.2.2 SVM分類器
2.2.3 NB分類器
2.2.4 ELM分類器
2.3 公開數(shù)據(jù)集描述
2.4 基于智能算法的特征選擇流程
2.5 本章小結(jié)
3 基于改進克隆花授粉算法的疾病特征選擇研究
3.1 引言
3.2 克隆花授粉算法(CFPA)
3.3 二進制編碼
3.4 改進策略的設(shè)計
3.4.1 絕對平衡分組策略(ABGS)
3.4.2 自適應(yīng)高斯突變
3.5 基于改進的克隆花授粉算法(IBCFPA)的特征選擇
3.6 實驗分析
3.6.1 不同算法的性能比較
3.6.2 不同分類器的驗證
3.7 本章小結(jié)
4 基于改進珊瑚礁算法的疾病特征選擇研究
4.1 引言
4.2 珊瑚礁優(yōu)化算法(CRO)
4.3 模擬退火算法(SA)
4.4 基于珊瑚礁優(yōu)化算法結(jié)合模擬退火(BCROSAT)的特征選擇
4.4.1 初始化編碼
4.4.2 錦標(biāo)賽選擇策略(TS)
4.4.3 BCROSAT的實現(xiàn)步驟
4.5 實驗分析
4.5.1 實驗設(shè)置
4.5.2 算法性能比較
4.5.3 分類器驗證
4.6 本章小結(jié)
5 基于增強的WRAPPER模式的疾病特征選擇研究
5.1 引言
5.2 卡方檢測算法
5.3 基于卡方檢驗和WRAPPER算法的特征選擇
5.4 實驗結(jié)果分析
5.4.1 不同混合模式算法的性能比較
5.4.2 比較基于混合模式和Wrapper的特征選擇性能
5.5 本章小結(jié)
6 總結(jié)與展望
6.1 本文總結(jié)
6.2 本文展望
參考文獻
致謝
攻讀學(xué)位期間科研成果
本文編號:3841493
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/3841493.html
最近更新
教材專著