基于RRF的信息數(shù)據(jù)集的特征選擇
本文關(guān)鍵詞:基于RRF的信息數(shù)據(jù)集的特征選擇,由筆耕文化傳播整理發(fā)布。
【摘要】:信息數(shù)據(jù)集中存在的冗余、不相關(guān)甚至是噪音特征會嚴重影響管理決策的質(zhì)量和效率。整合RS理論和ReliefF算法,提出一種"二次過濾"的RRF組合決策方法。首先采用ReliefF算法計算出各個特征權(quán)重,過濾掉噪音特征;之后再用啟發(fā)式的RS方法對原有特征集進行特征約簡,過濾掉冗余特征。RRF組合決策方法集合了兩個算法的優(yōu)點,能夠有效減少計算的工作量和復雜度,避免RS約簡過多以及約簡中存在噪音特征等問題,從而起到提高決策質(zhì)量和效率的作用。最后,用一個真實的醫(yī)療信息數(shù)據(jù)集對算法進行測試,并與兩個常見的特征選擇算法進行對比,證明本算法在輔助臨床決策中的作用。
【作者單位】: 同濟大學經(jīng)濟與管理學院;
【關(guān)鍵詞】: 信息數(shù)據(jù)集 決策 特征選擇 ReliefF RS
【基金】:國家自然科學基金重點項目“面向全生命周期的醫(yī)療質(zhì)量安全管理與資源優(yōu)化配置”(71432007)
【分類號】:C934
【正文快照】: 1問題的提出隨著信息技術(shù)的迅猛發(fā)展以及知識經(jīng)濟的到來,人類每天面臨的知識量越來越多、知識復雜度越來越高。對于一些大的信息數(shù)據(jù)集來說,描述對象的特征數(shù)量眾多,但是同時也存在著以下一些問題:最初的數(shù)據(jù)集中往往存在著與分類不相關(guān)的特征、冗余特征,甚至是噪音特征;眾多
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉祖斌;;政府數(shù)據(jù)門戶網(wǎng)站及其數(shù)據(jù)集的建設(shè)研究[J];信息化建設(shè);2011年04期
2 李作春;周秀梅;覃澤;;異質(zhì)數(shù)據(jù)集關(guān)聯(lián)規(guī)則挖掘[J];科技創(chuàng)新導報;2009年28期
3 汪莉萍;;基于壓縮數(shù)據(jù)集的挖掘算法研究[J];科技創(chuàng)新導報;2009年14期
4 路艷明,郝素萍;Delphi的數(shù)據(jù)集過濾在票據(jù)管理中的應用[J];中國會計電算化;2002年09期
5 崔園;張軍鵬;馮煥婷;;數(shù)據(jù)挖掘技術(shù)在人壽保險數(shù)據(jù)庫中的應用[J];成都醫(yī)學院學報;2006年02期
6 鄭開杰;;無序數(shù)據(jù)集的向量化編碼[J];價值工程;2010年33期
7 皮興進;;ADO.NET中的數(shù)據(jù)集應用研究[J];大眾商務;2009年10期
8 謝笑盈;;基于半靜態(tài)分層抽樣的模糊聚類分析方法的改進[J];統(tǒng)計與決策;2010年11期
9 劉亢 ,黃豁;我國研制出“數(shù)字化可視人”[J];中國高校科技與產(chǎn)業(yè)化;2002年11期
10 蔡龍飛;;基于XML數(shù)據(jù)集訪問WEB服務的研究[J];科技創(chuàng)新導報;2008年01期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 田捷;;三維醫(yī)學影像數(shù)據(jù)集處理的集成化平臺[A];2003年全國醫(yī)學影像技術(shù)學術(shù)會議論文匯編[C];2003年
2 范明;魏芳;;挖掘基本顯露模式用于分類[A];第二十一屆中國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2004年
3 冷傳良;;飛機化銑成樣板劃線數(shù)據(jù)集設(shè)計方法探索[A];第十屆沈陽科學學術(shù)年會論文集(信息科學與工程技術(shù)分冊)[C];2013年
4 孟燁;張鵬;宋大為;王雷;;信息檢索系統(tǒng)性能對數(shù)據(jù)集特性的依賴性分析[A];第十二屆全國人機語音通訊學術(shù)會議(NCMMSC'2013)論文集[C];2013年
5 段磊;唐常杰;左R,
本文編號:447940
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/447940.html