基于粗糙集的高維數(shù)據(jù)高效屬性約簡(jiǎn)研究與應(yīng)用
發(fā)布時(shí)間:2022-07-10 14:38
信息爆炸時(shí)代,數(shù)據(jù)挖掘過程中常常會(huì)因?yàn)樘幚泶笠?guī)模數(shù)據(jù)而遇到一系列挑戰(zhàn)。而數(shù)據(jù)量大的原因不外乎樣本基數(shù)大或者數(shù)據(jù)的屬性維數(shù)過高兩個(gè)原因,樣本是非常寶貴的數(shù)據(jù)資源,不能輕易丟棄,所以人們往往在不嚴(yán)重影響挖掘結(jié)果的前提下,會(huì)考慮對(duì)屬性進(jìn)行選擇與降維,這也是數(shù)據(jù)挖掘前必要的數(shù)據(jù)預(yù)處理步驟。基于粗糙集的屬性約簡(jiǎn)是一種常用的降維手段,它能高效利用數(shù)據(jù)自身信息來降維,降維過程不需要人的經(jīng)驗(yàn)知識(shí),如不用設(shè)定閾值,而閾值的設(shè)定往往因人而異,這會(huì)導(dǎo)致數(shù)據(jù)挖掘的結(jié)果大相徑庭。針對(duì)大多現(xiàn)有的約簡(jiǎn)算法在面對(duì)高維數(shù)據(jù)時(shí)存在計(jì)算復(fù)雜度高的問題,本文充分研究了高維數(shù)據(jù)的特點(diǎn),從改進(jìn)計(jì)算方法和約簡(jiǎn)流程兩個(gè)方面展開研究。具體研究?jī)?nèi)容包括:1.針對(duì)基于正域的約簡(jiǎn)算法,分別從提高正域計(jì)算速度與改變約簡(jiǎn)流程兩個(gè)角度對(duì)現(xiàn)有算法進(jìn)行了優(yōu)化。首先利用多進(jìn)程技術(shù),提出一種并行計(jì)算正域的方案,加快對(duì)每個(gè)屬性可約性的判斷。其次根據(jù)二分搜索思想,提出了一種二分約簡(jiǎn)算法,該算法可以先快速得到一個(gè)近似約簡(jiǎn),然后結(jié)合已有的算法可以得到最終的約簡(jiǎn)結(jié)果。最后將粒計(jì)算思想引入到對(duì)約簡(jiǎn)流程的修改中,給出了多粒度屬性樹的定義,基于多粒度屬性樹設(shè)計(jì)了前序遍歷...
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
基于哈希表的快速正區(qū)域并行化計(jì)算流程
并行化前后正域計(jì)算時(shí)間對(duì)比
融合占用總共計(jì)算時(shí)間百分比
【參考文獻(xiàn)】:
期刊論文
[1]加權(quán)模糊粗糙約簡(jiǎn)[J]. 范星奇,李雪峰,趙素云,陳紅,李翠平. 計(jì)算機(jī)科學(xué). 2018(01)
[2]基于人工智能的知識(shí)服務(wù)研究[J]. 唐曉波,李新星. 圖書館學(xué)研究. 2017(13)
[3]并行機(jī)器學(xué)習(xí)算法基礎(chǔ)體系前沿進(jìn)展綜述[J]. 劉斌,何進(jìn)榮,耿耀君,王最. 計(jì)算機(jī)工程與應(yīng)用. 2017(11)
[4]高維數(shù)據(jù)變量選擇方法綜述[J]. 曾津,周建軍. 數(shù)理統(tǒng)計(jì)與管理. 2017(04)
[5]一種基于概率粗糙集的屬性約簡(jiǎn)加速算法[J]. 劉芳,李天瑞. 計(jì)算機(jī)科學(xué). 2016(12)
[6]一種新的決策粗糙集啟發(fā)式屬性約簡(jiǎn)算法[J]. 常紅巖,蒙祖強(qiáng). 計(jì)算機(jī)科學(xué). 2016(06)
[7]統(tǒng)計(jì)粗糙集[J]. 陳俞,趙素云,陳紅,李翠平,孫輝. 軟件學(xué)報(bào). 2016(07)
[8]粗糙集屬性約簡(jiǎn)算法綜述[J]. 唐衛(wèi)國(guó),張濤,羅奕,徐晉勇. 大眾科技. 2015(11)
[9]粗糙集屬性約簡(jiǎn)在文本分類中的性能研究[J]. 趙靖,皮建勇. 微型機(jī)與應(yīng)用. 2015(21)
[10]一種基于粗糙集理論的快速并行屬性約簡(jiǎn)算法[J]. 肖大偉,王國(guó)胤,胡峰. 計(jì)算機(jī)科學(xué). 2009(03)
博士論文
[1]粗糙集理論中的知識(shí)獲取與約簡(jiǎn)方法的研究[D]. 張明.南京理工大學(xué) 2012
[2]流形學(xué)習(xí)理論與方法及其應(yīng)用研究[D]. 詹宇斌.國(guó)防科學(xué)技術(shù)大學(xué) 2011
[3]基于粗糙集的不完備信息系統(tǒng)知識(shí)獲取理論與方法[D]. 黃兵.南京理工大學(xué) 2004
碩士論文
[1]深度學(xué)習(xí)中的自編碼器的表達(dá)能力研究[D]. 王雅思.哈爾濱工業(yè)大學(xué) 2014
本文編號(hào):3657869
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
基于哈希表的快速正區(qū)域并行化計(jì)算流程
并行化前后正域計(jì)算時(shí)間對(duì)比
融合占用總共計(jì)算時(shí)間百分比
【參考文獻(xiàn)】:
期刊論文
[1]加權(quán)模糊粗糙約簡(jiǎn)[J]. 范星奇,李雪峰,趙素云,陳紅,李翠平. 計(jì)算機(jī)科學(xué). 2018(01)
[2]基于人工智能的知識(shí)服務(wù)研究[J]. 唐曉波,李新星. 圖書館學(xué)研究. 2017(13)
[3]并行機(jī)器學(xué)習(xí)算法基礎(chǔ)體系前沿進(jìn)展綜述[J]. 劉斌,何進(jìn)榮,耿耀君,王最. 計(jì)算機(jī)工程與應(yīng)用. 2017(11)
[4]高維數(shù)據(jù)變量選擇方法綜述[J]. 曾津,周建軍. 數(shù)理統(tǒng)計(jì)與管理. 2017(04)
[5]一種基于概率粗糙集的屬性約簡(jiǎn)加速算法[J]. 劉芳,李天瑞. 計(jì)算機(jī)科學(xué). 2016(12)
[6]一種新的決策粗糙集啟發(fā)式屬性約簡(jiǎn)算法[J]. 常紅巖,蒙祖強(qiáng). 計(jì)算機(jī)科學(xué). 2016(06)
[7]統(tǒng)計(jì)粗糙集[J]. 陳俞,趙素云,陳紅,李翠平,孫輝. 軟件學(xué)報(bào). 2016(07)
[8]粗糙集屬性約簡(jiǎn)算法綜述[J]. 唐衛(wèi)國(guó),張濤,羅奕,徐晉勇. 大眾科技. 2015(11)
[9]粗糙集屬性約簡(jiǎn)在文本分類中的性能研究[J]. 趙靖,皮建勇. 微型機(jī)與應(yīng)用. 2015(21)
[10]一種基于粗糙集理論的快速并行屬性約簡(jiǎn)算法[J]. 肖大偉,王國(guó)胤,胡峰. 計(jì)算機(jī)科學(xué). 2009(03)
博士論文
[1]粗糙集理論中的知識(shí)獲取與約簡(jiǎn)方法的研究[D]. 張明.南京理工大學(xué) 2012
[2]流形學(xué)習(xí)理論與方法及其應(yīng)用研究[D]. 詹宇斌.國(guó)防科學(xué)技術(shù)大學(xué) 2011
[3]基于粗糙集的不完備信息系統(tǒng)知識(shí)獲取理論與方法[D]. 黃兵.南京理工大學(xué) 2004
碩士論文
[1]深度學(xué)習(xí)中的自編碼器的表達(dá)能力研究[D]. 王雅思.哈爾濱工業(yè)大學(xué) 2014
本文編號(hào):3657869
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3657869.html
最近更新
教材專著