測(cè)試代價(jià)敏感粗糙集中屬性約簡(jiǎn)算法的研究
本文關(guān)鍵詞:測(cè)試代價(jià)敏感粗糙集中屬性約簡(jiǎn)算法的研究 出處:《廣西師范大學(xué)》2016年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 粗糙集 代價(jià)敏感學(xué)習(xí) 屬性約簡(jiǎn) 不完備決策表 測(cè)試代價(jià)敏感
【摘要】:粗糙集是一種刻畫不完整和不確定性問題的數(shù)學(xué)工具,其不需要任何先驗(yàn)知識(shí)對(duì)數(shù)據(jù)進(jìn)行分析和處理。面對(duì)如今高速的信息時(shí)代中海量數(shù)據(jù)的形成,粗糙集在分析處理數(shù)據(jù)中發(fā)揮了重要的作用。屬性約簡(jiǎn)作為粗糙集理論研究的重要內(nèi)容之一,其核心思想就是保證知識(shí)庫的分類能力不變的前提下,刪除冗余、錯(cuò)誤或者不需要的知識(shí)。而代價(jià)敏感學(xué)習(xí)是目前機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等領(lǐng)域研究熱點(diǎn)之一,代價(jià)包括測(cè)試代價(jià)、誤分類代價(jià)、計(jì)算代價(jià)和獲取樣本的代價(jià)等,其目的是以最小代價(jià)為目標(biāo)建立分類器。將代價(jià)敏感學(xué)習(xí)引入粗糙集理論中的屬性約簡(jiǎn)問題值得深入研究,目前將誤分類代價(jià)引入粗糙集理論中的相關(guān)研究取得了不錯(cuò)的研究的成果,而測(cè)試代價(jià)敏感粗糙集理論的相關(guān)研究近幾年才開始發(fā)展。本文主要研究測(cè)試代價(jià)敏感粗糙集中屬性約簡(jiǎn)問題,分別以完備決策表和不完備決策表作為研究對(duì)象,主要的研究工作有以下幾個(gè)方面。(1)為了解決測(cè)試代價(jià)敏感屬性約簡(jiǎn)的高效性和準(zhǔn)確性問題,提出一種基于免疫量子粒子群優(yōu)化的最小測(cè)試代價(jià)屬性約簡(jiǎn)算法。依據(jù)條件信息熵和測(cè)試代價(jià)因素定義適當(dāng)?shù)倪m應(yīng)值函數(shù),將最小測(cè)試代價(jià)屬性約簡(jiǎn)問題轉(zhuǎn)化為0-1組合優(yōu)化問題,提出最小屬性的屬性約簡(jiǎn)問題是一種具有特殊測(cè)試代價(jià)的最小測(cè)試代價(jià)屬性約簡(jiǎn)問題。最后結(jié)合量子粒子群和人工免疫方法給出約簡(jiǎn)算法,實(shí)驗(yàn)分別對(duì)比已有的最小屬性約簡(jiǎn)算法和測(cè)試代價(jià)敏感屬性約簡(jiǎn)算法,實(shí)驗(yàn)結(jié)果表明該算法是有效可行的。(2)在不完備決策表中,給出高效的計(jì)算容差類算法。提出不一致對(duì)象概念,研究不一致對(duì)象的性質(zhì),根據(jù)其性質(zhì)給出在不一致對(duì)象下的核屬性和屬性約簡(jiǎn)的定義并設(shè)計(jì)求核屬性算法。提出一個(gè)新的屬性重要性定義,最后依據(jù)新的屬性重要性定義設(shè)計(jì)一個(gè)最壞情況下時(shí)間復(fù)雜度和空間復(fù)雜度分別為O(k|C|2|U|)和O(|U|)的啟發(fā)式屬性約簡(jiǎn)算法,其中k為條件屬性中缺省對(duì)象所產(chǎn)生的容差類最大的個(gè)數(shù)。算法過程只需逐步要求容差類的基數(shù),大大減少了算法的計(jì)算過程。最后通過理論分析、實(shí)例分析和實(shí)驗(yàn)分析說明該算法是高效和可行性的屬性約簡(jiǎn)算法,并且該算法同時(shí)適用于不一致不完備決策表和一致不完備決策表,給不完備決策表屬性約簡(jiǎn)算法提供了新的方法。(3)提出不完備決策表測(cè)試代價(jià)敏感屬性約簡(jiǎn)問題,給出不一致對(duì)象集定義以及求解不一致對(duì)象集的算法。根據(jù)不一致對(duì)象的性質(zhì)改進(jìn)屬性重要性定義,考慮測(cè)試代價(jià)因素以及不一致對(duì)象個(gè)數(shù)的改變量給出一個(gè)新的屬性重要性的定義和屬性重要性中權(quán)重的設(shè)置方法,并給出屬性重要性的計(jì)算算法。在此基礎(chǔ)上,給出一個(gè)時(shí)間復(fù)雜度O(k|C|2|U|)和空間復(fù)雜度為O(|U|)啟發(fā)式屬性約簡(jiǎn)算法,其中k為條件屬性中缺省對(duì)象所產(chǎn)生的容差類最大的個(gè)數(shù),并通過理論分析、實(shí)例分析和實(shí)驗(yàn)分析說明該算法準(zhǔn)確性和可行性。
[Abstract]:Rough set is a characterization of incomplete and uncertain problems of the mathematical tools, does not require any prior knowledge to analyze and process the data in the information age. The formation of massive data high speed today, played an important role in the data analysis of attribute reduction in rough set. As one of the important content of theoretical research rough set, its core idea is the guarantee to delete the redundant unchanged classification capacity of the knowledge base under the wrong, or do not need knowledge. And cost sensitive learning is one of the machine learning, data mining and other research hot areas, including the cost of the test cost, misclassification cost, computation cost and obtain the sample cost. Its purpose is to establish minimum cost as target classifier. Cost sensitive learning into the attribute reduction problem in the theory of rough set is worthy of further study, the misclassification cost The introduction of rough set theory in related research has achieved good results, and the test cost sensitive rough set theory research in recent years began to develop. This paper mainly studies the test cost sensitive rough set attribute reduction problem, respectively, to complete decision table and incomplete decision table as the research object, the main research work there are the following aspects. (1) in order to solve the problem of high efficiency and accuracy of the test cost sensitive attribute reduction, this paper proposes a minimal test cost immune algorithm of attribute reduction based on quantum particle swarm optimization. Based on the conditional information entropy and test cost factors defining appropriate fitness function, the minimum test cost attribute reduction into 0-1 a combinatorial optimization problem, the minimum attribute reduction attribute is a kind of special test cost minimum test cost. Finally, node attribute reduction problem Quantum particle swarm optimization and artificial immune method reduction algorithm, minimum attribute reduction algorithm and test cost sensitive attribute reduction algorithm were compared with existing experiments, experimental results show that this algorithm is effective and feasible. (2) in incomplete decision table, calculating the tolerance class algorithm is given. The inconsistent objects, concepts, research inconsistent with the nature of the object, according to its nature are defined in the inconsistent objects under the core attributes and attribute reduction and design for core attribute algorithm. Proposed a new definition of attribute importance, according to a new attribute to the definition of design a worst-case time complexity and space complexity respectively. O (k|C|2|U|) and O (|U|) heuristic attribute reduction algorithm, which produced by K as the default object condition attribute in the largest number of tolerance class. The algorithm only needs gradually tolerance class base, Greatly reduce the process of the algorithm. Finally, through theoretical analysis, case analysis and experimental analysis shows that this algorithm is feasible and efficient attribute reduction algorithm, and the algorithm is also applicable to inconsistent incomplete decision table and consistent incomplete decision table, for incomplete decision table attribute reduction algorithm provides a new method. (3) the incomplete decision table test cost sensitive attribute reduction problem, given inconsistent object set definition and solving inconsistent object set algorithm. According to the nature of inconsistent objects improved attribute importance is defined, considering the test cost and the method to set weight change given inconsistent object number of a new attribute the definition and importance of attribute importance in the calculation, and algorithm is given to the importance of attributes. On this basis, give a time complexity of O (k|C|2|U|) and the space complexity is O (|U|) heuristic attribute reduction algorithm, where k is the largest number of tolerance classes generated by default objects in conditional attributes. Theoretical analysis, case analysis and experimental analysis show that the algorithm is accurate and feasible.
【學(xué)位授予單位】:廣西師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP18
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張巖;;針對(duì)不完備系統(tǒng)的粗糙熵屬性約簡(jiǎn)算法的改進(jìn)[J];莆田學(xué)院學(xué)報(bào);2006年05期
2 吳子特;葉東毅;;一種可伸縮的快速屬性約簡(jiǎn)算法[J];模式識(shí)別與人工智能;2009年02期
3 薛勝軍;郭強(qiáng);;一種改進(jìn)的最小屬性約簡(jiǎn)算法[J];武漢理工大學(xué)學(xué)報(bào)(交通科學(xué)與工程版);2012年03期
4 陳鑫影;黃明;李瑞;;基于評(píng)價(jià)指數(shù)的屬性約簡(jiǎn)算法[J];大連鐵道學(xué)院學(xué)報(bào);2006年02期
5 劉敏;段富;劉超慧;;基于最小集合覆蓋的屬性約簡(jiǎn)算法[J];電腦開發(fā)與應(yīng)用;2008年08期
6 秦海鷗;湯克明;;一種保持最小廣義漢明距的屬性約簡(jiǎn)算法[J];武漢理工大學(xué)學(xué)報(bào);2009年18期
7 趙潔;肖南峰;;一種基于知識(shí)顆粒的高效完備屬性約簡(jiǎn)算法[J];中南大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年06期
8 李秀紅;史開泉;;一種基于知識(shí)粒度的屬性約簡(jiǎn)算法[J];計(jì)算機(jī)應(yīng)用;2006年S1期
9 徐章艷;楊炳儒;宋威;;基于區(qū)分對(duì)象對(duì)集的高效屬性約簡(jiǎn)算法[J];模式識(shí)別與人工智能;2006年05期
10 龔安;牛秋麗;趙小川;周兆華;;基于屬性加權(quán)頻率算子的屬性約簡(jiǎn)算法[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年04期
相關(guān)會(huì)議論文 前9條
1 李菊;劉曉平;;基于改進(jìn)的差異比較表的屬性約簡(jiǎn)算法[A];全國第22屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2011)暨全國第3屆安全關(guān)鍵技術(shù)與應(yīng)用(SCA·2011)學(xué)術(shù)會(huì)議論文摘要集[C];2011年
2 李菊;王軍;王興;;基于改進(jìn)的二進(jìn)制辨識(shí)矩陣的屬性約簡(jiǎn)算法[A];全國第20屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2009)暨全國第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2009年
3 楊思春;王建穎;陳家駿;;一種新的概念格屬性約簡(jiǎn)算法[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
4 武志峰;吉根林;;一種基于決策矩陣的屬性約簡(jiǎn)算法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
5 蔡智;岳麗華;王熙法;;一種數(shù)據(jù)屬性約簡(jiǎn)算法研究[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2000年
6 周創(chuàng)德;田衛(wèi)東;周紅鵑;錢宏亮;;基于閾值約束的粗糙集屬性約簡(jiǎn)算法[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
7 楊善林;劉業(yè)政;馬溪駿;;基于β-δ_0粗糙集模型的屬性約簡(jiǎn)算法[A];2003年中國管理科學(xué)學(xué)術(shù)會(huì)議論文集[C];2003年
8 張錚;喻道遠(yuǎn);;一種啟發(fā)式屬性約簡(jiǎn)算法及其擴(kuò)展應(yīng)用[A];2007'儀表,,自動(dòng)化及先進(jìn)集成技術(shù)大會(huì)論文集(一)[C];2007年
9 張錚;蘇旭武;張道德;陳學(xué)鋒;;裝載機(jī)故障診斷屬性約簡(jiǎn)算法[A];湖北省機(jī)械工程學(xué)會(huì)青年分會(huì)2006年年會(huì)暨第2屆機(jī)械學(xué)院院長(zhǎng)(系主任)會(huì)議論文集(下)[C];2006年
相關(guān)博士學(xué)位論文 前2條
1 殷志偉;基于統(tǒng)計(jì)學(xué)習(xí)理論的分類方法研究[D];哈爾濱工程大學(xué);2009年
2 魏巍;粗糙數(shù)據(jù)分析模型與算法研究[D];山西大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 李萍;基于三支決策的海量數(shù)據(jù)分類方法研究及其在視頻異常檢測(cè)中的應(yīng)用[D];南京大學(xué);2016年
2 謝小軍;測(cè)試代價(jià)敏感粗糙集中屬性約簡(jiǎn)算法的研究[D];廣西師范大學(xué);2016年
3 張海云;信息系統(tǒng)中屬性約簡(jiǎn)算法研究[D];山西大學(xué);2007年
4 許燁;模糊粗糙集屬性約簡(jiǎn)算法在電力營銷分析中的研究[D];華北電力大學(xué);2013年
5 姜玉蘋;粗糙集屬性約簡(jiǎn)算法設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2011年
6 黃麗宇;基于壓縮樹技術(shù)的屬性約簡(jiǎn)算法研究[D];廣西師范大學(xué);2010年
7 梁蒙;基于粗糙集的屬性約簡(jiǎn)算法研究[D];河南大學(xué);2011年
8 喬子芮;基于粒計(jì)算的屬性約簡(jiǎn)算法及應(yīng)用研究[D];陜西師范大學(xué);2011年
9 姜麗言;屬性約簡(jiǎn)算法在田徑傷病預(yù)警中的應(yīng)用研究[D];山東體育學(xué)院;2012年
10 曾強(qiáng)生;概念格屬性約簡(jiǎn)算法研究[D];西安電子科技大學(xué);2011年
本文編號(hào):1384798
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1384798.html