不確定性信息處理的優(yōu)勢關(guān)系粗糙集方法研究
本文關(guān)鍵詞:不確定性信息處理的優(yōu)勢關(guān)系粗糙集方法研究
更多相關(guān)文章: 數(shù)據(jù)挖掘 粗糙集 優(yōu)勢關(guān)系 不確定性 變精度模型 自主式學(xué)習(xí) 客戶價值計價
【摘要】:由于客觀世界本身所具有的復(fù)雜性、不穩(wěn)定性和人們對其認識存在不完全性,在數(shù)據(jù)采集、錄入、表述、編輯、處理、分析等過程中存在著各種誤差.此外,在概念的定性與定量轉(zhuǎn)換過程中會導(dǎo)致隨機、模糊、未確知等不確定性數(shù)據(jù)產(chǎn)生,這些現(xiàn)象普遍存在于金融、軍事、經(jīng)濟、商業(yè)、工業(yè)控制、電信等諸多實際領(lǐng)域.數(shù)據(jù)的不確定性往往會使得數(shù)據(jù)挖掘的結(jié)果不可靠,甚至出現(xiàn)錯誤的結(jié)果.因此,對不確定性數(shù)據(jù)處理的理論和應(yīng)用研究受到了越來越廣泛的重視,并已成為智能信息處理的重要研究內(nèi)容.粗糙集理論具有以確定的方法處理具有不一致、不精確和不完備等不確定性信息的能力,近年來已成為備受關(guān)注的新型智能信息處理方法.為了處理具有連續(xù)屬性和優(yōu)勢關(guān)系的信息系統(tǒng),Salvatore Greco和Roman Slowinski等學(xué)者提出了優(yōu)勢關(guān)系粗糙集理論.優(yōu)勢關(guān)系粗糙集理論以優(yōu)勢關(guān)系代替了經(jīng)典粗糙集的不可分辨關(guān)系,更好地滿足了描述實際問題中某些屬性具有偏序關(guān)系和連續(xù)屬性的需要.由于優(yōu)勢關(guān)系粗糙集可以有效處理等價關(guān)系和具有偏序關(guān)系的決策信息系統(tǒng),現(xiàn)已成為經(jīng)典粗糙集的一個很重要的擴展理論模型.它在投資風(fēng)險評估、客戶關(guān)系管理、地震震級評價、軍事目標(biāo)威脅評估、動車舒適度評價等方面己得到了成功應(yīng)用.目前,優(yōu)勢關(guān)系粗糙集對不確定性信息的處理主要采用變精度模型,科學(xué)合理的變精度模型和變精度閾值的獲取是其關(guān)鍵,且對其他不確定性信息處理方法的研究和在實際領(lǐng)域的應(yīng)用研究也顯得非常急迫.本文采用優(yōu)勢關(guān)系粗糙集研究不確定性信息處理問題,從變精度模型、不一致信息系統(tǒng)的一致化轉(zhuǎn)換方法、數(shù)據(jù)驅(qū)動的自主式學(xué)習(xí)等角度進行理論研究,并將理論研究成果應(yīng)用于解決電信客戶價值評價等實際問題.歸納起來,本文的主要內(nèi)容和創(chuàng)新性研究成果包括以下幾個方面:(1)提出了一種基于包含度和支持度的變精度優(yōu)勢關(guān)系粗糙集模型,克服了已有模型的不足,對信息系統(tǒng)中的原始信息利用更加充分.通過對現(xiàn)有變精度優(yōu)勢關(guān)系粗糙集的兩個主要模型VC-DRSA和VP-DRSA的分析,發(fā)現(xiàn)由于決策信息系統(tǒng)中不一致對象的存在.VC-DRSA模型在計算對象是否進入下近似時會出現(xiàn)矛盾的結(jié)果.而對于VP-DRSA模型,上并集或下并集邊緣上的對象很難進入下近似,從而影響了對信息的充分利用.在分析了以上兩種變精度模型對不一致信息處理不足的基礎(chǔ)上,提出了一種基于包含度和支持度的變精度優(yōu)勢關(guān)系粗糙集模型,分析了該模型所具有的數(shù)學(xué)性質(zhì),并證明了用該模型所得到的下近似是VC-DRSA和VP-DRSA下近似的并集,上近似是這兩種模型上近似的交集.這使得包含在下近似的對象更多和包含在上近似的對象變少,不確定性區(qū)域減小,近似分類質(zhì)量得到提高.從而在一定程度上降低了信息系統(tǒng)在處理過程中的不確定性.學(xué)生綜合評價的實例分析表明該模型能更加充分地利用信息系統(tǒng)所提供的有用信息.并通過在UCI等數(shù)據(jù)集上的實驗驗證了該模型有助于分類性能的提高.(第2章)(2)提出了一種將優(yōu)勢關(guān)系下的不一致信息系統(tǒng)進行一致化轉(zhuǎn)換的算法,實現(xiàn)了一種處理不一致信息系統(tǒng)的新方法.對優(yōu)勢關(guān)系信息系統(tǒng)中對象的向下不一致性和向上不一致性進行了度量,進而提出了對象整體不一致性概念,并給出了對象整體不一致性的三種度量準則,分別表示為α、ε和μ.在此基礎(chǔ)上,提出了一種將優(yōu)勢關(guān)系下的不一致信息系統(tǒng)轉(zhuǎn)換為一致信息系統(tǒng)的算法TIPStoC.該算法根據(jù)對象整體不一致性的大小,采用迭代方法每次將最不一致對象刪除,直到信息系統(tǒng)變?yōu)橐恢?之后,在一致信息系統(tǒng)的基礎(chǔ)上提取確定的決策規(guī)則進行分類預(yù)測.這是一種處理不一致信息系統(tǒng)的新方法,與其他方法相比的突出特點是能有效地將優(yōu)勢關(guān)系信息系統(tǒng)中的不一致信息識別出來.因此,該方法也可有效地處理軍事和信息安全等領(lǐng)域中的離群值或孤立點的檢測.(第3章)(3)提出了一種數(shù)據(jù)驅(qū)動的優(yōu)勢關(guān)系粗糙集自主式學(xué)習(xí)方法,有效地避免了知識獲取過程中對先驗知識的依賴,增強了優(yōu)勢關(guān)系粗糙集對不一致信息處理的適應(yīng)性.在對優(yōu)勢關(guān)系決策信息系統(tǒng)的整體確定性、最大整體確定性、整體不確定性、最小整體不確定性特征進行度量的基礎(chǔ)上,提出了度量各決策類集的最大確定性的準則和計算算法.并以各決策類集的最大確定性作為該決策類集的變精度閾值提出了一種數(shù)據(jù)驅(qū)動的自主式學(xué)習(xí)方法SL-DRSA該方法以各決策類集的最大確定性作為該類集的變精度閾值進行規(guī)則獲取,避免了其他變精度模型對閾值選取的隨意性問題和不斷嘗試而帶來的計算復(fù)雜性問題.通過在UCI等數(shù)據(jù)集上的實驗表明,該方法可實現(xiàn)根據(jù)數(shù)據(jù)集本身特性自主地確定各決策類集的變精度閾值,且表現(xiàn)出了較好的分類效果,特別是在不一致性較高的數(shù)據(jù)集中體現(xiàn)得比較突出.(第4章)(4)提出了一種面向領(lǐng)域的數(shù)據(jù)驅(qū)動的電信客戶價值評價方法,該方法將領(lǐng)域?qū)<蚁闰炛R和數(shù)據(jù)本身所具有的特征有效地結(jié)合起來,提高了電信行業(yè)客戶關(guān)系管理的能力.首先借助領(lǐng)域?qū)<业南闰炛R分別從客戶當(dāng)前價值和潛在價值兩方面進行特征數(shù)據(jù)的提取、學(xué)習(xí)數(shù)據(jù)類別標(biāo)定,而后以各決策類集的最大確定性作為變精度閾值進行自主式學(xué)習(xí)而獲取決策規(guī)則.該方法有效地將領(lǐng)域?qū)<业南闰炛R和數(shù)據(jù)本身特征進行了有機結(jié)合.由于電信客戶數(shù)據(jù)量大且具有類別標(biāo)定的學(xué)習(xí)數(shù)據(jù)難以獲取,在訓(xùn)練數(shù)據(jù)集選擇和類別標(biāo)定過程中,采用了基于近鄰熵的主動學(xué)習(xí)方法來最大限度地減少領(lǐng)域?qū)<业墓ぷ髁亢吞岣邔τ?xùn)練數(shù)據(jù)的選擇質(zhì)量.通過在實際運營商客戶數(shù)據(jù)上的仿真實驗對比,表明了該方法的有效性.這為電信運營商針對不同類型的客戶采取不同的營銷和服務(wù)策略奠定了堅實的基礎(chǔ),也為其他實際問題的解決提供了有益的借鑒.(第5章)
【關(guān)鍵詞】:數(shù)據(jù)挖掘 粗糙集 優(yōu)勢關(guān)系 不確定性 變精度模型 自主式學(xué)習(xí) 客戶價值計價
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:TP18
【目錄】:
- 摘要7-9
- Abstract9-17
- 第1章 緒論17-40
- 1.1 數(shù)據(jù)挖掘概述17-21
- 1.1.1 數(shù)據(jù)挖掘的概念17-18
- 1.1.2 數(shù)據(jù)挖掘的過程18-19
- 1.1.3 數(shù)據(jù)挖掘的主要方法19-20
- 1.1.4 數(shù)據(jù)挖掘的應(yīng)用與發(fā)展20-21
- 1.2 不確定性信息及處理概述21-27
- 1.2.1 不確定性數(shù)據(jù)的來源22-23
- 1.2.2 不確定性數(shù)據(jù)的表現(xiàn)形式23
- 1.2.3 不確定性數(shù)據(jù)的處理理論23-27
- 1.3 粗糙集概述27-32
- 1.3.1 粗糙集的理論背景27-28
- 1.3.2 粗糙集的基本概念28-30
- 1.3.3 粗糙集的研究與發(fā)展30-32
- 1.4 優(yōu)勢關(guān)系粗糙集概述32-37
- 1.4.1 優(yōu)勢關(guān)系粗糙集的理論背景32-33
- 1.4.2 優(yōu)勢關(guān)系粗糙集的基本概念33-36
- 1.4.3 基于優(yōu)勢關(guān)系粗糙集的不確定性信息處理方法36-37
- 1.5 本文的主要研究內(nèi)容及成果37-39
- 1.6 本文的組織結(jié)構(gòu)39-40
- 第2章 基于包含度和支持度的變精度DRSA模型40-62
- 2.1 引言40-41
- 2.2 變精度粗糙集與變精度優(yōu)勢關(guān)系粗糙集41-43
- 2.2.1 變精度粗糙集41-42
- 2.2.2 變精度優(yōu)勢關(guān)系粗糙集42-43
- 2.3 現(xiàn)有變精度優(yōu)勢關(guān)系粗糙集模型43-47
- 2.3.1 VC-DRSA模型44-46
- 2.3.2 VP-DRSA模型46-47
- 2.4 基于包含度和支持度的變精度DRSA模型47-55
- 2.4.1 VC-DRSA和VP-DRSA模型分析47-49
- 2.4.2 基于包含度和支持度的變精度模型49-52
- 2.4.3 實例分析52-55
- 2.5 仿真實驗55-61
- 2.5.1 基于投票的分類方法56-57
- 2.5.2 實驗數(shù)據(jù)集選擇57
- 2.5.3 實驗過程57-58
- 2.5.4 實驗結(jié)果與分析58-61
- 2.6 本章小結(jié)61-62
- 第3章 優(yōu)勢關(guān)系信息系統(tǒng)的一致化轉(zhuǎn)換62-78
- 3.1 引言62-63
- 3.2 對象整體不一致性度量63-65
- 3.3 不一致優(yōu)勢關(guān)系信息系統(tǒng)的一致化轉(zhuǎn)換算法65-68
- 3.3.1 算法描述65-68
- 3.3.2 算法復(fù)雜度分析68
- 3.4 實例分析68-71
- 3.5 仿真實驗71-76
- 3.5.1 實驗數(shù)據(jù)集選擇72
- 3.5.2 實驗過程72-73
- 3.5.3 實驗結(jié)果與分析73-76
- 3.6 本章小結(jié)76-78
- 第4章 優(yōu)勢關(guān)系下的自主式學(xué)習(xí)方法78-94
- 4.1 引言78-79
- 4.2 數(shù)據(jù)驅(qū)動的自主式學(xué)習(xí)79-82
- 4.3 變精度優(yōu)勢關(guān)系粗糙集分類性能分析82-84
- 4.4 優(yōu)勢關(guān)系決策表與決策類集的一致性度量84-87
- 4.5 優(yōu)勢關(guān)系下的自主式學(xué)習(xí)算法87-89
- 4.6 仿真實驗89-93
- 4.6.1 實驗數(shù)據(jù)集選擇89
- 4.6.2 實驗過程89-90
- 4.6.3 實驗結(jié)果與分析90-93
- 4.7 本章小結(jié)93-94
- 第5章 面向領(lǐng)域的數(shù)據(jù)驅(qū)動的電信客戶價值評價方法94-113
- 5.1 引言94-96
- 5.2 客戶價值與評價96-102
- 5.2.1 客戶價值的概念96-97
- 5.2.2 客戶價值理論模型97-100
- 5.2.3 電信客戶價值與評價100-102
- 5.3 面向領(lǐng)域的數(shù)據(jù)驅(qū)動的數(shù)據(jù)挖掘模型102-104
- 5.3.1 領(lǐng)域驅(qū)動的數(shù)據(jù)挖掘102-103
- 5.3.2 面向領(lǐng)域的數(shù)據(jù)驅(qū)動的數(shù)據(jù)挖掘103-104
- 5.4 面向領(lǐng)域的數(shù)據(jù)驅(qū)動的電信客戶價值評價方法104-108
- 5.4.1 電信客戶價值評價的特征提取104-105
- 5.4.2 電信客戶價值評價流程105-107
- 5.4.3 電信客戶價值評價算法107-108
- 5.5 仿真實驗108-112
- 5.5.1 算法效果驗證108-110
- 5.5.2 算法應(yīng)用110-112
- 5.6 本章小結(jié)112-113
- 第6章 總結(jié)與展望113-116
- 6.1 本文工作總結(jié)113-115
- 6.2 進一步研究工作與展望115-116
- 致謝116-118
- 參考文獻118-133
- 攻讀博士學(xué)位期間發(fā)表的論文及科研成果133-135
- 讀博期間論文發(fā)表情況133-134
- 讀博期間參與的科研項目134-135
- 讀博期間所申請的專利13
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王俊紅,梁吉業(yè);概念格與粗糙集[J];山西大學(xué)學(xué)報(自然科學(xué)版);2003年04期
2 譚思云,張青枝,李志明;基于粗糙集的分類和規(guī)則歸納法[J];武漢理工大學(xué)學(xué)報;2003年02期
3 劉永紅;;粗糙集的格刻畫[J];模式識別與人工智能;2003年02期
4 孫海軍,蔣東翔,錢立軍,戰(zhàn)祥森;基于粗糙集理論的旋轉(zhuǎn)機械故障診斷方法[J];動力工程;2004年01期
5 陳歡;基于粗糙集理論的值約簡及規(guī)則提取[J];福州大學(xué)學(xué)報(自然科學(xué)版);2004年04期
6 舒蘭,趙磊;粗糙集的模糊性[J];電子科技大學(xué)學(xué)報;2005年01期
7 劉靖,陳福生,張勤;基于粗糙集和模糊集的屬性約簡算法[J];計算機工程與科學(xué);2005年02期
8 趙青杉;王建國;劉婧;;基于粗糙集的風(fēng)濕性二尖瓣狹窄疾病診斷[J];太原科技大學(xué)學(xué)報;2006年03期
9 劉海泉;張永強;;一種基于粗糙集理論的特征選取方法[J];科技資訊;2007年28期
10 覃偉榮;秦亮羲;朱杰;;基于粗糙集分類器設(shè)計與應(yīng)用研究[J];微計算機信息;2008年33期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 黎文航;陳善本;王兵;;粗糙集理論在焊接中的應(yīng)用綜述[A];第十一次全國焊接會議論文集(第2冊)[C];2005年
2 尹宗成;;粗糙集理論在我國糧食產(chǎn)量預(yù)測中的應(yīng)用[A];現(xiàn)代農(nóng)業(yè)理論與實踐——安徽現(xiàn)代農(nóng)業(yè)博士科技論壇論文集[C];2007年
3 鄒剛;滕書華;孫即祥;陳森林;敖永紅;;一種粗糙集優(yōu)化協(xié)同原型模式約簡分類方法[A];第十四屆全國信號處理學(xué)術(shù)年會(CCSP-2009)論文集[C];2009年
4 葛麗;傅彥;;粗糙集在科學(xué)數(shù)據(jù)屬性約簡中的應(yīng)用[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年
5 陳雪飛;;粗糙集分類中耦合數(shù)據(jù)的處理方法研究[A];2008年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(上冊)[C];2008年
6 肖健梅;蘆曉明;王錫淮;;集裝箱起重機防搖系統(tǒng)粗糙集控制[A];第二十六屆中國控制會議論文集[C];2007年
7 王印松;馮康;;主汽溫調(diào)節(jié)系統(tǒng)性能評價的粗糙集實現(xiàn)方法[A];第二十七屆中國控制會議論文集[C];2008年
8 王紅萍;萬程亮;金彥豐;;應(yīng)用粗糙集理論的對抗效果權(quán)重確定方法[A];2009’中國西部地區(qū)聲學(xué)學(xué)術(shù)交流會論文集[C];2009年
9 王莉;周獻中;;一種基于粗糙集的模糊神經(jīng)網(wǎng)絡(luò)模型在鋼材力學(xué)性能預(yù)測中的研究[A];2009年中國智能自動化會議論文集(第二分冊)[C];2009年
10 卓明;王麗珍;譚旭;;基于粗糙集近似集擴展的規(guī)則提取算法[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2000年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 薛佩軍;正負域覆蓋廣義粗糙集與知識粗傳播研究[D];山東大學(xué);2007年
2 孔芝;粗糙集理論若干問題的研究與應(yīng)用[D];東北大學(xué);2009年
3 秦中廣;基于粗糙集的交叉研究及其在中醫(yī)診斷的應(yīng)用[D];華南理工大學(xué);2002年
4 劉少輝;知識發(fā)現(xiàn)中粗糙集理論的研究[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2003年
5 鄧大勇;基于粗糙集的數(shù)據(jù)約簡及粗糙集擴展模型的研究[D];北京交通大學(xué);2007年
6 孫英娟;基于粗糙集的分類方法研究[D];吉林大學(xué);2011年
7 楊田;覆蓋粗糙集約簡理論及應(yīng)用[D];湖南大學(xué);2010年
8 劉業(yè)政;基于粗糙集數(shù)據(jù)分析的智能決策支持系統(tǒng)研究[D];合肥工業(yè)大學(xué);2002年
9 王加陽;面向海量數(shù)據(jù)的粗糙集理論與方法研究[D];中南大學(xué);2005年
10 王慶東;基于粗糙集的數(shù)據(jù)挖掘方法研究[D];浙江大學(xué);2005年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 陳艷;粗糙集理論及其推廣模型的研究[D];電子科技大學(xué);2008年
2 王昕婭;基于概念格模型的粗糙集約簡方法研究[D];合肥工業(yè)大學(xué);2006年
3 曾建武;粗糙集理論及故障診斷應(yīng)用研究[D];浙江大學(xué);2006年
4 王永茂;粗糙集理論在燃煤發(fā)熱量預(yù)測中的應(yīng)用研究[D];華北電力大學(xué)(北京);2003年
5 劉巧云;粗糙集在氧化鋁種分數(shù)據(jù)分析中的應(yīng)用[D];中南大學(xué);2007年
6 張達;基于粗糙集理論的公交優(yōu)先控制算法研究[D];廣西大學(xué);2007年
7 朱雅瓊;基于粗糙集理論的金礦礦化信息挖掘與分析[D];武漢理工大學(xué);2007年
8 張曉紅;基于信息熵的粗糙集理論的研究和應(yīng)用[D];安徽大學(xué);2011年
9 解毅;基于直覺不確定粗糙集的智能電網(wǎng)故障診斷[D];東北大學(xué);2010年
10 王璐;基于模糊覆蓋的粗糙集理論研究[D];西安工程大學(xué);2012年
,本文編號:621337
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/621337.html