考慮特征變量異質(zhì)性的分類方法及其在風(fēng)險(xiǎn)決策中的應(yīng)用研究
發(fā)布時(shí)間:2017-05-18 19:06
本文關(guān)鍵詞:考慮特征變量異質(zhì)性的分類方法及其在風(fēng)險(xiǎn)決策中的應(yīng)用研究,由筆耕文化傳播整理發(fā)布。
【摘要】: 風(fēng)險(xiǎn)決策中廣泛存在著具有如下特征的一類問題,即風(fēng)險(xiǎn)決策者首先需要建立歷史數(shù)據(jù)樣本與自然狀態(tài)之間的依賴關(guān)系,然后根據(jù)該依賴關(guān)系估計(jì)一個(gè)新的數(shù)據(jù)樣本所對(duì)應(yīng)自然狀態(tài)的出現(xiàn)概率,最后建立風(fēng)險(xiǎn)決策模型,以最大化收益函數(shù)(或最小化風(fēng)險(xiǎn)損失函數(shù))為目標(biāo)選擇最優(yōu)行動(dòng)方案。從建立歷史數(shù)據(jù)樣本與自然狀態(tài)的依賴關(guān)系這一意義上,可以將這類風(fēng)險(xiǎn)決策問題歸納為數(shù)據(jù)挖掘中的分類問題,因而數(shù)據(jù)挖掘中的各種分類方法可以應(yīng)用于該類風(fēng)險(xiǎn)決策問題。由于分類的高效性和準(zhǔn)確性對(duì)于風(fēng)險(xiǎn)決策具有關(guān)鍵性影響,因此分類方法及其在風(fēng)險(xiǎn)決策中的應(yīng)用研究具有重要的理論和現(xiàn)實(shí)意義。 已有的相關(guān)研究主要從分類方法及其應(yīng)用的角度考慮風(fēng)險(xiǎn)決策問題。事實(shí)上,在應(yīng)用各種數(shù)據(jù)挖掘技術(shù)前,探索了解數(shù)據(jù)的特性將對(duì)挖掘結(jié)果有重要甚至關(guān)鍵性的影響。在分類問題中,特征變量異質(zhì)性是一種重要的數(shù)據(jù)特性,對(duì)于分類方法的應(yīng)用結(jié)果具有顯著影響。因此,本文主要研究考慮特征變量異質(zhì)性的分類方法及其在風(fēng)險(xiǎn)決策問題中的應(yīng)用。研究目的在于探索數(shù)據(jù)中存在的特征異質(zhì)性這一數(shù)據(jù)特性,并提出相應(yīng)的解決方法以提高分類的準(zhǔn)確性,使分類方法能夠更好地為風(fēng)險(xiǎn)決策提供支持。 本文從第一章到第六章的內(nèi)容安排如下: 第一章概述了本文的研究背景,回顧了分類方法及其在風(fēng)險(xiǎn)決策問題中的相關(guān)研究和分類問題中特征變量異質(zhì)性的研究現(xiàn)狀,說明了本文的研究內(nèi)容和研究意義。 第二章首先對(duì)分類問題進(jìn)行簡要介紹,然后概述分類問題中的特征變量相關(guān)性和特征變量選擇問題。在此基礎(chǔ)上,根據(jù)一系列理論和實(shí)際應(yīng)用研究對(duì)特征變量異質(zhì)性的概念進(jìn)行描述。由于特征變量異質(zhì)性無法從數(shù)據(jù)樣本集合中直接觀察和測度,本章基于薈萃分析的基本思想,提出了一種利用全局特征變量選擇和數(shù)據(jù)樣本集合隨機(jī)劃分的方法來測度特征變量異質(zhì)性的方法。在一系列基準(zhǔn)數(shù)據(jù)集和人工構(gòu)造的混合數(shù)據(jù)集上的實(shí)驗(yàn)計(jì)算結(jié)果說明了該測度方法的有效性。 第三章主要考察特征變量異質(zhì)性對(duì)分類方法效果的影響。本章首先對(duì)特征變量異質(zhì)性的影響進(jìn)行簡要分析,然后通過實(shí)證研究說明分類問題中存在的特征變量異質(zhì)性對(duì)分類方法的準(zhǔn)確率具有較為顯著的影響。本章采用的分類方法為一種將logistic回歸與支持向量機(jī)集成的分類方法,該方法的主要思想是應(yīng)用logistic回歸的輸出概率為支持向量機(jī)提供支持信息,以提高分類判別準(zhǔn)確性。實(shí)證研究以企業(yè)財(cái)務(wù)困境預(yù)測這一風(fēng)險(xiǎn)管理和決策問題為背景,通過比較考慮特征變量異質(zhì)性前后的分類預(yù)測準(zhǔn)確率,說明了在存在特征變量異質(zhì)性的分類問題中,考慮特征變量異質(zhì)性有利于提高分類方法的準(zhǔn)確率。 第四章提出了一種基于因子分析和聚類分析的分類策略,該策略的基本思想是首先將原始的特征變量轉(zhuǎn)化為新的特征變量,使得新的特征變量能夠體現(xiàn)出原始特征變量在數(shù)據(jù)樣本空間中的異質(zhì)性,然后通過聚類分析得到各個(gè)具有特征變量同質(zhì)性的樣本子集,并在每個(gè)樣本子集中分別建立相應(yīng)的分類模型,從而減小特征變量異質(zhì)性對(duì)分類方法準(zhǔn)確率的影響。對(duì)于一個(gè)未知類標(biāo)記樣本,該分類策略首先將其轉(zhuǎn)化為因子得分向量,然后將該因子得分向量按照最近鄰規(guī)則劃分到與之最近的樣本子集合中,最后利用該樣本子集合中的分類模型進(jìn)行分類。在一系列基準(zhǔn)數(shù)據(jù)集上的實(shí)驗(yàn)計(jì)算結(jié)果說明了該分類策略的有效性。 第五章提出了一種考慮特征變量異質(zhì)性且具有增量式學(xué)習(xí)特性的分類方法,可有效應(yīng)用于一類具有特征變量異質(zhì)性且需要決策者利用分類方法進(jìn)行在線實(shí)時(shí)風(fēng)險(xiǎn)決策的問題。該方法首先利用基于網(wǎng)格的有指導(dǎo)聚類對(duì)數(shù)據(jù)樣本集合進(jìn)行劃分,從而得到若干數(shù)據(jù)簇,且每個(gè)數(shù)據(jù)簇中數(shù)據(jù)樣本點(diǎn)的類標(biāo)記相同。在去除異常數(shù)據(jù)點(diǎn)后,該方法計(jì)算各個(gè)數(shù)據(jù)簇的特征變量相關(guān)性,并將該相關(guān)性作為距離測度中各特征變量的權(quán)重,應(yīng)用最近鄰方法進(jìn)行分類。本章最后將該分類方法應(yīng)用于一系列基準(zhǔn)數(shù)據(jù)集和市場營銷中的顧客確定問題,實(shí)證結(jié)果說明了該方法的有效性。 第六章總結(jié)本文的工作,歸納本文的主要?jiǎng)?chuàng)新點(diǎn),指出目前本文研究的局限,并根據(jù)已取得的研究結(jié)果對(duì)未來進(jìn)一步研究的問題進(jìn)行思考。 本文工作的主要?jiǎng)?chuàng)新點(diǎn)如下: (1)提出了一種有效的特征變量異質(zhì)性的測度方法,該方法可用于探索分類問題中存在的特征變量異質(zhì)性,為解決分類問題提供策略性的信息。 (2)提出了一種基于logistic回歸與支持向量機(jī)集成的分類方法,該方法利用logistic回歸得到的后驗(yàn)概率信息對(duì)支持向量機(jī)的輸出結(jié)果進(jìn)行修正,能夠有效提高傳統(tǒng)支持向量機(jī)的分類準(zhǔn)確性。 (3)提出了一種有效的考慮特征變量異質(zhì)性的分類策略,該策略將具有特征變量異質(zhì)性的數(shù)據(jù)樣本集合劃分為若干同質(zhì)性的子集合,然后通過在各個(gè)子集合中分別建立分類模型來提高分類的準(zhǔn)確性。 (4)提出了一種具有增量式學(xué)習(xí)特性的分類方法,該方法能夠以增量學(xué)習(xí)的方式處理由于數(shù)據(jù)樣本頻繁更新而導(dǎo)致的特征變量異質(zhì)性模式變化,可以在存在特征變量異質(zhì)性且需要實(shí)時(shí)在線決策的風(fēng)險(xiǎn)決策問題中得到有效的應(yīng)用。
【關(guān)鍵詞】:風(fēng)險(xiǎn)決策 分類 特征變量異質(zhì)性 因子分析 聚類 增量學(xué)習(xí)
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2009
【分類號(hào)】:F224;C934
【目錄】:
- 摘要5-8
- ABSTRACT8-12
- 目錄12-14
- 圖序14-15
- 表序15-16
- 第1章 緒論16-28
- 1.1 本文的研究背景和意義17-20
- 1.1.1 本文的研究背景17-19
- 1.1.2 本文的研究意義19-20
- 1.2 研究現(xiàn)狀20-24
- 1.2.1 分類方法在風(fēng)險(xiǎn)決策問題中的應(yīng)用研究現(xiàn)狀20-21
- 1.2.2 分類問題中特征變量異質(zhì)性的研究現(xiàn)狀21-24
- 1.3 本文的主要工作和創(chuàng)新24-25
- 1.3.1 本文的主要工作24-25
- 1.3.2 本文的主要?jiǎng)?chuàng)新25
- 1.4 本文的內(nèi)容組織結(jié)構(gòu)25-28
- 第2章 特征變量異質(zhì)性的概念和測度方法28-46
- 2.1 分類問題中的特征變量相關(guān)性和特征變量選擇28-32
- 2.1.1 分類問題簡介28-30
- 2.1.2 特征變量相關(guān)性和特征變量選擇30-32
- 2.2 特征變量異質(zhì)性的概念32
- 2.3 特征變量異質(zhì)性測度32-38
- 2.3.1 薈萃分析簡介33-35
- 2.3.2 特征變量異質(zhì)性測度方法35-38
- 2.4 實(shí)驗(yàn)計(jì)算結(jié)果38-45
- 2.5 本章總結(jié)45-46
- 第3章 特征變量異質(zhì)性對(duì)分類的影響46-70
- 3.1 特征變量異質(zhì)性的影響46-47
- 3.2 支持向量機(jī)與logistic回歸集成預(yù)測方法47-63
- 3.2.1 支持向量機(jī)簡介47-53
- 3.2.2 Logistic回歸簡介53-58
- 3.2.3 IBDR58-61
- 3.2.4 基準(zhǔn)數(shù)據(jù)集實(shí)驗(yàn)結(jié)果61-63
- 3.3 企業(yè)財(cái)務(wù)困境預(yù)測實(shí)證研究63-67
- 3.3.1 財(cái)務(wù)困境預(yù)測指標(biāo)體系63-64
- 3.3.2 企業(yè)財(cái)務(wù)困境預(yù)測結(jié)果及分析64-67
- 3.4 本章小結(jié)67-70
- 第4章 基于因子分析與聚類分析集成的分類策略70-90
- 4.1 因子分析簡介71-73
- 4.2 聚類分析簡介73-77
- 4.2.1 劃分型聚類73-75
- 4.2.2 層次型聚類75
- 4.2.3 密度聚類75-76
- 4.2.4 其它聚類方法76-77
- 4.3 CAFAC77-82
- 4.3.1 CAFAC的基本原理77-79
- 4.3.2 CAFAC的步驟79-82
- 4.4 實(shí)驗(yàn)計(jì)算結(jié)果82-88
- 4.4.1 CAFAC在36個(gè)混合數(shù)據(jù)集上的結(jié)果82-86
- 4.4.2 CAFAC與其它分類方法的比較結(jié)果86-88
- 4.5 本章小結(jié)88-90
- 第5章 具有增量學(xué)習(xí)特性的分類方法90-104
- 5.1 問題背景90-91
- 5.2 本文提出的方法91-97
- 5.2.1 SCCFSH的基本思想92
- 5.2.2 基于網(wǎng)格的有指導(dǎo)聚類92-94
- 5.2.3 數(shù)據(jù)簇的有指導(dǎo)合并和去除異常點(diǎn)94-95
- 5.2.4 基于加權(quán)距離的分類95-97
- 5.3 實(shí)驗(yàn)計(jì)算結(jié)果97-101
- 5.3.1 基準(zhǔn)數(shù)據(jù)集計(jì)算結(jié)果97-100
- 5.3.2 消費(fèi)者確定問題中的應(yīng)用100-101
- 5.4 本章小結(jié)101-104
- 第6章 總結(jié)與展望104-106
- 6.1 全文總結(jié)104-105
- 6.2 未來可能的研究展望105-106
- 參考文獻(xiàn)106-112
- 致謝112-113
- 在讀期間發(fā)表的學(xué)術(shù)論文與取得的研究成果113
【引證文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 劉又滋;;論財(cái)務(wù)會(huì)計(jì)報(bào)表對(duì)煙草公司的影響[J];財(cái)經(jīng)界;2010年12期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 張雪梅;供應(yīng)鏈環(huán)境中滿足顧客差異化需求的產(chǎn)品設(shè)計(jì)策略[D];中國科學(xué)技術(shù)大學(xué);2011年
本文關(guān)鍵詞:考慮特征變量異質(zhì)性的分類方法及其在風(fēng)險(xiǎn)決策中的應(yīng)用研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):376887
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/376887.html
最近更新
教材專著