基于回歸分析的馬爾科夫毯學(xué)習(xí)算法研究及其應(yīng)用
發(fā)布時(shí)間:2022-01-11 11:46
特征選擇是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)領(lǐng)域的重要研究部分,是從特征集合中選擇相關(guān)的特征,并剔除不相關(guān)特征和冗余特征。特征選擇可以有效減少問(wèn)題求解中的變量,解決“維度災(zāi)難”的問(wèn)題。貝葉斯網(wǎng)絡(luò)是將概率論與圖論相結(jié)合,定性和定量的描述數(shù)據(jù)倉(cāng)庫(kù)中變量之間關(guān)系的模型。貝葉斯網(wǎng)絡(luò)中一個(gè)變量的馬爾科夫毯包括該變量的父結(jié)點(diǎn)、子結(jié)點(diǎn)和配偶結(jié)點(diǎn)(子結(jié)點(diǎn)的父結(jié)點(diǎn))。一個(gè)變量的馬爾科夫毯可以屏蔽網(wǎng)絡(luò)中其它變量對(duì)該變量的影響。本文首先介紹了馬爾科夫毯學(xué)習(xí)算法的研究現(xiàn)狀,部分算法中存在著包含錯(cuò)誤冗余結(jié)點(diǎn)的問(wèn)題;貧w分析是確定變量之間相關(guān)關(guān)系的統(tǒng)計(jì)分析方法,通過(guò)假設(shè)檢驗(yàn),剔除與因變量相關(guān)性弱及不相關(guān)的變量。將馬爾科夫毯學(xué)習(xí)算法和回歸分析相結(jié)合,剔除候選馬爾科夫毯中與目標(biāo)變量相關(guān)性弱和不相關(guān)的變量,并利用條件獨(dú)立測(cè)試返回最終的馬爾科夫毯。將該方法在經(jīng)典網(wǎng)絡(luò)上的實(shí)驗(yàn)結(jié)果與已有的馬爾科夫毯學(xué)習(xí)算法進(jìn)行比較,表明了該方法的有效性和可靠性。股市的行業(yè)板塊間具有很強(qiáng)的相關(guān)性,而房地產(chǎn)行業(yè)在我國(guó)經(jīng)濟(jì)中發(fā)揮著重要作用。利用本文算法對(duì)上證股市行業(yè)板塊收盤指數(shù)數(shù)據(jù)進(jìn)行處理,從股市行業(yè)板塊中選擇與房地產(chǎn)板塊具有特征相關(guān)的行業(yè)板塊,利用Grange...
【文章來(lái)源】:合肥工業(yè)大學(xué)安徽省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
貝葉斯網(wǎng)絡(luò),陰影結(jié)點(diǎn)為T的馬爾科夫毯設(shè)有離散變量集合V={A,B,C,D,E,F(xiàn),G,T},圖2-1中的結(jié)點(diǎn)分別代表集合V中的變量,以結(jié)點(diǎn)T為例,B和E是它的父結(jié)點(diǎn),C和D是它的子結(jié)點(diǎn)
T |{Y } s) ,那么 Y 一定是 T 的子結(jié)點(diǎn),X 一定是 T 的配偶結(jié)點(diǎn)這樣的變量 Y,那么 X 就不是 T 的配偶結(jié)點(diǎn)。 2.4 MMMB(Max-Min Markov Blanket)算法:)得到 MB(T)的候選馬爾科夫毯T)=MMPC(T);=PC(T);( )( ) ( ) \ {T}C PC T PC T MMPC C ;)找到 T 的配偶結(jié)點(diǎn)ach X CMB \ PC( T )flag=false;尋找集合s,使得 Ind ( X ; T | s );for each Y PC( T ){ if Dep ( X ; T |{ Y } s) flag=true; }if(flag) { MB MB { X} ;} }rn MB;
25(2)在邏輯回歸對(duì)話框里選擇因變量(目標(biāo)變量)和自變量(候選馬圖 3-1 SPSS 軟件里對(duì)數(shù)據(jù)進(jìn)行邏輯回歸分析3.3.2 實(shí)驗(yàn)標(biāo)準(zhǔn)本文采用 PCMB 算法所在的文獻(xiàn)[36]中提出的查準(zhǔn)率(precis(recall)以及它們之間的歐氏距離 d 來(lái)衡量學(xué)習(xí)馬爾科夫毯的算法的一個(gè)目標(biāo)變量 T,查準(zhǔn)率是指算法輸出的 MB(T)中包含正確變量的率越高,表明算法引入錯(cuò)誤變量越少;查全率是指算法輸出的 M量的個(gè)數(shù)占實(shí)際 MB(T)變量個(gè)數(shù)的比率,查全率越高,表明算法漏量越少。
【參考文獻(xiàn)】:
期刊論文
[1]中國(guó)金融中心城市房地產(chǎn)價(jià)格與銀行信貸的關(guān)系[J]. 車欣薇,郭琨,李斌,王玨. 系統(tǒng)工程理論與實(shí)踐. 2011(04)
[2]中國(guó)A股市場(chǎng)行業(yè)板塊間領(lǐng)滯關(guān)系的動(dòng)態(tài)變化實(shí)證研究[J]. 陳暮紫,陳敏,吳武清,繆柏其. 系統(tǒng)工程理論與實(shí)踐. 2009(06)
[3]我國(guó)房地產(chǎn)宏觀調(diào)控政策效果的實(shí)證分析[J]. 王要武,金海燕. 土木工程學(xué)報(bào). 2008(08)
[4]基于貝葉斯網(wǎng)絡(luò)的復(fù)雜系統(tǒng)故障預(yù)測(cè)[J]. 許麗佳,王厚軍,龍兵. 系統(tǒng)工程與電子技術(shù). 2008(04)
[5]用于風(fēng)險(xiǎn)管理的貝葉斯網(wǎng)絡(luò)學(xué)習(xí)[J]. 王雙成,唐海燕,劉喜華. 控制與決策. 2007(05)
[6]Logistic回歸模型分析[J]. 施朝健,張明銘. 計(jì)算機(jī)輔助工程. 2005(03)
[7]中國(guó)房地產(chǎn)市場(chǎng)與金融市場(chǎng)的Granger因果關(guān)系分析[J]. 皮舜. 系統(tǒng)工程理論與實(shí)踐. 2004(12)
[8]中國(guó)股票市場(chǎng)流動(dòng)性與收益動(dòng)態(tài)關(guān)系研究[J]. 張維,梁朝暉. 系統(tǒng)工程理論與實(shí)踐. 2004(10)
[9]中國(guó)股市的Granger因果關(guān)系分析[J]. 朱宏泉,盧祖帝,汪壽陽(yáng). 管理科學(xué)學(xué)報(bào). 2001(05)
本文編號(hào):3582727
【文章來(lái)源】:合肥工業(yè)大學(xué)安徽省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
貝葉斯網(wǎng)絡(luò),陰影結(jié)點(diǎn)為T的馬爾科夫毯設(shè)有離散變量集合V={A,B,C,D,E,F(xiàn),G,T},圖2-1中的結(jié)點(diǎn)分別代表集合V中的變量,以結(jié)點(diǎn)T為例,B和E是它的父結(jié)點(diǎn),C和D是它的子結(jié)點(diǎn)
T |{Y } s) ,那么 Y 一定是 T 的子結(jié)點(diǎn),X 一定是 T 的配偶結(jié)點(diǎn)這樣的變量 Y,那么 X 就不是 T 的配偶結(jié)點(diǎn)。 2.4 MMMB(Max-Min Markov Blanket)算法:)得到 MB(T)的候選馬爾科夫毯T)=MMPC(T);=PC(T);( )( ) ( ) \ {T}C PC T PC T MMPC C ;)找到 T 的配偶結(jié)點(diǎn)ach X CMB \ PC( T )flag=false;尋找集合s,使得 Ind ( X ; T | s );for each Y PC( T ){ if Dep ( X ; T |{ Y } s) flag=true; }if(flag) { MB MB { X} ;} }rn MB;
25(2)在邏輯回歸對(duì)話框里選擇因變量(目標(biāo)變量)和自變量(候選馬圖 3-1 SPSS 軟件里對(duì)數(shù)據(jù)進(jìn)行邏輯回歸分析3.3.2 實(shí)驗(yàn)標(biāo)準(zhǔn)本文采用 PCMB 算法所在的文獻(xiàn)[36]中提出的查準(zhǔn)率(precis(recall)以及它們之間的歐氏距離 d 來(lái)衡量學(xué)習(xí)馬爾科夫毯的算法的一個(gè)目標(biāo)變量 T,查準(zhǔn)率是指算法輸出的 MB(T)中包含正確變量的率越高,表明算法引入錯(cuò)誤變量越少;查全率是指算法輸出的 M量的個(gè)數(shù)占實(shí)際 MB(T)變量個(gè)數(shù)的比率,查全率越高,表明算法漏量越少。
【參考文獻(xiàn)】:
期刊論文
[1]中國(guó)金融中心城市房地產(chǎn)價(jià)格與銀行信貸的關(guān)系[J]. 車欣薇,郭琨,李斌,王玨. 系統(tǒng)工程理論與實(shí)踐. 2011(04)
[2]中國(guó)A股市場(chǎng)行業(yè)板塊間領(lǐng)滯關(guān)系的動(dòng)態(tài)變化實(shí)證研究[J]. 陳暮紫,陳敏,吳武清,繆柏其. 系統(tǒng)工程理論與實(shí)踐. 2009(06)
[3]我國(guó)房地產(chǎn)宏觀調(diào)控政策效果的實(shí)證分析[J]. 王要武,金海燕. 土木工程學(xué)報(bào). 2008(08)
[4]基于貝葉斯網(wǎng)絡(luò)的復(fù)雜系統(tǒng)故障預(yù)測(cè)[J]. 許麗佳,王厚軍,龍兵. 系統(tǒng)工程與電子技術(shù). 2008(04)
[5]用于風(fēng)險(xiǎn)管理的貝葉斯網(wǎng)絡(luò)學(xué)習(xí)[J]. 王雙成,唐海燕,劉喜華. 控制與決策. 2007(05)
[6]Logistic回歸模型分析[J]. 施朝健,張明銘. 計(jì)算機(jī)輔助工程. 2005(03)
[7]中國(guó)房地產(chǎn)市場(chǎng)與金融市場(chǎng)的Granger因果關(guān)系分析[J]. 皮舜. 系統(tǒng)工程理論與實(shí)踐. 2004(12)
[8]中國(guó)股票市場(chǎng)流動(dòng)性與收益動(dòng)態(tài)關(guān)系研究[J]. 張維,梁朝暉. 系統(tǒng)工程理論與實(shí)踐. 2004(10)
[9]中國(guó)股市的Granger因果關(guān)系分析[J]. 朱宏泉,盧祖帝,汪壽陽(yáng). 管理科學(xué)學(xué)報(bào). 2001(05)
本文編號(hào):3582727
本文鏈接:http://sikaile.net/jingjilunwen/fangdichanjingjilunwen/3582727.html
最近更新
教材專著