天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向財(cái)務(wù)危機(jī)預(yù)警的隨機(jī)層疊森林算法研究

發(fā)布時(shí)間:2021-02-12 07:19
  近些年,金融科技在國內(nèi)外迅猛發(fā)展,以金融科技為背景的技術(shù)正在全方位賦能金融體系的信息化和智能化,其在金融智能風(fēng)控、量化交易、資產(chǎn)管理等領(lǐng)域都有巨大的研究空間和價(jià)值。財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警是金融智能風(fēng)控領(lǐng)域的重要研究問題,它能監(jiān)控企業(yè)經(jīng)營(yíng)活動(dòng)和財(cái)務(wù)狀況的變化,幫助政府監(jiān)管者、投資人或企業(yè)主等盡早發(fā)現(xiàn)企業(yè)的潛在風(fēng)險(xiǎn),從而提早采取相應(yīng)措施,它事關(guān)每一個(gè)企業(yè)生死存亡和市場(chǎng)經(jīng)濟(jì)的平穩(wěn)發(fā)展,具有現(xiàn)實(shí)意義。針對(duì)國內(nèi)已有的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警研究存在樣本選擇有偏、時(shí)間跨度較短、泛化能力不強(qiáng)等問題,本文結(jié)合了機(jī)器學(xué)習(xí)、概率統(tǒng)計(jì)、金融學(xué)、財(cái)務(wù)管理等跨領(lǐng)域的知識(shí),從差異化集成以及聚類輔助分類的角度,開展財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警模型的研究。首先,本文構(gòu)建了財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警的數(shù)據(jù)集,設(shè)計(jì)并采集了2006年至2016年近10年來15367條財(cái)務(wù)風(fēng)險(xiǎn)數(shù)據(jù),涉及到2550家上市公司,6大類一級(jí)預(yù)警因子,96個(gè)二級(jí)預(yù)警因子。其次,提出了基于聚類以及stacking堆疊泛化的兩階段混聯(lián)集成學(xué)習(xí)方法——隨機(jī)層疊森林,進(jìn)行財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警。此模型先計(jì)算維度約束,再通過對(duì)多維連續(xù)特征的隨機(jī)特征子空間的聚類來進(jìn)行特征離散化,并生成高維特征。同時(shí),考慮到原始特征以及隨... 

【文章來源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:66 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

面向財(cái)務(wù)危機(jī)預(yù)警的隨機(jī)層疊森林算法研究


并聯(lián)集成框架圖

集成框架,分類器


峭ü?鶚Ш??母禾荻確較蚪?心夂希?傭?盟鶚Ш??諉懇宦值???續(xù)的下降。Chen等人[41]在GBDT的基礎(chǔ)上提出XGBoost針對(duì)損失函數(shù)進(jìn)行二階泰勒展開,既用到了一階導(dǎo)數(shù)也用到了二階導(dǎo)數(shù),同時(shí)引入了正則化項(xiàng)來控制模型的復(fù)雜度,防止過擬合。Prokhorenkova等人[42]針對(duì)數(shù)據(jù)集中的類別變量提出了Catboost算法,有別于傳統(tǒng)的在預(yù)處理階段進(jìn)行one-hot編碼,Catboost在訓(xùn)練過程中處理,對(duì)樣本進(jìn)行隨機(jī)重排序后根據(jù)不同預(yù)測(cè)任務(wù)通過哈希函數(shù)將類別轉(zhuǎn)為數(shù)值變量,再按一定的規(guī)則計(jì)算出統(tǒng)計(jì)特征來表示類別變量。串聯(lián)集成框架如圖1-2所示。圖1-2串聯(lián)集成框架圖(3)混聯(lián)集成框架混合集成是一種層內(nèi)并聯(lián)、層間串聯(lián)的多層集成學(xué)習(xí)模式,在每一層使用不同的算法訓(xùn)練多個(gè)異質(zhì)分類器,上一層每個(gè)分類器的預(yù)測(cè)結(jié)果會(huì)輔助下一層分類器的訓(xùn)練,良好的混聯(lián)集成的設(shè)計(jì)能夠取長(zhǎng)補(bǔ)短,綜合串聯(lián)和并聯(lián)集成的優(yōu)勢(shì)。但同時(shí),混聯(lián)集成也會(huì)造成模型過于復(fù)雜,降低模型的可控性,增加模型的訓(xùn)練難度。Stacking就是一種混聯(lián)集成框架,是使用不同的算法訓(xùn)練多個(gè)異質(zhì)分類器,在每個(gè)分類器預(yù)測(cè)結(jié)果的基礎(chǔ)上進(jìn)行再學(xué)習(xí)組合的集成學(xué)習(xí)方法。后來學(xué)界有針對(duì)Stacking結(jié)構(gòu)的改進(jìn)研究[43-44]。Troika[44]算法采用了更復(fù)雜的三層集成結(jié)構(gòu),所有的基模型作為第一層,將所有基模型的輸出作為第二層Specialist學(xué)習(xí)器的輸入,最后第二層的輸出通過第三層的meta學(xué)習(xí)器進(jìn)行訓(xùn)練得到最終結(jié)果。學(xué)界也有針對(duì)Stacking訓(xùn)練方式的研究。Nguyen等人[45]提出基于交叉驗(yàn)證構(gòu)造異質(zhì)集成分類器生成元數(shù)據(jù)和基于模糊規(guī)則集學(xué)習(xí)元數(shù)據(jù)的Stacking算法,該算法在對(duì)比多個(gè)集成算法中都取得了很好的效果。Wang等人[46]為了

集成框架


第一章緒論9提高癌癥診斷的準(zhǔn)確性和可解釋性,提出了在基模型訓(xùn)練之后使用多目標(biāo)進(jìn)化算法進(jìn)行基模型的篩選以及在Stacking之后進(jìn)行規(guī)則剪枝以此在既保證精度的同時(shí)降低了模型復(fù)雜度;炻(lián)集成框架如圖2-4所示。圖1-3混聯(lián)集成框架圖本文提出的多層交叉集成學(xué)習(xí)方法也屬于混聯(lián)集成,其可以有效的對(duì)原始特征和第一階段的高維特征進(jìn)行過濾,同時(shí)開創(chuàng)性的將不同深淺的元數(shù)據(jù)進(jìn)行再訓(xùn)練,最終在危機(jī)預(yù)警分類中取得了比較好的效果。1.2.4當(dāng)前研究存在的問題通過閱讀國內(nèi)外的研究文獻(xiàn),當(dāng)前研究存在的問題主要有以下幾點(diǎn):(1)財(cái)務(wù)健康樣本選擇的主觀性較大財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警是個(gè)不均衡類別問題,已有的很多財(cái)務(wù)預(yù)警建模研究是在已挑選的財(cái)務(wù)危機(jī)的樣本的基礎(chǔ)上,對(duì)樣本數(shù)據(jù)人為主觀的配對(duì)或者按照一定比例挑選樣本方法,這種靜態(tài)建模的方式可能造成實(shí)驗(yàn)結(jié)果與實(shí)際效果是有偏的。(2)樣本時(shí)間跨度短,數(shù)量少,泛化能力不強(qiáng)由于數(shù)據(jù)的可獲得性或者建模的簡(jiǎn)易性,很多研究選擇的時(shí)間跨度比較短,再加上主觀的平衡財(cái)務(wù)健康與財(cái)務(wù)危機(jī)的數(shù)據(jù),使得實(shí)驗(yàn)的樣本量較少,這對(duì)復(fù)雜預(yù)測(cè)模型的訓(xùn)練和實(shí)際泛化能力有所影響。(3)集成預(yù)警的研究還不夠深入現(xiàn)有的財(cái)務(wù)預(yù)警研究中,單一模型建模仍然占目前研究的大多數(shù),一部分專家學(xué)者嘗試使用集成預(yù)警來提高預(yù)測(cè)效果,取得了一定的成果,但很多集成預(yù)警模型的研究不夠深入,僅僅多個(gè)分類器的簡(jiǎn)單組合或者集成技術(shù)的簡(jiǎn)單應(yīng)用,比較少根據(jù)財(cái)務(wù)預(yù)警數(shù)據(jù)集的特點(diǎn)進(jìn)行集成建模。

【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)FOA算法的上市公司Z-Score模型財(cái)務(wù)預(yù)警[J]. 康彩紅,王秋萍,肖燕婷.  計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(11)
[2]基于PSO-BP和FOA-BP神經(jīng)網(wǎng)絡(luò)的財(cái)務(wù)危機(jī)預(yù)警模型比較[J]. 王玉冬,王迪,王珊珊.  統(tǒng)計(jì)與決策. 2018(15)
[3]多源信息融合視角下中小企業(yè)財(cái)務(wù)危機(jī)預(yù)警研究——基于集成學(xué)習(xí)的數(shù)據(jù)挖掘方法[J]. 操瑋,李燦,朱衛(wèi)東.  財(cái)會(huì)通訊. 2018(05)
[4]基于誤判代價(jià)加權(quán)的Logistic財(cái)務(wù)預(yù)警模型研究[J]. 何勝美,方茂揚(yáng),王響.  經(jīng)濟(jì)數(shù)學(xué). 2017(02)
[5]基于MTS-AdaBoost的不平衡數(shù)據(jù)分類研究[J]. 顧玉萍,程龍生.  計(jì)算機(jī)應(yīng)用研究. 2018(02)
[6]AS-FOA優(yōu)化GRNN網(wǎng)絡(luò)的財(cái)務(wù)預(yù)警研究[J]. 王英博,柴佳佳.  計(jì)算機(jī)科學(xué). 2016(07)
[7]基于多元概率比回歸模型的上市公司財(cái)務(wù)危機(jī)預(yù)警分析[J]. 高小雪.  企業(yè)經(jīng)濟(jì). 2015(04)
[8]基于人群搜索算法的上市公司的Z-Score模型財(cái)務(wù)預(yù)警研究[J]. 趙海蕾,周方召,金德環(huán).  財(cái)經(jīng)理論與實(shí)踐. 2015(02)
[9]基于Logistic與Fisher的上市公司財(cái)務(wù)困境判別模型比較研究[J]. 馬若微,張微.  北京工商大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2014(02)
[10]上市公司財(cái)務(wù)困境預(yù)測(cè)方法的比較研究[J]. 呂長(zhǎng)江,周現(xiàn)華.  吉林大學(xué)社會(huì)科學(xué)學(xué)報(bào). 2005(06)



本文編號(hào):3030469

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/xmjj/3030469.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8bdb2***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com