天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向財務危機預警的隨機層疊森林算法研究

發(fā)布時間:2021-02-12 07:19
  近些年,金融科技在國內(nèi)外迅猛發(fā)展,以金融科技為背景的技術(shù)正在全方位賦能金融體系的信息化和智能化,其在金融智能風控、量化交易、資產(chǎn)管理等領域都有巨大的研究空間和價值。財務風險預警是金融智能風控領域的重要研究問題,它能監(jiān)控企業(yè)經(jīng)營活動和財務狀況的變化,幫助政府監(jiān)管者、投資人或企業(yè)主等盡早發(fā)現(xiàn)企業(yè)的潛在風險,從而提早采取相應措施,它事關(guān)每一個企業(yè)生死存亡和市場經(jīng)濟的平穩(wěn)發(fā)展,具有現(xiàn)實意義。針對國內(nèi)已有的財務風險預警研究存在樣本選擇有偏、時間跨度較短、泛化能力不強等問題,本文結(jié)合了機器學習、概率統(tǒng)計、金融學、財務管理等跨領域的知識,從差異化集成以及聚類輔助分類的角度,開展財務風險預警模型的研究。首先,本文構(gòu)建了財務風險預警的數(shù)據(jù)集,設計并采集了2006年至2016年近10年來15367條財務風險數(shù)據(jù),涉及到2550家上市公司,6大類一級預警因子,96個二級預警因子。其次,提出了基于聚類以及stacking堆疊泛化的兩階段混聯(lián)集成學習方法——隨機層疊森林,進行財務風險預警。此模型先計算維度約束,再通過對多維連續(xù)特征的隨機特征子空間的聚類來進行特征離散化,并生成高維特征。同時,考慮到原始特征以及隨... 

【文章來源】:華南理工大學廣東省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:66 頁

【學位級別】:碩士

【部分圖文】:

面向財務危機預警的隨機層疊森林算法研究


并聯(lián)集成框架圖

集成框架,分類器


峭ü?鶚Ш??母禾荻確較蚪?心夂希?傭?盟鶚Ш??諉懇宦值???續(xù)的下降。Chen等人[41]在GBDT的基礎上提出XGBoost針對損失函數(shù)進行二階泰勒展開,既用到了一階導數(shù)也用到了二階導數(shù),同時引入了正則化項來控制模型的復雜度,防止過擬合。Prokhorenkova等人[42]針對數(shù)據(jù)集中的類別變量提出了Catboost算法,有別于傳統(tǒng)的在預處理階段進行one-hot編碼,Catboost在訓練過程中處理,對樣本進行隨機重排序后根據(jù)不同預測任務通過哈希函數(shù)將類別轉(zhuǎn)為數(shù)值變量,再按一定的規(guī)則計算出統(tǒng)計特征來表示類別變量。串聯(lián)集成框架如圖1-2所示。圖1-2串聯(lián)集成框架圖(3)混聯(lián)集成框架混合集成是一種層內(nèi)并聯(lián)、層間串聯(lián)的多層集成學習模式,在每一層使用不同的算法訓練多個異質(zhì)分類器,上一層每個分類器的預測結(jié)果會輔助下一層分類器的訓練,良好的混聯(lián)集成的設計能夠取長補短,綜合串聯(lián)和并聯(lián)集成的優(yōu)勢。但同時,混聯(lián)集成也會造成模型過于復雜,降低模型的可控性,增加模型的訓練難度。Stacking就是一種混聯(lián)集成框架,是使用不同的算法訓練多個異質(zhì)分類器,在每個分類器預測結(jié)果的基礎上進行再學習組合的集成學習方法。后來學界有針對Stacking結(jié)構(gòu)的改進研究[43-44]。Troika[44]算法采用了更復雜的三層集成結(jié)構(gòu),所有的基模型作為第一層,將所有基模型的輸出作為第二層Specialist學習器的輸入,最后第二層的輸出通過第三層的meta學習器進行訓練得到最終結(jié)果。學界也有針對Stacking訓練方式的研究。Nguyen等人[45]提出基于交叉驗證構(gòu)造異質(zhì)集成分類器生成元數(shù)據(jù)和基于模糊規(guī)則集學習元數(shù)據(jù)的Stacking算法,該算法在對比多個集成算法中都取得了很好的效果。Wang等人[46]為了

集成框架


第一章緒論9提高癌癥診斷的準確性和可解釋性,提出了在基模型訓練之后使用多目標進化算法進行基模型的篩選以及在Stacking之后進行規(guī)則剪枝以此在既保證精度的同時降低了模型復雜度;炻(lián)集成框架如圖2-4所示。圖1-3混聯(lián)集成框架圖本文提出的多層交叉集成學習方法也屬于混聯(lián)集成,其可以有效的對原始特征和第一階段的高維特征進行過濾,同時開創(chuàng)性的將不同深淺的元數(shù)據(jù)進行再訓練,最終在危機預警分類中取得了比較好的效果。1.2.4當前研究存在的問題通過閱讀國內(nèi)外的研究文獻,當前研究存在的問題主要有以下幾點:(1)財務健康樣本選擇的主觀性較大財務風險預警是個不均衡類別問題,已有的很多財務預警建模研究是在已挑選的財務危機的樣本的基礎上,對樣本數(shù)據(jù)人為主觀的配對或者按照一定比例挑選樣本方法,這種靜態(tài)建模的方式可能造成實驗結(jié)果與實際效果是有偏的。(2)樣本時間跨度短,數(shù)量少,泛化能力不強由于數(shù)據(jù)的可獲得性或者建模的簡易性,很多研究選擇的時間跨度比較短,再加上主觀的平衡財務健康與財務危機的數(shù)據(jù),使得實驗的樣本量較少,這對復雜預測模型的訓練和實際泛化能力有所影響。(3)集成預警的研究還不夠深入現(xiàn)有的財務預警研究中,單一模型建模仍然占目前研究的大多數(shù),一部分專家學者嘗試使用集成預警來提高預測效果,取得了一定的成果,但很多集成預警模型的研究不夠深入,僅僅多個分類器的簡單組合或者集成技術(shù)的簡單應用,比較少根據(jù)財務預警數(shù)據(jù)集的特點進行集成建模。

【參考文獻】:
期刊論文
[1]基于改進FOA算法的上市公司Z-Score模型財務預警[J]. 康彩紅,王秋萍,肖燕婷.  計算機系統(tǒng)應用. 2018(11)
[2]基于PSO-BP和FOA-BP神經(jīng)網(wǎng)絡的財務危機預警模型比較[J]. 王玉冬,王迪,王珊珊.  統(tǒng)計與決策. 2018(15)
[3]多源信息融合視角下中小企業(yè)財務危機預警研究——基于集成學習的數(shù)據(jù)挖掘方法[J]. 操瑋,李燦,朱衛(wèi)東.  財會通訊. 2018(05)
[4]基于誤判代價加權(quán)的Logistic財務預警模型研究[J]. 何勝美,方茂揚,王響.  經(jīng)濟數(shù)學. 2017(02)
[5]基于MTS-AdaBoost的不平衡數(shù)據(jù)分類研究[J]. 顧玉萍,程龍生.  計算機應用研究. 2018(02)
[6]AS-FOA優(yōu)化GRNN網(wǎng)絡的財務預警研究[J]. 王英博,柴佳佳.  計算機科學. 2016(07)
[7]基于多元概率比回歸模型的上市公司財務危機預警分析[J]. 高小雪.  企業(yè)經(jīng)濟. 2015(04)
[8]基于人群搜索算法的上市公司的Z-Score模型財務預警研究[J]. 趙海蕾,周方召,金德環(huán).  財經(jīng)理論與實踐. 2015(02)
[9]基于Logistic與Fisher的上市公司財務困境判別模型比較研究[J]. 馬若微,張微.  北京工商大學學報(社會科學版). 2014(02)
[10]上市公司財務困境預測方法的比較研究[J]. 呂長江,周現(xiàn)華.  吉林大學社會科學學報. 2005(06)



本文編號:3030469

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/xmjj/3030469.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8bdb2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com