RU-SMOTE-SVM利潤操作識別模型構(gòu)建
發(fā)布時間:2022-02-05 07:20
融合SVM智能技術(shù)與RU-SMOTE不平衡樣本處理方法兩者之所長,文章構(gòu)建出RU-SMO TE-SVM模型。該模型的運作機理為:通過SMOTE人工合成新的樣本,以RU方式消除部分樣本中的噪聲及冗余信息,充分借助SVM尋找全局最優(yōu)解的能力;谠撃P,文章構(gòu)建效率性指標(biāo)體系,模型在上市公司利潤操作識別中的應(yīng)用為對象進(jìn)行具體研究,對比不同的識別性能結(jié)果,結(jié)果顯示RU-SMOTE-SVM模型對上市公司利潤操作行為的識別具有較強的適用性和很高的使用價值。
【文章來源】:財會通訊. 2020,(22)北大核心
【文章頁數(shù)】:4 頁
【部分圖文】:
表2中,RBF為徑向基函數(shù),也簡稱為高斯函數(shù),用輸入模式與中心向量的距離作為函數(shù)的自變量,具有“局圖2RU-SMOTE-SVM模型在不同核函數(shù)下的上市公司利潤操作識別結(jié)果
真”的錯誤,拒絕了正確的、實際上成立的假設(shè),基于樣本統(tǒng)計量推斷其結(jié)論并非絕對正確,也可能存在錯誤;二類錯誤與第一類錯誤相對,是進(jìn)行假設(shè)檢驗時原假設(shè)不正確而接受原假設(shè)的錯誤。由圖2、表2可知,RBF核函數(shù)下的模型具有最低值,從準(zhǔn)確率方面分析則RBF核函數(shù)下的模型具有最高值。所以,與其他核函數(shù)下的模型相比,基于RBF構(gòu)建的RU-SMOTE-SVM模型性能更為優(yōu)異,能夠?qū)ι鲜泄镜睦麧櫜僮餍袨檫M(jìn)行有效識別。同時,本文進(jìn)一步將RU-SMOTE-SVM模型與傳統(tǒng)的SVM、SMOTE-SVM、RU-SVM模型進(jìn)行性能結(jié)果的對比,具體如表3、圖3所示,再次驗證RBF核函數(shù)下RU-SMOTE-SVM模型對上市公司利潤操作行為具有良好的識別性能。由圖3、表3可知,SMOTE-SVM、RU-SVM及RU-SMOTE-SVM模型中均引入了不平衡樣本處理方法,與單獨的SVM方法相比具有更高的預(yù)測效率,對SVM自身存在的不平衡樣本問題予以有效解決,出現(xiàn)的一類和二類錯誤較低。RU方式采取的是隨機采樣,存在大量的噪聲樣本,嚴(yán)重影響識別性能。而RU-SMOTE-SVM模型通過SMOTE人工合成新的樣本,通過RU方式將部分樣本中的噪聲及冗余信息消除,并充分借助了SVM尋找全局最優(yōu)解的能力,避免了簡單復(fù)制樣本造成的數(shù)據(jù)無效問題。四、結(jié)論本文在上市公司利潤操作識別模型構(gòu)建過程中引入了SVM智能技術(shù),其中融入RU-SMOTE不平衡樣本處理方法進(jìn)行傳統(tǒng)識別模型的優(yōu)化,形成改進(jìn)版的RU-SMOTE-SVM模型,有效克服不平衡樣本問題。同時,上市公司的利潤操作行為具有較強的隱蔽性,傳統(tǒng)的性能評估指標(biāo)無法滿足模型需求。所以,本文引入了效率指標(biāo),提高了模型的識別精度,并對模型的識別性能及識別結(jié)果的有效性進(jìn)行驗證,結(jié)果表明RBF核函數(shù)條件下構(gòu)建的模型識別性能最優(yōu),即一類、二類錯誤最低,對上市公司利?
疲?嚀邐??(1)對兩種合集所包含樣本的數(shù)量差異進(jìn)行計算,即|Sp|-|SNon-p|=|R|,將|R|/2個位發(fā)生利潤操作行為的樣本從中隨機剔除,獲得新的未發(fā)生利潤操作行為的樣本集合SNewNon-p。(2)對SNon-p中各樣本點中最近鄰的發(fā)生利潤操作行為的樣本進(jìn)行計算。同時,在原樣點的基礎(chǔ)上,加上用[0,1]之間的隨機乘數(shù)與原樣點和隨機選擇鄰點之間的差值的乘積,公式表示為XNew=XSNon-p+(XSNon-p-XSNon-p)*啄。在人工合成的新樣本數(shù)量達(dá)到|R|/2之前,與RU-SMOTE不平衡樣本處理方圖1SMOTE方法的樣例合成李增欣蒲凌:RU-SMOTE-SVM利潤操作識別模型構(gòu)建116
【參考文獻(xiàn)】:
期刊論文
[1]基于混合采樣的非平衡數(shù)據(jù)分類算法[J]. 吳藝凡,梁吉業(yè),王俊紅. 計算機科學(xué)與探索. 2019(02)
[2]基于聚類欠采樣的集成不均衡數(shù)據(jù)分類算法[J]. 武森,劉露,盧丹. 工程科學(xué)學(xué)報. 2017(08)
本文編號:3614813
【文章來源】:財會通訊. 2020,(22)北大核心
【文章頁數(shù)】:4 頁
【部分圖文】:
表2中,RBF為徑向基函數(shù),也簡稱為高斯函數(shù),用輸入模式與中心向量的距離作為函數(shù)的自變量,具有“局圖2RU-SMOTE-SVM模型在不同核函數(shù)下的上市公司利潤操作識別結(jié)果
真”的錯誤,拒絕了正確的、實際上成立的假設(shè),基于樣本統(tǒng)計量推斷其結(jié)論并非絕對正確,也可能存在錯誤;二類錯誤與第一類錯誤相對,是進(jìn)行假設(shè)檢驗時原假設(shè)不正確而接受原假設(shè)的錯誤。由圖2、表2可知,RBF核函數(shù)下的模型具有最低值,從準(zhǔn)確率方面分析則RBF核函數(shù)下的模型具有最高值。所以,與其他核函數(shù)下的模型相比,基于RBF構(gòu)建的RU-SMOTE-SVM模型性能更為優(yōu)異,能夠?qū)ι鲜泄镜睦麧櫜僮餍袨檫M(jìn)行有效識別。同時,本文進(jìn)一步將RU-SMOTE-SVM模型與傳統(tǒng)的SVM、SMOTE-SVM、RU-SVM模型進(jìn)行性能結(jié)果的對比,具體如表3、圖3所示,再次驗證RBF核函數(shù)下RU-SMOTE-SVM模型對上市公司利潤操作行為具有良好的識別性能。由圖3、表3可知,SMOTE-SVM、RU-SVM及RU-SMOTE-SVM模型中均引入了不平衡樣本處理方法,與單獨的SVM方法相比具有更高的預(yù)測效率,對SVM自身存在的不平衡樣本問題予以有效解決,出現(xiàn)的一類和二類錯誤較低。RU方式采取的是隨機采樣,存在大量的噪聲樣本,嚴(yán)重影響識別性能。而RU-SMOTE-SVM模型通過SMOTE人工合成新的樣本,通過RU方式將部分樣本中的噪聲及冗余信息消除,并充分借助了SVM尋找全局最優(yōu)解的能力,避免了簡單復(fù)制樣本造成的數(shù)據(jù)無效問題。四、結(jié)論本文在上市公司利潤操作識別模型構(gòu)建過程中引入了SVM智能技術(shù),其中融入RU-SMOTE不平衡樣本處理方法進(jìn)行傳統(tǒng)識別模型的優(yōu)化,形成改進(jìn)版的RU-SMOTE-SVM模型,有效克服不平衡樣本問題。同時,上市公司的利潤操作行為具有較強的隱蔽性,傳統(tǒng)的性能評估指標(biāo)無法滿足模型需求。所以,本文引入了效率指標(biāo),提高了模型的識別精度,并對模型的識別性能及識別結(jié)果的有效性進(jìn)行驗證,結(jié)果表明RBF核函數(shù)條件下構(gòu)建的模型識別性能最優(yōu),即一類、二類錯誤最低,對上市公司利?
疲?嚀邐??(1)對兩種合集所包含樣本的數(shù)量差異進(jìn)行計算,即|Sp|-|SNon-p|=|R|,將|R|/2個位發(fā)生利潤操作行為的樣本從中隨機剔除,獲得新的未發(fā)生利潤操作行為的樣本集合SNewNon-p。(2)對SNon-p中各樣本點中最近鄰的發(fā)生利潤操作行為的樣本進(jìn)行計算。同時,在原樣點的基礎(chǔ)上,加上用[0,1]之間的隨機乘數(shù)與原樣點和隨機選擇鄰點之間的差值的乘積,公式表示為XNew=XSNon-p+(XSNon-p-XSNon-p)*啄。在人工合成的新樣本數(shù)量達(dá)到|R|/2之前,與RU-SMOTE不平衡樣本處理方圖1SMOTE方法的樣例合成李增欣蒲凌:RU-SMOTE-SVM利潤操作識別模型構(gòu)建116
【參考文獻(xiàn)】:
期刊論文
[1]基于混合采樣的非平衡數(shù)據(jù)分類算法[J]. 吳藝凡,梁吉業(yè),王俊紅. 計算機科學(xué)與探索. 2019(02)
[2]基于聚類欠采樣的集成不均衡數(shù)據(jù)分類算法[J]. 武森,劉露,盧丹. 工程科學(xué)學(xué)報. 2017(08)
本文編號:3614813
本文鏈接:http://sikaile.net/jingjilunwen/touziyanjiulunwen/3614813.html
最近更新
教材專著