基于數(shù)據(jù)挖掘技術(shù)的上市公司財務(wù)舞弊識別研究
本文選題:財務(wù)舞弊識別 + 數(shù)據(jù)挖掘�。� 參考:《杭州電子科技大學(xué)》2013年碩士論文
【摘要】:進入21世紀以來,世界各國的上市公司數(shù)量都在飛速增長。以A股為例,從2002年到2012年這十年間,A股的上市公司數(shù)量從1138家增長到2472家,翻了一倍。在這些成功上市或正準備上市的公司中,大多數(shù)都是希望通過上市的方式來獲得更多的社會資源并最終以此提高自己在整個市場中的競爭力,但是也有部分公司因為各種各樣的動機通過財務(wù)舞弊來謀取一些不正當?shù)睦�。這部分上市公司的財務(wù)舞弊行為對證券市場的各個參與者都有著重大影響。對于投資者來說,如果根據(jù)存在舞弊跡象的財務(wù)報告對相關(guān)上市公司做出了錯誤的投資,勢必會造成損失。對于監(jiān)管層來說,保證公開透明的證券市場環(huán)境是其本職工作,若對舞弊行為不加以制止,則會降低證券市場的資源配置效率甚至?xí)斐勺C券市場的混亂。對于其他相關(guān)者,虛假的財務(wù)報告會使得利益相關(guān)者無法準確清晰的了解公司實際經(jīng)營狀況進而無法做出正確決策。正因如此,研究出能夠有效識別上市公司財務(wù)舞弊行為的方法就變得很有實際意義。 本文在對上市公司財務(wù)舞弊相關(guān)理論深入理解的基礎(chǔ)上,綜合利用數(shù)據(jù)挖掘技術(shù)對2000-2008年的有舞弊跡象的上市公司及相應(yīng)的控制樣本建立模型。本文的研究成果體現(xiàn)在兩個方面,一方面是通過特征選擇結(jié)果得出對上市公司舞弊行為影響最大的幾個指標,從而根據(jù)這幾大指標對如何防止舞弊提出相應(yīng)的建議;另一方面是通過對備選模型的建模效果進行比較,找出最適合這一問題的模型。論文的思路如下: 首先,闡述財務(wù)舞弊的概念和動因、數(shù)據(jù)挖掘的產(chǎn)生背景等相關(guān)理論,并對文章所使用的數(shù)據(jù)挖掘工具R語言進行了介紹。 然后,結(jié)合財務(wù)舞弊動因理論,初選了22個與財務(wù)舞弊行為相關(guān)的指標。通過Relief和信息增益這兩種特征選擇算法對2000-2008年的舞弊公司與控制樣本進行指標篩選。綜合兩種特征選擇算法的結(jié)果,對財務(wù)舞弊行為影響最大的幾個指標分別為資產(chǎn)負債率、資產(chǎn)報酬率、應(yīng)收賬款周轉(zhuǎn)率、銷售期間費用率和流動資產(chǎn)周轉(zhuǎn)率。 其次,經(jīng)過Relief和信息增益兩種特征選擇算法篩選后的指標組合與未經(jīng)指標篩選的原22個指標組合總共形成了三個數(shù)據(jù)集。將這三個數(shù)據(jù)集與最近鄰、樸素貝葉斯和隨機森林這3種具有代表性的數(shù)據(jù)挖掘算法相結(jié)合建立模型。在多種評價方法評價之后,發(fā)現(xiàn)預(yù)測效果最優(yōu)的為經(jīng)過信息增益算法篩選后的指標組合與最近鄰算法結(jié)合的模型。 再次,考慮到所得的信息增益與最近鄰算法結(jié)合的模型在舞弊公司的查全率上依然不盡如人意。將代價敏感學(xué)習(xí)引入到模型組合中,并提出了一種基于代價敏感學(xué)習(xí)的隨機森林算法。該算法在測試集的舞弊公司查全率上達到89%,大大提高了整個舞弊識別模型的效果。 最后,結(jié)論部分從經(jīng)過特征選擇選擇后的指標和模型應(yīng)用兩方面對全文進行了總結(jié),,并對進一步規(guī)范我國上市公司的行為給出了一定的建議。
[Abstract]:Since twenty-first Century, the number of Listed Companies in the world has been growing rapidly. In the ten years from 2002 to 2012, for example, the number of Listed Companies in A shares has doubled from 1138 to 2472, doubling the number of companies that have successfully listed or are ready to go on the market, most of which are expected to get more by the way of listing. Social resources and ultimately improve their competitiveness in the whole market, but there are also some companies who make some unjustified interests through financial fraud for all kinds of motives. The financial fraud of this part of the listed company has a significant impact on the various participants in the stock market. For investors, if According to the financial reports of the signs of fraud, they make the wrong investment to the related listed companies. It is bound to cause loss. For the regulators, it is its job to ensure the open and transparent securities market environment. If the fraud is not stopped, it will reduce the efficiency of the resource allocation of the stock market and even cause the mix of the stock market. For others, false financial reports can make it impossible for the stakeholders to understand the actual situation of the company and make the right decision.
On the basis of in-depth understanding of the related theories of financial fraud of listed companies, this paper makes a comprehensive use of data mining technology to set up a model for 2000-2008 years of listed companies with signs of fraud and corresponding control samples. The research results of this paper are embodied in two aspects, on the one hand, through the results of characteristic selection, the fraud of the listed companies is obtained. In order to influence the most important indexes, the corresponding suggestions on how to prevent fraud are put forward according to these major indexes; on the other hand, by comparing the modeling effect of the alternative model, the model which is most suitable for this problem is found.
First, it expounds the concept and motivation of financial fraud, the background of data mining and other related theories, and introduces the data mining tool R language used in the article.
Then, combined with the theory of financial fraud motivation, 22 indexes related to financial fraud are selected. Through the two characteristic selection algorithms of Relief and information gain, 2000-2008 years of fraud companies and control samples are selected. The results of comprehensive two feature selection algorithms have the greatest impact on financial frauds. It should not be assets liability ratio, assets return rate, accounts receivable turnover rate, sales period cost rate and current assets turnover rate.
Secondly, a total of three data sets are formed by the combination of two feature selection algorithms selected by the Relief and information gain selection algorithm and the original 22 index combinations without index selection. The three data sets are combined with the nearest neighbor, simple Bias and random forest, which are combined with 3 representative data mining algorithms to establish a model. After the evaluation of the price method, it is found that the best prediction result is the combination of the index combination and the nearest neighbor algorithm after the information gain algorithm is selected.
Thirdly, considering the information gain combined with the nearest neighbor algorithm is still unsatisfactory in the recall company's recall rate, the cost sensitive learning is introduced into the model combination, and a stochastic forest algorithm based on cost sensitive learning is proposed. The algorithm has reached 89% on the recall rate of the fraud company of the test set, which is greatly raised. The effect of the entire fraud identification model is higher.
Finally, the conclusion is summed up in the conclusion of the full text from two parties after the selection of features and models, and gives some suggestions for further standardizing the behavior of the listed companies in China.
【學(xué)位授予單位】:杭州電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:F275;F224;F276.6
【相似文獻】
相關(guān)期刊論文 前10條
1 黃新建;;中國上市公司財務(wù)舞弊方式及對策研究[J];經(jīng)濟經(jīng)緯;2006年04期
2 黃新建;李若山;;中國上市公司財務(wù)舞弊成因分析[J];生產(chǎn)力研究;2006年08期
3 徐文麗;;上市公司財務(wù)舞弊與企業(yè)內(nèi)部控制研究[J];山西大學(xué)學(xué)報(哲學(xué)社會科學(xué)版);2007年04期
4 明洪盛;;財務(wù)報表舞弊的表現(xiàn)方式與形成原因分析[J];科技創(chuàng)業(yè)月刊;2007年09期
5 黃新建;吳江;付利;;治理中國上市公司財務(wù)舞弊行為的對策研究[J];生產(chǎn)力研究;2007年15期
6 張佩;;基于博弈論的上市公司財務(wù)舞弊行為分析[J];黑龍江科技信息;2009年09期
7 李永泉;李婧華;;上市公司財務(wù)舞弊手段及其對策研究[J];科技咨詢導(dǎo)報;2007年18期
8 閆俊瑜;;上市公司財務(wù)舞弊行為芻議[J];山西財政稅務(wù)�?茖W(xué)校學(xué)報;2009年02期
9 田亞平;;基于信號識別的財務(wù)舞弊研究[J];中國集體經(jīng)濟;2011年18期
10 姚烽;;淺析財務(wù)舞弊的鑒別[J];海峽科學(xué);2007年10期
相關(guān)會議論文 前10條
1 廖雪潔;劉漢民;;壟斷國企高管薪酬現(xiàn)狀分析——基于我國上市公司的數(shù)據(jù)[A];第五屆(2010)中國管理學(xué)年會——公司治理分會場論文集[C];2010年
2 葉華;;上市公司財務(wù)信息披露及時性研究——基于我國上市公司數(shù)據(jù)的實證分析[A];中國會計學(xué)會財務(wù)管理專業(yè)委員會2009年學(xué)術(shù)年會論文集[C];2009年
3 劉瑞武;余漱峰;;基于因特網(wǎng)的上市公司投資者關(guān)系管理[A];第九屆全國會計信息化年會論文集(上)[C];2010年
4 黃少安;鐘衛(wèi)東;;股權(quán)融資成本軟約束假說與股權(quán)融資偏好——對中國公司股權(quán)融資偏好的進一步解釋[A];2010年(第十屆)中國制度經(jīng)濟學(xué)年會論文集[C];2010年
5 曹汛;;淺談上市公司的內(nèi)部審計[A];對外經(jīng)貿(mào)財會論文選第十五輯[C];2003年
6 浙江省內(nèi)審協(xié)會課題組;;上市公司內(nèi)部審計研究[A];石油杯全國上市公司內(nèi)部審計理論研討會暨經(jīng)驗交流論文匯編[C];2003年
7 ;上市公司內(nèi)審工作的思考[A];石油杯全國上市公司內(nèi)部審計理論研討會暨經(jīng)驗交流論文匯編[C];2003年
8 金山;陳盈如;;上市公司并購重組中法律與財務(wù)會計對接評析[A];第三屆中國律師論壇論文集(實務(wù)卷)[C];2003年
9 徐向藝;陳振華;馬磊;;上市公司關(guān)聯(lián)交易的經(jīng)濟學(xué)分析及其規(guī)制[A];中國工業(yè)經(jīng)濟研究與開發(fā)促進會2005年會暨“產(chǎn)業(yè)組織與政府規(guī)制”研討會論文集[C];2005年
10 何麗梅;劉曉春;;股權(quán)分置改革對上市公司財務(wù)管理目標的影響分析[A];中國會計學(xué)會高等工科院校分會2005年學(xué)術(shù)年會暨第十二屆年會論文集[C];2005年
相關(guān)重要報紙文章 前10條
1 本版編輯 證券時報記者 陳霞 何雨華 申草 曉河;證券市場的“第四只眼”[N];證券時報;2006年
2 鐘君君;做“熊市終結(jié)者”[N];第一財經(jīng)日報;2006年
3 王大力;上市公司2005年度十大現(xiàn)金舞弊排行榜[N];第一財經(jīng)日報;2006年
4 駐京記者 宋華;業(yè)界人士熱議“申草現(xiàn)象”[N];深圳商報;2006年
5 證券時報兩會報道組;加強對上市公司大股東和高管監(jiān)管[N];證券時報;2008年
6 徐曉巍;夏草 無奈的“財務(wù)殺手”[N];中國證券報;2008年
7 陳蓉;夏草:除非澄清,否則我不會停止揭黑[N];證券日報;2008年
8 謝嵐;財政部會計司司長:夏草所述情況皆在掌握中[N];證券日報;2008年
9 侯捷寧;對上市公司財務(wù)舞弊等行為將依法嚴肅處理[N];證券日報;2008年
10 馮玉華 執(zhí)筆:程才良 溫科銀;全流通時代大股東行為及監(jiān)管對策研究[N];上海證券報;2006年
相關(guān)博士學(xué)位論文 前10條
1 潘麗春;中國上市公司并購價值影響因素和演進路徑的實證研究[D];浙江大學(xué);2005年
2 鞏娜;上市公司管理者股權(quán)激勵研究[D];吉林大學(xué);2009年
3 夢然;公司法人治理結(jié)構(gòu)研究[D];南京理工大學(xué);2002年
4 何旭;上市公司股權(quán)結(jié)構(gòu)與經(jīng)營績效研究[D];東北林業(yè)大學(xué);2003年
5 李緒富;我國上市公司重塑研究[D];復(fù)旦大學(xué);2003年
6 吳琳芳;中國上市公司會計信息披露研究[D];西北農(nóng)林科技大學(xué);2004年
7 楊柏;上市公司信息披露監(jiān)控機制研究[D];重慶大學(xué);2004年
8 李丹;我國上市公司發(fā)展規(guī)模的實證研究[D];華中科技大學(xué);2004年
9 李清;我國上市公司盈余管理的理論與實證研究[D];武漢理工大學(xué);2008年
10 杜曉宇;中國上市公司高管變更期間業(yè)績預(yù)告披露行為研究[D];吉林大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 趙功;上市公司財務(wù)舞弊手段及成因分析[D];云南大學(xué);2012年
2 賀穎;基于偏最小二乘法—支持向量機的上市公司財務(wù)舞弊識別模型研究[D];石河子大學(xué);2010年
3 李臣臣;基于數(shù)據(jù)挖掘的上市公司財務(wù)舞弊的關(guān)聯(lián)規(guī)則研究[D];吉林大學(xué);2011年
4 賀金玲;我國上市公司董事會特征與會計信息披露質(zhì)量的實證研究[D];西南財經(jīng)大學(xué);2011年
5 朱玲;上市公司財務(wù)舞弊行為研究[D];華中科技大學(xué);2007年
6 姚致萱;決策樹技術(shù)在上市公司財務(wù)報告舞弊識別中的應(yīng)用研究[D];天津財經(jīng)大學(xué);2010年
7 蔣妍;我國上市公司財務(wù)舞弊治理研究[D];黑龍江八一農(nóng)墾大學(xué);2008年
8 于慧琴;我國上市公司財務(wù)舞弊問題研究[D];南京理工大學(xué);2008年
9 富國海;我國上市公司財務(wù)舞弊成因及治理研究[D];東北財經(jīng)大學(xué);2007年
10 韓笑;股權(quán)分置改革后我國上市公司現(xiàn)金股利分配與公司績效的實證分析[D];東北財經(jīng)大學(xué);2011年
本文編號:1793199
本文鏈接:http://sikaile.net/jingjilunwen/jinrongzhengquanlunwen/1793199.html