基于情感分析的上市公司年報(bào)舞弊預(yù)警研究
發(fā)布時(shí)間:2021-08-14 21:38
上市公司年度報(bào)告作為反映企業(yè)經(jīng)營(yíng)情況的權(quán)威發(fā)布文件,相比于其他輿論信息更加正式,給讀者帶來(lái)視覺(jué)匿名感,內(nèi)含大量的主觀性文本。主觀性文本內(nèi)容可操縱性強(qiáng),在描述時(shí)可能存在過(guò)度美化、避重就輕等情況,在實(shí)際監(jiān)管中,如果管理者有意隱瞞或會(huì)計(jì)作假,在文本部分可能存在異于往常的情感變化,將在一定程度上誤導(dǎo)投資者的決策判斷。因此,對(duì)這部分文本進(jìn)行情感分析,對(duì)于觸發(fā)財(cái)務(wù)審計(jì)具有很好的預(yù)警作用。由于文本的非結(jié)構(gòu)化特性,分析難度更大,財(cái)務(wù)審計(jì)人員使用常規(guī)的分析方法不能準(zhǔn)確的挖掘文本信息。因此,本文以年報(bào)為研究對(duì)象,利用人工智能技術(shù)挖掘披露報(bào)告的情感信息,探究其在舞弊檢測(cè)方面的影響。具體研究?jī)?nèi)容如下:(1)基于語(yǔ)義的上市公司年報(bào)文本情感分析研究。該研究結(jié)合語(yǔ)料庫(kù)和知識(shí)庫(kù)的特點(diǎn),借助通用情感詞典自動(dòng)標(biāo)引訓(xùn)練語(yǔ)料,利用詞向量的方法判別報(bào)告中候選情感詞的極性,結(jié)合權(quán)威的金融詞典構(gòu)建了面向年報(bào)的中文情感詞典,通過(guò)匹配語(yǔ)義規(guī)則實(shí)現(xiàn)篇章級(jí)年報(bào)文本的情感分析。(2)基于深度學(xué)習(xí)的細(xì)粒度年報(bào)文本情感分析研究。該研究采用人工標(biāo)注的數(shù)據(jù)集,引入BERT預(yù)訓(xùn)練模型實(shí)現(xiàn)年報(bào)文本句子的向量化表達(dá),以解決目前其他語(yǔ)言模型不能有效考慮上下...
【文章來(lái)源】:東北林業(yè)大學(xué)黑龍江省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1網(wǎng)絡(luò)爬蟲(chóng)的一般流程??
句子B,通過(guò)模型訓(xùn)練來(lái)判定句子B是否是句子A的下一??句。訓(xùn)練過(guò)程如下:??(1)利用預(yù)訓(xùn)練的語(yǔ)料構(gòu)造訓(xùn)練集,其中50%的樣本,句子A和句子B是上下文的??關(guān)系,將這類(lèi)樣本標(biāo)簽記為“IsNext”。??(2)另外50%的樣本,句子B是隨機(jī)從語(yǔ)料庫(kù)中抽取的,與A無(wú)上下文關(guān)系,將這??類(lèi)樣本標(biāo)簽記為“NotNext”。??(3)將句子A與句子B拼接后輸入預(yù)訓(xùn)練的模型,利用“[CLS]”標(biāo)記每一次輸入的??樣本,最后利用[CLS]對(duì)應(yīng)的輸出向量來(lái)預(yù)測(cè)標(biāo)簽的類(lèi)別。??BERT模型的結(jié)構(gòu)如圖2-3所示。??Tl?。?...?Tn??Transformer?Transfomier?...?Transformer??Transformer?Transformer?…?Transformer??E.?E:?…?En??圖2-3?BERT預(yù)訓(xùn)練語(yǔ)言模型【42]??BERT模型采用雙向Transformer作為特征抽取器,通過(guò)查詢(xún)字向量表將文本的每個(gè)字??符轉(zhuǎn)換為向量作為模型的輸入,輸入字符對(duì)應(yīng)的融合全文語(yǔ)義信息后的向量表示則為模型的??輸出。特別的是,BERT模型的輸入除了字符向量(Token?Embeddings)還包括文本向量??-12-??
d&Norm?—??"?I?I??x.?,?"?j^f?Masked?^??MAUl"-Head?Mulf-Head??Attention?A??、?Attention?^??-??J?L?/??Positional?^?4?Positional??Econding?W?Econding??^?Input?Embedding〕?^?Output?Embedding??^r^.’?————「:??Inputs?Outputs??圖24?Transformer模型結(jié)構(gòu)圖??作為-種雙向模型,Transformer的編碼器摒棄了傳統(tǒng)的CNN和RNN的祌經(jīng)網(wǎng)絡(luò)結(jié)??構(gòu),僅使用自注意力機(jī)制,能夠一次性地從前往后或者從后往前來(lái)獲取輸入義本序列的所冇??信息。Transformer的網(wǎng)絡(luò)結(jié)構(gòu)特征使得模型可以利用某一詞周?chē)乃鶅游哪巨r(nóng)進(jìn)行丨:K文??的學(xué)習(xí)可并行捕獲長(zhǎng)距離依賴(lài)關(guān)系,且運(yùn)算速度快。??由于生成語(yǔ)言模型并不需要Transformer中解H器的部分,閃此BERT模型進(jìn)行語(yǔ)言建??模只需要Transformer中作為特征抽取器的編朽部分,由多個(gè)Transformer模型的編碼器結(jié)??構(gòu)堆疊形成。Transformer的編碼器部分將字符向量和位置向量直接加和作為輸入,經(jīng)過(guò)多??-13-??
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的APP-Store評(píng)論情感分析[J]. 李鑫,李曉戈. 計(jì)算機(jī)與數(shù)字工程. 2019(10)
[2]基于情感詞典的課程評(píng)論情感分析[J]. 胡榮,崔榮一,趙亞慧. 延邊大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(02)
[3]基于深度學(xué)習(xí)的中英文混合短文本情感分析[J]. 龔澤陽(yáng),徐華韞,何正杰,崔金真,吳珂. 信息與電腦(理論版). 2019(05)
[4]基于機(jī)器學(xué)習(xí)與情感詞典的文本主題概括及情感分析[J]. 宋祖康,閻瑞霞,辜麗瓊. 軟件導(dǎo)刊. 2019(04)
[5]基于深度神經(jīng)網(wǎng)絡(luò)和LSTM的文本情感分析[J]. 王子牛,吳建華,高建瓴,陳婭先,王許. 軟件. 2018(12)
[6]基于CNN和BiLSTM網(wǎng)絡(luò)特征融合的文本情感分析[J]. 李洋,董紅斌. 計(jì)算機(jī)應(yīng)用. 2018(11)
[7]基于卷積神經(jīng)網(wǎng)絡(luò)與多特征融合的Twitter情感分類(lèi)方法[J]. 王汝嬌,姬東鴻. 計(jì)算機(jī)工程. 2018(02)
[8]細(xì)粒度情感分析研究綜述[J]. 唐曉波,劉廣超. 圖書(shū)情報(bào)工作. 2017(05)
[9]會(huì)計(jì)舞弊的財(cái)務(wù)預(yù)警分析[J]. 羅昕煒,彭茜. 行政事業(yè)資產(chǎn)與財(cái)務(wù). 2017(10)
[10]常用中文分詞軟件在中醫(yī)文本文獻(xiàn)研究領(lǐng)域的適用性研究[J]. 楊海豐,陳明亮,趙臻. 世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化. 2017(03)
碩士論文
[1]基于情感分析的旅游景點(diǎn)推薦[D]. 何雪琴.新疆大學(xué) 2019
[2]基于域?qū)咕W(wǎng)絡(luò)的跨領(lǐng)域文本情感分析[D]. 林強(qiáng).桂林電子科技大學(xué) 2019
[3]產(chǎn)品評(píng)論文本的情感分析方法研究[D]. 原多多.蘭州財(cái)經(jīng)大學(xué) 2019
[4]管理層討論與分析的語(yǔ)言特征和企業(yè)未來(lái)業(yè)績(jī)關(guān)系研究[D]. 李勝男.哈爾濱工業(yè)大學(xué) 2018
[5]情感分析方法在金融語(yǔ)料庫(kù)中的應(yīng)用[D]. 張道玲.暨南大學(xué) 2018
[6]詞向量的改進(jìn)及其在作品風(fēng)格識(shí)別中的應(yīng)用[D]. 王賀.大連理工大學(xué) 2018
[7]企業(yè)財(cái)務(wù)舞弊特征與審計(jì)方法研究[D]. 龍鳳.西南財(cái)經(jīng)大學(xué) 2012
本文編號(hào):3343231
【文章來(lái)源】:東北林業(yè)大學(xué)黑龍江省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1網(wǎng)絡(luò)爬蟲(chóng)的一般流程??
句子B,通過(guò)模型訓(xùn)練來(lái)判定句子B是否是句子A的下一??句。訓(xùn)練過(guò)程如下:??(1)利用預(yù)訓(xùn)練的語(yǔ)料構(gòu)造訓(xùn)練集,其中50%的樣本,句子A和句子B是上下文的??關(guān)系,將這類(lèi)樣本標(biāo)簽記為“IsNext”。??(2)另外50%的樣本,句子B是隨機(jī)從語(yǔ)料庫(kù)中抽取的,與A無(wú)上下文關(guān)系,將這??類(lèi)樣本標(biāo)簽記為“NotNext”。??(3)將句子A與句子B拼接后輸入預(yù)訓(xùn)練的模型,利用“[CLS]”標(biāo)記每一次輸入的??樣本,最后利用[CLS]對(duì)應(yīng)的輸出向量來(lái)預(yù)測(cè)標(biāo)簽的類(lèi)別。??BERT模型的結(jié)構(gòu)如圖2-3所示。??Tl?。?...?Tn??Transformer?Transfomier?...?Transformer??Transformer?Transformer?…?Transformer??E.?E:?…?En??圖2-3?BERT預(yù)訓(xùn)練語(yǔ)言模型【42]??BERT模型采用雙向Transformer作為特征抽取器,通過(guò)查詢(xún)字向量表將文本的每個(gè)字??符轉(zhuǎn)換為向量作為模型的輸入,輸入字符對(duì)應(yīng)的融合全文語(yǔ)義信息后的向量表示則為模型的??輸出。特別的是,BERT模型的輸入除了字符向量(Token?Embeddings)還包括文本向量??-12-??
d&Norm?—??"?I?I??x.?,?"?j^f?Masked?^??MAUl"-Head?Mulf-Head??Attention?A??、?Attention?^??-??J?L?/??Positional?^?4?Positional??Econding?W?Econding??^?Input?Embedding〕?^?Output?Embedding??^r^.’?————「:??Inputs?Outputs??圖24?Transformer模型結(jié)構(gòu)圖??作為-種雙向模型,Transformer的編碼器摒棄了傳統(tǒng)的CNN和RNN的祌經(jīng)網(wǎng)絡(luò)結(jié)??構(gòu),僅使用自注意力機(jī)制,能夠一次性地從前往后或者從后往前來(lái)獲取輸入義本序列的所冇??信息。Transformer的網(wǎng)絡(luò)結(jié)構(gòu)特征使得模型可以利用某一詞周?chē)乃鶅游哪巨r(nóng)進(jìn)行丨:K文??的學(xué)習(xí)可并行捕獲長(zhǎng)距離依賴(lài)關(guān)系,且運(yùn)算速度快。??由于生成語(yǔ)言模型并不需要Transformer中解H器的部分,閃此BERT模型進(jìn)行語(yǔ)言建??模只需要Transformer中作為特征抽取器的編朽部分,由多個(gè)Transformer模型的編碼器結(jié)??構(gòu)堆疊形成。Transformer的編碼器部分將字符向量和位置向量直接加和作為輸入,經(jīng)過(guò)多??-13-??
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的APP-Store評(píng)論情感分析[J]. 李鑫,李曉戈. 計(jì)算機(jī)與數(shù)字工程. 2019(10)
[2]基于情感詞典的課程評(píng)論情感分析[J]. 胡榮,崔榮一,趙亞慧. 延邊大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(02)
[3]基于深度學(xué)習(xí)的中英文混合短文本情感分析[J]. 龔澤陽(yáng),徐華韞,何正杰,崔金真,吳珂. 信息與電腦(理論版). 2019(05)
[4]基于機(jī)器學(xué)習(xí)與情感詞典的文本主題概括及情感分析[J]. 宋祖康,閻瑞霞,辜麗瓊. 軟件導(dǎo)刊. 2019(04)
[5]基于深度神經(jīng)網(wǎng)絡(luò)和LSTM的文本情感分析[J]. 王子牛,吳建華,高建瓴,陳婭先,王許. 軟件. 2018(12)
[6]基于CNN和BiLSTM網(wǎng)絡(luò)特征融合的文本情感分析[J]. 李洋,董紅斌. 計(jì)算機(jī)應(yīng)用. 2018(11)
[7]基于卷積神經(jīng)網(wǎng)絡(luò)與多特征融合的Twitter情感分類(lèi)方法[J]. 王汝嬌,姬東鴻. 計(jì)算機(jī)工程. 2018(02)
[8]細(xì)粒度情感分析研究綜述[J]. 唐曉波,劉廣超. 圖書(shū)情報(bào)工作. 2017(05)
[9]會(huì)計(jì)舞弊的財(cái)務(wù)預(yù)警分析[J]. 羅昕煒,彭茜. 行政事業(yè)資產(chǎn)與財(cái)務(wù). 2017(10)
[10]常用中文分詞軟件在中醫(yī)文本文獻(xiàn)研究領(lǐng)域的適用性研究[J]. 楊海豐,陳明亮,趙臻. 世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化. 2017(03)
碩士論文
[1]基于情感分析的旅游景點(diǎn)推薦[D]. 何雪琴.新疆大學(xué) 2019
[2]基于域?qū)咕W(wǎng)絡(luò)的跨領(lǐng)域文本情感分析[D]. 林強(qiáng).桂林電子科技大學(xué) 2019
[3]產(chǎn)品評(píng)論文本的情感分析方法研究[D]. 原多多.蘭州財(cái)經(jīng)大學(xué) 2019
[4]管理層討論與分析的語(yǔ)言特征和企業(yè)未來(lái)業(yè)績(jī)關(guān)系研究[D]. 李勝男.哈爾濱工業(yè)大學(xué) 2018
[5]情感分析方法在金融語(yǔ)料庫(kù)中的應(yīng)用[D]. 張道玲.暨南大學(xué) 2018
[6]詞向量的改進(jìn)及其在作品風(fēng)格識(shí)別中的應(yīng)用[D]. 王賀.大連理工大學(xué) 2018
[7]企業(yè)財(cái)務(wù)舞弊特征與審計(jì)方法研究[D]. 龍鳳.西南財(cái)經(jīng)大學(xué) 2012
本文編號(hào):3343231
本文鏈接:http://sikaile.net/guanlilunwen/bankxd/3343231.html
最近更新
教材專(zhuān)著