語(yǔ)義角色標(biāo)注技術(shù)研究及在金融信息提取中的應(yīng)用
發(fā)布時(shí)間:2021-11-23 15:52
由于近些年來(lái)計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)通信技術(shù)的高速發(fā)展,人們對(duì)自然語(yǔ)言處理相關(guān)技術(shù)的需求越來(lái)越大。人們希望通過(guò)使用自然語(yǔ)言技術(shù)來(lái)對(duì)大量的文本進(jìn)行處理以更加快速的得到有用的信息。中文信息處理是自然語(yǔ)言處理的一個(gè)重要的分支,在基礎(chǔ)理論研究和技術(shù)開(kāi)發(fā)應(yīng)用方面獲得了顯著的成果。語(yǔ)義角色標(biāo)注作為淺層語(yǔ)義分析的一種簡(jiǎn)單實(shí)現(xiàn),是自然語(yǔ)言處理任務(wù)的一種,而近些年來(lái)隨著深度學(xué)習(xí)技術(shù)的流行,在自然語(yǔ)言處理任務(wù)中使用深度學(xué)習(xí)技術(shù)成為了一種趨勢(shì)。在當(dāng)前自然語(yǔ)言處理領(lǐng)域,基于長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory)的深度學(xué)習(xí)算法適用于處理較長(zhǎng)的序列并能學(xué)習(xí)到序列中長(zhǎng)距離的依賴信息。并有效緩解RNN中會(huì)出現(xiàn)的梯度消失和梯度爆炸的問(wèn)題,因此特別適合處理文本信息。本文主要使用了雙向LSTM的神經(jīng)網(wǎng)絡(luò)模型并結(jié)合CRF(條件隨機(jī)場(chǎng))來(lái)作為本文的語(yǔ)義角色標(biāo)注模型,來(lái)對(duì)本文所使用的金融語(yǔ)料進(jìn)行標(biāo)注,得到F1的最佳值為71.65%。本文主要的做的工作如下:一,選用賓州大學(xué)中文語(yǔ)料庫(kù)中的金融相關(guān)語(yǔ)料,確定了18類語(yǔ)義角色標(biāo)簽,并對(duì)語(yǔ)料進(jìn)行預(yù)處理。二、構(gòu)建以詞向量為輸入的Bi-LSTM網(wǎng)絡(luò)結(jié)合CRF作為語(yǔ)義角色模型:...
【文章來(lái)源】:南昌大學(xué)江西省 211工程院校
【文章頁(yè)數(shù)】:52 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
CPB標(biāo)注語(yǔ)句實(shí)例
許多任務(wù)上取得了成功,相表現(xiàn)。但是傳統(tǒng)的神經(jīng)網(wǎng)路這樣的網(wǎng)絡(luò)結(jié)構(gòu)稱作前饋神,因?yàn)樗鼰o(wú)法處理數(shù)據(jù)之間后關(guān)聯(lián)性往往也包含了重要就需要前面單詞的信息,有網(wǎng)絡(luò)卻不能利用這種信息。N 這種模型的工作方式更接前文內(nèi)容的基礎(chǔ)上來(lái)推斷下定向循環(huán),它將上一時(shí)刻隱的輸入,使得模型可以直接了信息的持久化。RNN 結(jié)構(gòu)
圖 2.3 RNN 按時(shí)間步展開(kāi)圖展開(kāi)后的 RNN 結(jié)構(gòu)與前饋神經(jīng)網(wǎng)絡(luò)很類似,但是其中的隱藏層的權(quán)值類似于卷積神經(jīng)網(wǎng)絡(luò)中的濾波器的權(quán)值在不同時(shí)間步是共享的,隱層結(jié)構(gòu) A 稱為循環(huán)體。循環(huán)體 A 是模型運(yùn)算的關(guān)鍵,對(duì)于 RNN 的改進(jìn)也都是通過(guò)改進(jìn)循環(huán)體 A的內(nèi)部結(jié)構(gòu)。下面圖 2.4 展示了循環(huán)體的內(nèi)部結(jié)構(gòu)。圖 2.4 RNN 內(nèi)部循環(huán)體結(jié)構(gòu)圖
【參考文獻(xiàn)】:
期刊論文
[1]基于LSTM網(wǎng)絡(luò)的序列標(biāo)注中文分詞法[J]. 任智慧,徐浩煜,封松林,周晗,施俊. 計(jì)算機(jī)應(yīng)用研究. 2017(05)
[2]篇章分析技術(shù)綜述[J]. 徐凡,朱巧明,周國(guó)棟. 中文信息學(xué)報(bào). 2013(03)
[3]基于依存特征的漢語(yǔ)框架語(yǔ)義角色自動(dòng)標(biāo)注[J]. 王智強(qiáng),李茹,陰志洲,劉海靜,李雙紅. 中文信息學(xué)報(bào). 2013(02)
[4]基于SVM和擴(kuò)展條件隨機(jī)場(chǎng)的Web實(shí)體活動(dòng)抽取[J]. 張傳巖,洪曉光,彭朝暉,李慶忠. 軟件學(xué)報(bào). 2012(10)
[5]基于依存樹(shù)距離識(shí)別論元的語(yǔ)義角色標(biāo)注系統(tǒng)[J]. 王鑫,穗志方. 中文信息學(xué)報(bào). 2012(02)
[6]中文名詞性謂詞語(yǔ)義角色標(biāo)注[J]. 李軍輝,周國(guó)棟,朱巧明,錢培德. 軟件學(xué)報(bào). 2011(08)
[7]基于特征組合的中文語(yǔ)義角色標(biāo)注[J]. 李世奇,趙鐵軍,李晗靜,劉鵬遠(yuǎn),劉水. 軟件學(xué)報(bào). 2011(02)
[8]基于樹(shù)狀條件隨機(jī)場(chǎng)模型的語(yǔ)義角色標(biāo)注[J]. 李明,王亞斌,張其文,王旭陽(yáng). 計(jì)算機(jī)工程. 2010(18)
[9]基于最大熵模型的語(yǔ)義角色標(biāo)注[J]. 于江德,王希杰,余正濤. 微電子學(xué)與計(jì)算機(jī). 2010(08)
[10]基于依存樹(shù)的中文語(yǔ)義角色標(biāo)注[J]. 安強(qiáng)強(qiáng),張蕾. 計(jì)算機(jī)工程. 2010(04)
博士論文
[1]基于核方法的語(yǔ)義角色標(biāo)注研究[D]. 車萬(wàn)翔.哈爾濱工業(yè)大學(xué) 2008
碩士論文
[1]基于LSTM的漢語(yǔ)語(yǔ)義角色標(biāo)注研究[D]. 鄭亞楠.西藏大學(xué) 2017
[2]基于LSTM的語(yǔ)義關(guān)系分類研究[D]. 胡新辰.哈爾濱工業(yè)大學(xué) 2015
[3]基于依存圖的中文語(yǔ)義分析[D]. 丁宇.哈爾濱工業(yè)大學(xué) 2014
[4]基于依存樹(shù)核函數(shù)的語(yǔ)義角色標(biāo)注研究[D]. 王步康.蘇州大學(xué) 2012
[5]基于聯(lián)合方法的中文語(yǔ)義角色標(biāo)注研究[D]. 王文學(xué).上海交通大學(xué) 2012
[6]基于特征的中文名詞性謂詞語(yǔ)義角色標(biāo)注研究[D]. 徐靖.蘇州大學(xué) 2011
[7]基于條件場(chǎng)的語(yǔ)義角色標(biāo)注[D]. 顏廷義.北京郵電大學(xué) 2010
[8]基于結(jié)構(gòu)學(xué)習(xí)的語(yǔ)義角色標(biāo)注[D]. 白雪.北京郵電大學(xué) 2010
[9]基于依存分析的語(yǔ)義角色標(biāo)注研究[D]. 汪紅林.蘇州大學(xué) 2009
[10]基于條件隨機(jī)場(chǎng)的自動(dòng)分詞技術(shù)的研究[D]. 陳晴.東北大學(xué) 2005
本文編號(hào):3514202
【文章來(lái)源】:南昌大學(xué)江西省 211工程院校
【文章頁(yè)數(shù)】:52 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
CPB標(biāo)注語(yǔ)句實(shí)例
許多任務(wù)上取得了成功,相表現(xiàn)。但是傳統(tǒng)的神經(jīng)網(wǎng)路這樣的網(wǎng)絡(luò)結(jié)構(gòu)稱作前饋神,因?yàn)樗鼰o(wú)法處理數(shù)據(jù)之間后關(guān)聯(lián)性往往也包含了重要就需要前面單詞的信息,有網(wǎng)絡(luò)卻不能利用這種信息。N 這種模型的工作方式更接前文內(nèi)容的基礎(chǔ)上來(lái)推斷下定向循環(huán),它將上一時(shí)刻隱的輸入,使得模型可以直接了信息的持久化。RNN 結(jié)構(gòu)
圖 2.3 RNN 按時(shí)間步展開(kāi)圖展開(kāi)后的 RNN 結(jié)構(gòu)與前饋神經(jīng)網(wǎng)絡(luò)很類似,但是其中的隱藏層的權(quán)值類似于卷積神經(jīng)網(wǎng)絡(luò)中的濾波器的權(quán)值在不同時(shí)間步是共享的,隱層結(jié)構(gòu) A 稱為循環(huán)體。循環(huán)體 A 是模型運(yùn)算的關(guān)鍵,對(duì)于 RNN 的改進(jìn)也都是通過(guò)改進(jìn)循環(huán)體 A的內(nèi)部結(jié)構(gòu)。下面圖 2.4 展示了循環(huán)體的內(nèi)部結(jié)構(gòu)。圖 2.4 RNN 內(nèi)部循環(huán)體結(jié)構(gòu)圖
【參考文獻(xiàn)】:
期刊論文
[1]基于LSTM網(wǎng)絡(luò)的序列標(biāo)注中文分詞法[J]. 任智慧,徐浩煜,封松林,周晗,施俊. 計(jì)算機(jī)應(yīng)用研究. 2017(05)
[2]篇章分析技術(shù)綜述[J]. 徐凡,朱巧明,周國(guó)棟. 中文信息學(xué)報(bào). 2013(03)
[3]基于依存特征的漢語(yǔ)框架語(yǔ)義角色自動(dòng)標(biāo)注[J]. 王智強(qiáng),李茹,陰志洲,劉海靜,李雙紅. 中文信息學(xué)報(bào). 2013(02)
[4]基于SVM和擴(kuò)展條件隨機(jī)場(chǎng)的Web實(shí)體活動(dòng)抽取[J]. 張傳巖,洪曉光,彭朝暉,李慶忠. 軟件學(xué)報(bào). 2012(10)
[5]基于依存樹(shù)距離識(shí)別論元的語(yǔ)義角色標(biāo)注系統(tǒng)[J]. 王鑫,穗志方. 中文信息學(xué)報(bào). 2012(02)
[6]中文名詞性謂詞語(yǔ)義角色標(biāo)注[J]. 李軍輝,周國(guó)棟,朱巧明,錢培德. 軟件學(xué)報(bào). 2011(08)
[7]基于特征組合的中文語(yǔ)義角色標(biāo)注[J]. 李世奇,趙鐵軍,李晗靜,劉鵬遠(yuǎn),劉水. 軟件學(xué)報(bào). 2011(02)
[8]基于樹(shù)狀條件隨機(jī)場(chǎng)模型的語(yǔ)義角色標(biāo)注[J]. 李明,王亞斌,張其文,王旭陽(yáng). 計(jì)算機(jī)工程. 2010(18)
[9]基于最大熵模型的語(yǔ)義角色標(biāo)注[J]. 于江德,王希杰,余正濤. 微電子學(xué)與計(jì)算機(jī). 2010(08)
[10]基于依存樹(shù)的中文語(yǔ)義角色標(biāo)注[J]. 安強(qiáng)強(qiáng),張蕾. 計(jì)算機(jī)工程. 2010(04)
博士論文
[1]基于核方法的語(yǔ)義角色標(biāo)注研究[D]. 車萬(wàn)翔.哈爾濱工業(yè)大學(xué) 2008
碩士論文
[1]基于LSTM的漢語(yǔ)語(yǔ)義角色標(biāo)注研究[D]. 鄭亞楠.西藏大學(xué) 2017
[2]基于LSTM的語(yǔ)義關(guān)系分類研究[D]. 胡新辰.哈爾濱工業(yè)大學(xué) 2015
[3]基于依存圖的中文語(yǔ)義分析[D]. 丁宇.哈爾濱工業(yè)大學(xué) 2014
[4]基于依存樹(shù)核函數(shù)的語(yǔ)義角色標(biāo)注研究[D]. 王步康.蘇州大學(xué) 2012
[5]基于聯(lián)合方法的中文語(yǔ)義角色標(biāo)注研究[D]. 王文學(xué).上海交通大學(xué) 2012
[6]基于特征的中文名詞性謂詞語(yǔ)義角色標(biāo)注研究[D]. 徐靖.蘇州大學(xué) 2011
[7]基于條件場(chǎng)的語(yǔ)義角色標(biāo)注[D]. 顏廷義.北京郵電大學(xué) 2010
[8]基于結(jié)構(gòu)學(xué)習(xí)的語(yǔ)義角色標(biāo)注[D]. 白雪.北京郵電大學(xué) 2010
[9]基于依存分析的語(yǔ)義角色標(biāo)注研究[D]. 汪紅林.蘇州大學(xué) 2009
[10]基于條件隨機(jī)場(chǎng)的自動(dòng)分詞技術(shù)的研究[D]. 陳晴.東北大學(xué) 2005
本文編號(hào):3514202
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3514202.html
最近更新
教材專著