天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

政務(wù)公文命名實(shí)體識別方法研究及應(yīng)用

發(fā)布時(shí)間:2024-12-21 20:59
  目前每年政務(wù)公文的數(shù)量成倍增加,能從中批量的自動的識別、處理和抽取相應(yīng)的對象并對所有的公文中的人員、組織、機(jī)構(gòu)、職級、職務(wù)等屬性完成系統(tǒng)的分析和管理。要完成系統(tǒng)的分析和管理其基礎(chǔ)是對公文命名實(shí)體的識別,因此對于研究命名實(shí)體識別有著重大意義。命名實(shí)體識別的主要任務(wù)是識別出文本具有特殊意義的詞或者短文本,包括人名、地方名等,當(dāng)前命名實(shí)體識別問題已經(jīng)有很多的關(guān)注。命名實(shí)體識別主流的方法基于機(jī)器學(xué)習(xí)、基于深度學(xué)習(xí)的方法。本文只針對機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)方法進(jìn)行研究。本文首先詳細(xì)研究了機(jī)器學(xué)習(xí)的條件隨機(jī)場方法,通過CRF模型識別出政務(wù)公文中的命名實(shí)體,并進(jìn)行了驗(yàn)證實(shí)驗(yàn)。之后,用深度學(xué)習(xí)的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN,Recurrent Neural Network)的一個(gè) Bi-LSTM(Bi-directional Long-Short Term Memory)雙向長短記憶法進(jìn)行命名實(shí)體識別。其中對Bi-LSTM模型進(jìn)行命名實(shí)體識別,通過在政務(wù)公文領(lǐng)域的語料進(jìn)行大量的實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果發(fā)現(xiàn)在命名實(shí)體識別中,雙向LSTM模型能夠達(dá)到比CRF模型更佳的效果。此外本章最主要的研究是將Bi-LSTM和CRF兩種方法...

【文章頁數(shù)】:84 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖2-1鏈?zhǔn)浇Y(jié)構(gòu)??Fig.2-1?Chain?Structures??

圖2-1鏈?zhǔn)浇Y(jié)構(gòu)??Fig.2-1?Chain?Structures??

?北京化工大學(xué)碩士學(xué)位論文???x?=?xl7x2,...,x???圖2-1鏈?zhǔn)浇Y(jié)構(gòu)??Fig.2-1?Chain?Structures??就是X,?Y,,Y2,那么對應(yīng)的條件概率(這里以Y2為例求解)那么應(yīng)該寫成如公式(2??-2)下:??P?(Y2|X,Y,,Y2,Y3.......


圖2-2長短記憶模塊??Fig.2-2?Long-Short?Term?Memory?Module??

圖2-2長短記憶模塊??Fig.2-2?Long-Short?Term?Memory?Module??

法介紹??LSTM可以在匹配輸入和輸出序列時(shí)使用與上下文相關(guān)的信息,并且標(biāo)準(zhǔn)遞歸祌??經(jīng)網(wǎng)絡(luò)(RNN)可訪問的上下文信息的范圍是有限的。該問題導(dǎo)致隱藏層的輸入對??網(wǎng)絡(luò)輸出的影響隨著網(wǎng)絡(luò)循環(huán)的重現(xiàn)而降低。因此,為了解決這個(gè)問題,長期和短??期記憶結(jié)構(gòu)(LSTM)誕生了。長期和短期....


圖2-3長雙向長短時(shí)記憶模塊??Fig.2-3?Bi?Long-Short?Term?Memory?Module??在Forward層從1時(shí)刻到t時(shí)刻正向計(jì)算一遍,得到并保存每個(gè)時(shí)刻向前隱含層??

圖2-3長雙向長短時(shí)記憶模塊??Fig.2-3?Bi?Long-Short?Term?Memory?Module??在Forward層從1時(shí)刻到t時(shí)刻正向計(jì)算一遍,得到并保存每個(gè)時(shí)刻向前隱含層??

若干輸入和后面若干輸入共同決定,這樣會更加準(zhǔn)確。因此提出了雙??向循環(huán)神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)結(jié)構(gòu)如下圖。可以看到Forward層和Backward層同連接著輸??出層,其中包含了?6個(gè)共享權(quán)值wl-w6。??Output?Layer??t\?T\?t\??w6?\?w6?\?w6??Ba....


圖2-4(a)公文示例??Fig.2-4(a)?government?official?document?example??14??

圖2-4(a)公文示例??Fig.2-4(a)?government?official?document?example??14??

構(gòu)比較復(fù)雜,??并且有很多新的名詞和設(shè)定。??第二,崗位和職級中相互的指代和設(shè)定。并且其的命名實(shí)體指代不清晰,所有的??命名實(shí)體的相互影響識別,制約了崗位的識別,如“副局級”,“副局長”??第四,命名實(shí)體的在政務(wù)公文中沒有固定的長度和格式。兩個(gè)字(“紀(jì)委”、“網(wǎng)信??辦”),(“....



本文編號:4018900

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/4018900.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶19ddd***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com