天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軍工論文 >

面向軍事領(lǐng)域的句子級文本處理技術(shù)研究

發(fā)布時間:2020-09-02 17:42
   非結(jié)構(gòu)化文本是我軍政策、命令、指示等信息的主要載體,在軍事信息傳遞中發(fā)揮著重要作用。長期以來,軍事文本信息處理主要以人工方式為主,受限于人的專業(yè)知識和工作效率,與軍事信息化、智能化發(fā)展的要求日益不相適應(yīng)。如何實現(xiàn)軍事文本信息自動化、智能化處理,成為一項亟待研究的課題。自然語言處理是近年來發(fā)展迅速的一門語言學(xué)、數(shù)學(xué)和計算機科學(xué)交叉的學(xué)科,主要研究如何讓計算機準(zhǔn)確處理、理解人類的語言文本。作為一種高效的文本信息處理方式,自然語言處理技術(shù)在軍事文本信息處理領(lǐng)域應(yīng)用前景廣闊。本文在分析軍事領(lǐng)域文本特點的基礎(chǔ)上,采用面向自然語言處理的統(tǒng)計學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)模型,對軍事文本分詞、詞性標(biāo)注和依存句法分析等問題作了深入研究,目的是將非結(jié)構(gòu)化文本處理成易于計算機理解的中間形式,為下一步工作奠定基礎(chǔ)。由于軍事文本領(lǐng)域詞語數(shù)量較多、長度偏長,導(dǎo)致普通分詞方法切分效果并不理想。本文通過分析軍事領(lǐng)域文本特點和術(shù)語特點,設(shè)計了一種統(tǒng)計模型與領(lǐng)域詞典相結(jié)合的分詞方案。該方案在現(xiàn)有條件隨機場(CRF)分詞模型基礎(chǔ)上,采用針對領(lǐng)域長術(shù)語的長詞位標(biāo)記法,利用專用領(lǐng)域詞典校正初步分詞結(jié)果,提升領(lǐng)域詞語識別率。在小規(guī)模領(lǐng)域語料庫上進(jìn)行實驗測試,結(jié)果表明該方案分詞效果優(yōu)于CRF直接切分效果,并具有良好的可擴展性。針對傳統(tǒng)的基于統(tǒng)計模型的詞性標(biāo)注存在人工特征依賴的問題,提出了一種基于注意力長短時記憶網(wǎng)絡(luò)(LSTM)的詞性標(biāo)注模型。該模型在網(wǎng)絡(luò)隱含層引入注意力機制,為各時刻隱單元分配不同權(quán)重大小,使隱含層更加關(guān)注重要特征;在輸出層加入標(biāo)簽狀態(tài)轉(zhuǎn)移概率矩陣,利用標(biāo)簽間轉(zhuǎn)移特征提升序列解碼效果。實驗結(jié)果表明,該模型標(biāo)注準(zhǔn)確率接近當(dāng)前最佳模型,并具有結(jié)構(gòu)簡單、無需人為設(shè)計特征等優(yōu)點。針對現(xiàn)有的基于LSTM的依存句法分析對句子全局結(jié)構(gòu)特征關(guān)注不夠的問題,提出了一種結(jié)合全局向量特征的依存句法分析模型。該模型中設(shè)計了一種分段池化的卷積神經(jīng)網(wǎng)絡(luò)(CNN)用于提取全局向量特征,并加入到LSTM句法分析模型,提升其全局關(guān)注能力。實驗結(jié)果表明,與現(xiàn)有僅使用LSTM或CNN的句法分析模型相比,該模型在保證一定效率的同時,有效提升了依存句法分析準(zhǔn)確率。
【學(xué)位單位】:戰(zhàn)略支援部隊信息工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:E91

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 韓霞;黃德根;;基于半監(jiān)督隱馬爾科夫模型的漢語詞性標(biāo)注研究[J];小型微型計算機系統(tǒng);2015年12期

2 韓冬煦;常寶寶;;中文分詞模型的領(lǐng)域適應(yīng)性方法[J];計算機學(xué)報;2015年02期

3 張鳳;高航;;自然語言處理技術(shù)在西方國家軍事領(lǐng)域的應(yīng)用現(xiàn)狀[J];國防科技;2014年06期

4 穆雷;王祥兵;;軍事翻譯研究的現(xiàn)狀與展望[J];外語研究;2014年01期

5 張梅山;鄧知龍;車萬翔;劉挺;;統(tǒng)計與詞典相結(jié)合的領(lǐng)域自適應(yīng)中文分詞[J];中文信息學(xué)報;2012年02期

6 于江德;葛彥強;余正濤;;基于條件隨機場的漢語詞性標(biāo)注[J];微電子學(xué)與計算機;2011年10期

7 何徑舟;王厚峰;;基于特征選擇和最大熵模型的漢語詞義消歧[J];軟件學(xué)報;2010年06期

8 朱聰慧;趙鐵軍;鄭德權(quán);;基于無向圖序列標(biāo)注模型的中文分詞詞性標(biāo)注一體化系統(tǒng)[J];電子與信息學(xué)報;2010年03期

9 梁曉波;劉伍穎;孟凡禮;;信息化條件下的軍事語料庫應(yīng)用[J];國防科技;2008年02期

10 黃昌寧;趙海;;中文分詞十年回顧[J];中文信息學(xué)報;2007年03期

相關(guān)博士學(xué)位論文 前1條

1 李正華;漢語依存句法分析關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2013年

相關(guān)碩士學(xué)位論文 前3條

1 宋瑞亮;面向軍事領(lǐng)域的命名實體識別及相關(guān)信息提取關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2016年

2 楊曉冬;基于本體的作戰(zhàn)文書分詞的關(guān)鍵技術(shù)研究[D];杭州電子科技大學(xué);2014年

3 馬學(xué)U

本文編號:2810908


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jingguansheji/2810908.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6a9c9***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com