天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于柱搜索和神經網絡的組塊分析研究

發(fā)布時間:2020-09-21 19:43
   組塊分析是自然語言處理中的一項基本任務,其分析目標是識別出句子中某些句法相關、結構相對簡單、不交叉、非嵌套的句子成分。自從將計算機用于解決自然語言處理問題后,組塊分析也成為了語言學與計算機科學的一個交叉性研究課題。由于它可以作為機器翻譯、完全句法分析、信息檢索、信息抽取等諸多重要任務的前處理階段,具有廣泛的應用需求,故很受研究者的關注。盡管相關研究陸續(xù)被做出,但組塊分析問題還遠遠沒有被完全解決,它依然是自然語言處理領域內一個需要長期挑戰(zhàn)的目標。隨著組塊分析處理技術從早期的主要基于規(guī)則慢慢轉變到了后來的主要基于統(tǒng)計和機器學習,基于統(tǒng)計的相關技術成為了處理該任務的主要方法。其中,基于條件隨機場等結構化模型來將其建模成一個序列化標注任務進行處理是目前最常用的手段。然而,這類模型在建模該任務時因為采用了馬爾科夫假設以致在局部對一個詞進行類型決策時無法利用到所有當前已標注詞的標注類型信息,從而影響標注準確度,如何緩解這方面限制的研究一直在持續(xù)?紤]到上述缺點,本文嘗試了基于狀態(tài)轉移的方法來對組塊分析任務進行處理。同時,在每一步對狀態(tài)轉移的選擇進行決策的過程中,本文使用能學習輸入與輸出之間非線性關系的神經網絡來對各個合法的轉移操作進行評估。本文的主要工作包括:首先,基于狀態(tài)轉移和簡單單隱層前向反饋神經網絡對問題進行建模,然后采用樸素的貪心策略來對模型進行訓練和解碼,構建了一個效果很強的基線組塊分析系統(tǒng);然后,為了更全局地對整個句子所對應的完整標注序列進行建模,本文接著在解碼和訓練的過程中采用了柱搜索的搜索策略以及對比散度學習方法來對模型進行學習,實驗結果表明,在結合了柱搜索策略對句子進行更全局的建模后,模型在英文和中文的測試集上都比基線系統(tǒng)有了大幅度的提升;最后,針對簡單單隱層前向反饋神經網絡中所使用的神經網絡過于簡單、在對單個轉移操作進行局部得分計算時對當前已標注信息以及遠距離信息的利用還不夠充分的缺點,本文將長短期記憶神經網絡融入柱搜索框架中,從而更好地對整個候選序列進行得分計算。實驗結果表明,在融入長短期記憶神經網絡后,模型在英文和中文的測試集上都有所提升,達到了與當前最好結果相當的水平。從基線系統(tǒng)的構建到最后長短期記憶神經網絡的融入,本文所用方法的效果在穩(wěn)步提升,最后的柱搜索與長短期記憶神經網絡結合的方法除在中文文本組塊分析任務上達到與當前最好結果相當的結果之外,在另外三個任務上都取得了當前最好的結果。
【學位單位】:南京大學
【學位級別】:碩士
【學位年份】:2016
【中圖分類】:TP391.1

【相似文獻】

相關期刊論文 前10條

1 李曉望;自然語言的結構模型“M-Ph”[J];南京航空航天大學學報;1988年S1期

2 周俊生;戴新宇;陳家駿;曲維光;;基于大間隔方法的漢語組塊分析[J];軟件學報;2009年04期

3 李業(yè)剛;黃河燕;;漢語組塊分析研究綜述[J];中文信息學報;2013年03期

4 索紅光;曹淑英;;基于組塊的中文自動文摘系統(tǒng)研究[J];計算機系統(tǒng)應用;2007年03期

5 劉芳,趙鐵軍,于浩,楊沐昀,方高林;基于統(tǒng)計的漢語組塊分析[J];中文信息學報;2000年06期

6 林煜明;李優(yōu);;基于SVM的句子組塊識別[J];山東大學學報(理學版);2006年03期

7 鄒宏梅;王挺;;SVM和基于轉換的錯誤驅動學習相結合的漢語組塊識別[J];計算機工程與科學;2007年04期

8 黃德根;于靜;;分布式策略與CRFs相結合識別漢語組塊[J];中文信息學報;2009年01期

9 譚詠梅;姚天順;陳晴;李珩;朱靖波;;基于SVM+Sigmoid的漢語組塊識別[J];計算機科學;2004年08期

10 黃德根;王瑩瑩;;基于SVM的組塊識別及其錯誤驅動學習方法[J];中文信息學報;2006年06期

相關會議論文 前10條

1 李素建;劉群;;漢語組塊的定義和獲取[A];語言計算與基于內容的文本處理——全國第七屆計算語言學聯(lián)合學術會議論文集[C];2003年

2 黃行;孫宏開;江荻;張濟川;唐黎明;;現代藏語名詞組塊的類型及形式標記特征[A];全國第八屆計算語言學聯(lián)合學術會議(JSCL-2005)論文集[C];2005年

3 王茂林;;自然口語中的韻律組塊過程[A];新世紀的現代語音學——第五屆全國現代語音學學術會議論文集[C];2001年

4 羅雪兵;黃德根;周惠巍;李麗雙;;基于組合方法的組塊識別[A];內容計算的研究與應用前沿——第九屆全國計算語言學學術會議論文集[C];2007年

5 張捷;藍國陽;鄧夢東;戚曉明;馬紅旗;;接觸法分析組塊在滑道上的滑移運動[A];第十六屆中國海洋(岸)工程學術討論會(下冊)[C];2013年

6 羅勁;應小萍;;組塊破解:一種特殊形態(tài)的頓悟[A];第十五屆全國心理學學術會議論文摘要集[C];2012年

7 江荻;;現代藏語的句法組塊與形式標記[A];語言計算與基于內容的文本處理——全國第七屆計算語言學聯(lián)合學術會議論文集[C];2003年

8 張志寬;趙順利;荊鵬;葛仁磊;;一種測量大型組塊底部尺寸的新方法[A];2013年中國海洋工程技術年會論文集[C];2013年

9 范模;李達;馬巍巍;易叢;白雪平;;南海超大型組塊浮托的總體設計與關鍵技術[A];第十三屆中國科協(xié)年會第13分會場-海洋工程裝備發(fā)展論壇論文集[C];2011年

10 任登君;李珩;張俐;姚天順;;基于詞對齊的雙語組塊對齊[A];第二屆全國學生計算語言學研討會論文集[C];2004年

相關重要報紙文章 前7條

1 記者 齊芳;“頓悟”是怎么發(fā)生的[N];光明日報;2011年

2 全國冶金節(jié)能減排新技術知識競賽組委會專家組;陶瓷纖維貼面塊助力爐窯節(jié)能[N];中國冶金報;2010年

3 劉永安 陳鳳玲 于海躍;亞洲最大海上油氣平臺組塊竣工[N];中國船舶報;2013年

4 吳江市盛澤實驗小學 薛法根;行走在智慧的教學路上[N];江蘇教育報;2011年

5 本報記者 吳莉;我國海上最大油氣平臺組塊完工[N];中國能源報;2013年

6 李代蘭;語文中的字詞教學[N];濟寧日報;2009年

7 執(zhí)筆 江荻;人文社會科學前沿掃描[N];中國社會科學院院報;2008年

相關博士學位論文 前6條

1 許鑫;浮托安裝系統(tǒng)耦合動力響應研究[D];上海交通大學;2014年

2 公彥霏;關于組塊機制及其與國際象棋技能之間關系的拓展研究[D];華東師范大學;2015年

3 馬國彥;篇章的組塊:標記與管界[D];復旦大學;2010年

4 李素建;漢語組塊計算的若干研究[D];中國科學院研究生院(計算技術研究所);2002年

5 孫廣路;基于統(tǒng)計學習的中文組塊分析技術研究[D];哈爾濱工業(yè)大學;2008年

6 袁彩霞;中文功能組塊分析及應用研究[D];北京郵電大學;2009年

相關碩士學位論文 前10條

1 劉焱青;基于組塊3×2交叉驗證t檢驗的模型選擇研究[D];山西大學;2015年

2 高博興;基于rTMS的動作記憶組塊的腦功能定位研究[D];上海體育學院;2015年

3 楊金殙;閱讀過程中編碼單位的探測與識別[D];華東師范大學;2016年

4 程川;基于柱搜索和神經網絡的組塊分析研究[D];南京大學;2016年

5 張忠爐;漢字字謎任務中限制解除和組塊分解機制及其醞釀效應[D];廣州大學;2012年

6 常若愚;漢語語義組塊識別研究[D];杭州電子科技大學;2015年

7 鄒宏梅;組塊識別技術的研究與實現[D];國防科學技術大學;2006年

8 張慧;從大衛(wèi)·卡坦組塊理論視角看英語品牌名翻譯[D];華中師范大學;2008年

9 孫鵬;產品架構組塊變動對汽車維修管理的影響研究[D];北京交通大學;2015年

10 王瑩瑩;漢語組塊識別的研究[D];大連理工大學;2006年



本文編號:2823916

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2823916.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶0ef7a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com