天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于柱搜索和神經(jīng)網(wǎng)絡(luò)的組塊分析研究

發(fā)布時(shí)間:2020-09-21 19:43
   組塊分析是自然語(yǔ)言處理中的一項(xiàng)基本任務(wù),其分析目標(biāo)是識(shí)別出句子中某些句法相關(guān)、結(jié)構(gòu)相對(duì)簡(jiǎn)單、不交叉、非嵌套的句子成分。自從將計(jì)算機(jī)用于解決自然語(yǔ)言處理問題后,組塊分析也成為了語(yǔ)言學(xué)與計(jì)算機(jī)科學(xué)的一個(gè)交叉性研究課題。由于它可以作為機(jī)器翻譯、完全句法分析、信息檢索、信息抽取等諸多重要任務(wù)的前處理階段,具有廣泛的應(yīng)用需求,故很受研究者的關(guān)注。盡管相關(guān)研究陸續(xù)被做出,但組塊分析問題還遠(yuǎn)遠(yuǎn)沒有被完全解決,它依然是自然語(yǔ)言處理領(lǐng)域內(nèi)一個(gè)需要長(zhǎng)期挑戰(zhàn)的目標(biāo)。隨著組塊分析處理技術(shù)從早期的主要基于規(guī)則慢慢轉(zhuǎn)變到了后來的主要基于統(tǒng)計(jì)和機(jī)器學(xué)習(xí),基于統(tǒng)計(jì)的相關(guān)技術(shù)成為了處理該任務(wù)的主要方法。其中,基于條件隨機(jī)場(chǎng)等結(jié)構(gòu)化模型來將其建模成一個(gè)序列化標(biāo)注任務(wù)進(jìn)行處理是目前最常用的手段。然而,這類模型在建模該任務(wù)時(shí)因?yàn)椴捎昧笋R爾科夫假設(shè)以致在局部對(duì)一個(gè)詞進(jìn)行類型決策時(shí)無法利用到所有當(dāng)前已標(biāo)注詞的標(biāo)注類型信息,從而影響標(biāo)注準(zhǔn)確度,如何緩解這方面限制的研究一直在持續(xù)。考慮到上述缺點(diǎn),本文嘗試了基于狀態(tài)轉(zhuǎn)移的方法來對(duì)組塊分析任務(wù)進(jìn)行處理。同時(shí),在每一步對(duì)狀態(tài)轉(zhuǎn)移的選擇進(jìn)行決策的過程中,本文使用能學(xué)習(xí)輸入與輸出之間非線性關(guān)系的神經(jīng)網(wǎng)絡(luò)來對(duì)各個(gè)合法的轉(zhuǎn)移操作進(jìn)行評(píng)估。本文的主要工作包括:首先,基于狀態(tài)轉(zhuǎn)移和簡(jiǎn)單單隱層前向反饋神經(jīng)網(wǎng)絡(luò)對(duì)問題進(jìn)行建模,然后采用樸素的貪心策略來對(duì)模型進(jìn)行訓(xùn)練和解碼,構(gòu)建了一個(gè)效果很強(qiáng)的基線組塊分析系統(tǒng);然后,為了更全局地對(duì)整個(gè)句子所對(duì)應(yīng)的完整標(biāo)注序列進(jìn)行建模,本文接著在解碼和訓(xùn)練的過程中采用了柱搜索的搜索策略以及對(duì)比散度學(xué)習(xí)方法來對(duì)模型進(jìn)行學(xué)習(xí),實(shí)驗(yàn)結(jié)果表明,在結(jié)合了柱搜索策略對(duì)句子進(jìn)行更全局的建模后,模型在英文和中文的測(cè)試集上都比基線系統(tǒng)有了大幅度的提升;最后,針對(duì)簡(jiǎn)單單隱層前向反饋神經(jīng)網(wǎng)絡(luò)中所使用的神經(jīng)網(wǎng)絡(luò)過于簡(jiǎn)單、在對(duì)單個(gè)轉(zhuǎn)移操作進(jìn)行局部得分計(jì)算時(shí)對(duì)當(dāng)前已標(biāo)注信息以及遠(yuǎn)距離信息的利用還不夠充分的缺點(diǎn),本文將長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)融入柱搜索框架中,從而更好地對(duì)整個(gè)候選序列進(jìn)行得分計(jì)算。實(shí)驗(yàn)結(jié)果表明,在融入長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)后,模型在英文和中文的測(cè)試集上都有所提升,達(dá)到了與當(dāng)前最好結(jié)果相當(dāng)?shù)乃。從基線系統(tǒng)的構(gòu)建到最后長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)的融入,本文所用方法的效果在穩(wěn)步提升,最后的柱搜索與長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)結(jié)合的方法除在中文文本組塊分析任務(wù)上達(dá)到與當(dāng)前最好結(jié)果相當(dāng)?shù)慕Y(jié)果之外,在另外三個(gè)任務(wù)上都取得了當(dāng)前最好的結(jié)果。
【學(xué)位單位】:南京大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2016
【中圖分類】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李曉望;自然語(yǔ)言的結(jié)構(gòu)模型“M-Ph”[J];南京航空航天大學(xué)學(xué)報(bào);1988年S1期

2 周俊生;戴新宇;陳家駿;曲維光;;基于大間隔方法的漢語(yǔ)組塊分析[J];軟件學(xué)報(bào);2009年04期

3 李業(yè)剛;黃河燕;;漢語(yǔ)組塊分析研究綜述[J];中文信息學(xué)報(bào);2013年03期

4 索紅光;曹淑英;;基于組塊的中文自動(dòng)文摘系統(tǒng)研究[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2007年03期

5 劉芳,趙鐵軍,于浩,楊沐昀,方高林;基于統(tǒng)計(jì)的漢語(yǔ)組塊分析[J];中文信息學(xué)報(bào);2000年06期

6 林煜明;李優(yōu);;基于SVM的句子組塊識(shí)別[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2006年03期

7 鄒宏梅;王挺;;SVM和基于轉(zhuǎn)換的錯(cuò)誤驅(qū)動(dòng)學(xué)習(xí)相結(jié)合的漢語(yǔ)組塊識(shí)別[J];計(jì)算機(jī)工程與科學(xué);2007年04期

8 黃德根;于靜;;分布式策略與CRFs相結(jié)合識(shí)別漢語(yǔ)組塊[J];中文信息學(xué)報(bào);2009年01期

9 譚詠梅;姚天順;陳晴;李珩;朱靖波;;基于SVM+Sigmoid的漢語(yǔ)組塊識(shí)別[J];計(jì)算機(jī)科學(xué);2004年08期

10 黃德根;王瑩瑩;;基于SVM的組塊識(shí)別及其錯(cuò)誤驅(qū)動(dòng)學(xué)習(xí)方法[J];中文信息學(xué)報(bào);2006年06期

相關(guān)會(huì)議論文 前10條

1 李素建;劉群;;漢語(yǔ)組塊的定義和獲取[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年

2 黃行;孫宏開;江荻;張濟(jì)川;唐黎明;;現(xiàn)代藏語(yǔ)名詞組塊的類型及形式標(biāo)記特征[A];全國(guó)第八屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年

3 王茂林;;自然口語(yǔ)中的韻律組塊過程[A];新世紀(jì)的現(xiàn)代語(yǔ)音學(xué)——第五屆全國(guó)現(xiàn)代語(yǔ)音學(xué)學(xué)術(shù)會(huì)議論文集[C];2001年

4 羅雪兵;黃德根;周惠巍;李麗雙;;基于組合方法的組塊識(shí)別[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年

5 張捷;藍(lán)國(guó)陽(yáng);鄧夢(mèng)東;戚曉明;馬紅旗;;接觸法分析組塊在滑道上的滑移運(yùn)動(dòng)[A];第十六屆中國(guó)海洋(岸)工程學(xué)術(shù)討論會(huì)(下冊(cè))[C];2013年

6 羅勁;應(yīng)小萍;;組塊破解:一種特殊形態(tài)的頓悟[A];第十五屆全國(guó)心理學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2012年

7 江荻;;現(xiàn)代藏語(yǔ)的句法組塊與形式標(biāo)記[A];語(yǔ)言計(jì)算與基于內(nèi)容的文本處理——全國(guó)第七屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年

8 張志寬;趙順利;荊鵬;葛仁磊;;一種測(cè)量大型組塊底部尺寸的新方法[A];2013年中國(guó)海洋工程技術(shù)年會(huì)論文集[C];2013年

9 范模;李達(dá);馬巍巍;易叢;白雪平;;南海超大型組塊浮托的總體設(shè)計(jì)與關(guān)鍵技術(shù)[A];第十三屆中國(guó)科協(xié)年會(huì)第13分會(huì)場(chǎng)-海洋工程裝備發(fā)展論壇論文集[C];2011年

10 任登君;李珩;張俐;姚天順;;基于詞對(duì)齊的雙語(yǔ)組塊對(duì)齊[A];第二屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2004年

相關(guān)重要報(bào)紙文章 前7條

1 記者 齊芳;“頓悟”是怎么發(fā)生的[N];光明日?qǐng)?bào);2011年

2 全國(guó)冶金節(jié)能減排新技術(shù)知識(shí)競(jìng)賽組委會(huì)專家組;陶瓷纖維貼面塊助力爐窯節(jié)能[N];中國(guó)冶金報(bào);2010年

3 劉永安 陳鳳玲 于海躍;亞洲最大海上油氣平臺(tái)組塊竣工[N];中國(guó)船舶報(bào);2013年

4 吳江市盛澤實(shí)驗(yàn)小學(xué) 薛法根;行走在智慧的教學(xué)路上[N];江蘇教育報(bào);2011年

5 本報(bào)記者 吳莉;我國(guó)海上最大油氣平臺(tái)組塊完工[N];中國(guó)能源報(bào);2013年

6 李代蘭;語(yǔ)文中的字詞教學(xué)[N];濟(jì)寧日?qǐng)?bào);2009年

7 執(zhí)筆 江荻;人文社會(huì)科學(xué)前沿掃描[N];中國(guó)社會(huì)科學(xué)院院報(bào);2008年

相關(guān)博士學(xué)位論文 前6條

1 許鑫;浮托安裝系統(tǒng)耦合動(dòng)力響應(yīng)研究[D];上海交通大學(xué);2014年

2 公彥霏;關(guān)于組塊機(jī)制及其與國(guó)際象棋技能之間關(guān)系的拓展研究[D];華東師范大學(xué);2015年

3 馬國(guó)彥;篇章的組塊:標(biāo)記與管界[D];復(fù)旦大學(xué);2010年

4 李素建;漢語(yǔ)組塊計(jì)算的若干研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2002年

5 孫廣路;基于統(tǒng)計(jì)學(xué)習(xí)的中文組塊分析技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2008年

6 袁彩霞;中文功能組塊分析及應(yīng)用研究[D];北京郵電大學(xué);2009年

相關(guān)碩士學(xué)位論文 前10條

1 劉焱青;基于組塊3×2交叉驗(yàn)證t檢驗(yàn)的模型選擇研究[D];山西大學(xué);2015年

2 高博興;基于rTMS的動(dòng)作記憶組塊的腦功能定位研究[D];上海體育學(xué)院;2015年

3 楊金殙;閱讀過程中編碼單位的探測(cè)與識(shí)別[D];華東師范大學(xué);2016年

4 程川;基于柱搜索和神經(jīng)網(wǎng)絡(luò)的組塊分析研究[D];南京大學(xué);2016年

5 張忠爐;漢字字謎任務(wù)中限制解除和組塊分解機(jī)制及其醞釀效應(yīng)[D];廣州大學(xué);2012年

6 常若愚;漢語(yǔ)語(yǔ)義組塊識(shí)別研究[D];杭州電子科技大學(xué);2015年

7 鄒宏梅;組塊識(shí)別技術(shù)的研究與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2006年

8 張慧;從大衛(wèi)·卡坦組塊理論視角看英語(yǔ)品牌名翻譯[D];華中師范大學(xué);2008年

9 孫鵬;產(chǎn)品架構(gòu)組塊變動(dòng)對(duì)汽車維修管理的影響研究[D];北京交通大學(xué);2015年

10 王瑩瑩;漢語(yǔ)組塊識(shí)別的研究[D];大連理工大學(xué);2006年



本文編號(hào):2823916

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2823916.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0ef7a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com