天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

漢語(yǔ)依存句法分析樹庫(kù)構(gòu)建與應(yīng)用研究

發(fā)布時(shí)間:2021-01-06 11:51
  隨著深度學(xué)習(xí)的發(fā)展,依存句法分析的性能取得了非常顯著的提升。然而,利用已有樹庫(kù)訓(xùn)練的模型進(jìn)行不規(guī)范網(wǎng)絡(luò)文本依存句法分析時(shí),準(zhǔn)確率急劇下降。其主要原因是,已有樹庫(kù)資源大多面向規(guī)范的新聞?wù)Z料構(gòu)建,而針對(duì)網(wǎng)絡(luò)文本的樹庫(kù)資源較少。因此,本文面向多領(lǐng)域多來(lái)源漢語(yǔ)文本(尤其是網(wǎng)絡(luò)文本),制定了一個(gè)依存句法數(shù)據(jù)標(biāo)注規(guī)范,進(jìn)行了大規(guī)模依存句法樹庫(kù)構(gòu)建,并嘗試將依存句法信息應(yīng)用到句子壓縮任務(wù)中。本文的主要研究?jī)?nèi)容如下:(1)漢語(yǔ)依存句法數(shù)據(jù)標(biāo)注規(guī)范的制定由于目前還沒(méi)有一個(gè)公開、完整、系統(tǒng)的漢語(yǔ)依存句法數(shù)據(jù)標(biāo)注規(guī)范,并且已有的樹庫(kù)標(biāo)注工作對(duì)網(wǎng)絡(luò)文本中的特殊語(yǔ)言現(xiàn)象考慮較少。本文充分參考了已有的數(shù)據(jù)標(biāo)注工作和諸多語(yǔ)言學(xué)著作,制定了一個(gè)適應(yīng)多領(lǐng)域多來(lái)源文本的漢語(yǔ)依存句法數(shù)據(jù)標(biāo)注規(guī)范(目前版本約70頁(yè))。另外,為保證標(biāo)注一致性,本文結(jié)合實(shí)際標(biāo)注中遇到的問(wèn)題進(jìn)行分析,給出了明確的優(yōu)先級(jí)策略。我們將該規(guī)范作為樹庫(kù)構(gòu)建工作的理論基礎(chǔ)。(2)基于主動(dòng)學(xué)習(xí)的漢語(yǔ)依存句法樹庫(kù)構(gòu)建基于制定的標(biāo)注規(guī)范及可視化在線標(biāo)注系統(tǒng),開展了大規(guī)模數(shù)據(jù)標(biāo)注。首先,利用主動(dòng)學(xué)習(xí)方法進(jìn)行數(shù)據(jù)選取;其次,使用可視化系統(tǒng)進(jìn)行程序化標(biāo)注和質(zhì)量控制;最... 

【文章來(lái)源】:蘇州大學(xué)江蘇省

【文章頁(yè)數(shù)】:73 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

漢語(yǔ)依存句法分析樹庫(kù)構(gòu)建與應(yīng)用研究


圖2-3句子壓縮示例??

序列,機(jī)制,句法分析,漢語(yǔ)


第二章任務(wù)及方法介紹?漢語(yǔ)依存句法分析樹庫(kù)構(gòu)建與應(yīng)用研宄??不同的輸出通道去測(cè)試各自領(lǐng)域的數(shù)據(jù)。??Training?Testing??Multi-view?model?0utputA?0utput?B??t?“???^?Train?multi-view?^???model?-?Multi-view?model?—^??Corpus?A?Corpus?B?Raw??-??L??J?sentence??圖2-6?mtl機(jī)制??本文將MTL機(jī)制加入到之前第2.2節(jié)介紹的BiLSTM-CRF模型中,用于漢語(yǔ)句??子壓縮任務(wù)中。在訓(xùn)練和測(cè)試中,輸入部分和單任務(wù)一樣共享同樣的參數(shù)向量表示,??然后根據(jù)共享參數(shù)分別輸入到不同的語(yǔ)料類型(A和B)對(duì)應(yīng)的MLP計(jì)算得分,以??及利用各自私有的CRF層進(jìn)行結(jié)構(gòu)化預(yù)測(cè),具體內(nèi)容見第5.5節(jié)中的詳細(xì)介紹。??2.5本章小結(jié)??本章詳細(xì)地介紹了本文研宄中相關(guān)任務(wù)的描述和定義,包括依存句法分析、局部??標(biāo)注以及句子壓縮;另外對(duì)文中所涉及到的機(jī)器學(xué)習(xí)方法的介紹,包括雙向長(zhǎng)短期記??憶網(wǎng)絡(luò)-條件隨機(jī)場(chǎng)模型(BiLSTM-CRF)、基于圖的雙仿射神經(jīng)網(wǎng)絡(luò)依存句法分析模??型(Biaffine?Parser)、多任務(wù)學(xué)習(xí)方法(MTL)。BiLSTM-CRF模型由于能有效地解決??序列中記憶信息丟失問(wèn)題,是Biaffme?Parser模型以及MTL模型的重要組成部分。在??第四章漢語(yǔ)依存句法樹庫(kù)的構(gòu)建工作中,將Biaffine?Parser模型用于數(shù)據(jù)選取的置信??度判定,并對(duì)依存句法標(biāo)注數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn)和分析。將BiLSTM-CRF模型和MTL??模型用于第五章的句子壓

依存關(guān)系,示例,主語(yǔ),類型


的??詞語(yǔ)的并列,并列詞語(yǔ)可以是動(dòng)詞、名詞、形容詞等。似迎過(guò)標(biāo)注實(shí)踐發(fā)現(xiàn),很多句??子屮并列謂語(yǔ)之間的句法關(guān)系不盡相同,這兩個(gè)依存關(guān)系類型并不能非常準(zhǔn)確地表??示并列謂語(yǔ)之間更深層次的關(guān)系,而且其界限非常難掌握。因此,在我們的規(guī)范中,??為了更加深入而又準(zhǔn)確地表示句子內(nèi)部謂語(yǔ)之間的句法關(guān)系,通過(guò)判定句子中的多??個(gè)謂語(yǔ)是否對(duì)句子中的主語(yǔ)和賓語(yǔ)進(jìn)行共享,我們細(xì)分出了三種不同的依存關(guān)系類??型,包括同主語(yǔ)(sasubj)、同主語(yǔ)同賓語(yǔ)(sasubj-obj)與不同主語(yǔ)(dfsubj),如圖3-1所??示,“建立”和“改進(jìn)”是同主語(yǔ)關(guān)系,“建立”和“健全”是同主語(yǔ)同賓語(yǔ)關(guān)系,“建??立”和“提高”是不同主語(yǔ)關(guān)系。??¥工廠建立健全責(zé)仟制,改進(jìn)技術(shù),員I:才能提高效申.。??圖3-1?sasubj-obj、sasubj、dfsubj依存關(guān)系類型示例??17??

【參考文獻(xiàn)】:
期刊論文
[1]適應(yīng)多領(lǐng)域多來(lái)源文本的漢語(yǔ)依存句法數(shù)據(jù)標(biāo)注規(guī)范[J]. 郭麗娟,李正華,彭雪,張民.  中文信息學(xué)報(bào). 2018(10)
[2]多領(lǐng)域中文依存樹庫(kù)構(gòu)建與影響統(tǒng)計(jì)句法分析因素之分析[J]. 邱立坤,史林林,王厚峰.  中文信息學(xué)報(bào). 2015(05)
[3]Hedge Trimmer句子壓縮技術(shù)的算法實(shí)現(xiàn)及改進(jìn)[J]. 景秀麗.  沈陽(yáng)師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(04)
[4]短語(yǔ)結(jié)構(gòu)樹庫(kù)向依存結(jié)構(gòu)樹庫(kù)轉(zhuǎn)化研究[J]. 李正華,車萬(wàn)翔,劉挺.  中文信息學(xué)報(bào). 2008(06)
[5]漢語(yǔ)句法樹庫(kù)標(biāo)注體系[J]. 周強(qiáng).  中文信息學(xué)報(bào). 2004(04)
[6]漢語(yǔ)主題句的特性[J]. 石定栩.  現(xiàn)代外語(yǔ). 1998(02)

博士論文
[1]漢語(yǔ)依存句法分析關(guān)鍵技術(shù)研究[D]. 李正華.哈爾濱工業(yè)大學(xué) 2013

碩士論文
[1]中文語(yǔ)句壓縮關(guān)鍵技術(shù)研究[D]. 姜雪.東北大學(xué) 2014
[2]語(yǔ)句壓縮及其應(yīng)用研究[D]. 張永磊.蘇州大學(xué) 2013
[3]基于主動(dòng)學(xué)習(xí)的漢語(yǔ)依存樹庫(kù)構(gòu)建[D]. 陳鑫.哈爾濱工業(yè)大學(xué) 2011



本文編號(hào):2960518

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2960518.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e7b1a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com