面向印尼語(yǔ)的依存句法分析研究
發(fā)布時(shí)間:2021-03-24 16:39
自2013年中國(guó)與印度尼西亞確立全面戰(zhàn)略伙伴關(guān)系以來(lái),兩國(guó)的經(jīng)濟(jì)合作和貿(mào)易往來(lái)愈發(fā)密切。通過(guò)收集與分析印尼國(guó)內(nèi)新聞網(wǎng)站和社交媒體發(fā)布的信息,我們可以更深入了解印度尼西亞的國(guó)情。但這些信息多是用印度尼西亞語(yǔ)寫(xiě)成,若是有相關(guān)工具可對(duì)其進(jìn)行自動(dòng)處理和分析,將能為相關(guān)研究人員提供極大的便利。然而,與英語(yǔ)、漢語(yǔ)等高資源語(yǔ)言不同,作為非通用語(yǔ)言的印度尼西亞語(yǔ)在自然語(yǔ)言處理領(lǐng)域受到的關(guān)注遠(yuǎn)不及通用語(yǔ)言,導(dǎo)致目前面向印尼語(yǔ)的語(yǔ)言基礎(chǔ)資源和語(yǔ)言處理工具非常有限。句法分析是連接自然語(yǔ)言處理上層應(yīng)用和底層技術(shù)的一個(gè)重要紐帶。然而,目前國(guó)內(nèi)外在印尼語(yǔ)句法分析方面的研究工作較少,不僅缺乏大規(guī)模的句法樹(shù)庫(kù),而且也少有較前沿的方法和模型在其上面的研究和應(yīng)用。針對(duì)以上問(wèn)題,本文的研究從已有的依存句法分析理論和方法出發(fā),較深入分析了印尼語(yǔ)語(yǔ)言的特點(diǎn),并借助現(xiàn)有的研究成果提出更符合印尼語(yǔ)語(yǔ)言特點(diǎn)的依存句法分析方法。具體研究?jī)?nèi)容如下:(1)基于深度學(xué)習(xí)技術(shù)的印尼語(yǔ)依存句法分析我們總結(jié)了常見(jiàn)的幾種基于深度學(xué)習(xí)的依存句法分析方法,并將其應(yīng)用在印尼語(yǔ)語(yǔ)料上,以驗(yàn)證其在印尼語(yǔ)上的可行性。另外,根據(jù)印尼語(yǔ)的語(yǔ)言特性,我們對(duì)公開(kāi)數(shù)據(jù)集...
【文章來(lái)源】:廣東外語(yǔ)外貿(mào)大學(xué)廣東省
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
對(duì)取自WSJ語(yǔ)料庫(kù)的一個(gè)英文句子Thereisnoasbestosinourproductsnow.做句法分析
動(dòng)作Shift
圖 2-4 動(dòng)作 Leftger 方法rc-eager 轉(zhuǎn)移系統(tǒng)中,每個(gè)狀態(tài)都由一個(gè)三元組< , , >構(gòu)成,其用于存放已被遍歷的詞; 為一個(gè)隊(duì)列結(jié)構(gòu)(緩存區(qū)),用于存放句詞; 代表已經(jīng)建立的依存弧集合。對(duì)于要分析的句子 = ( , 為< , , >,終結(jié)狀態(tài)為< , , >。該系統(tǒng)包含了四類動(dòng)t-Arc, Reduce 和 Shift。對(duì)于棧頂詞 ,當(dāng)不存在詞 充當(dāng)其中心詞存于隊(duì)首詞 ,此時(shí)采用動(dòng)作 Left-Arc,即在兩個(gè)詞語(yǔ)間建立一條左為隊(duì)首詞的孩子,同時(shí)將棧頂詞從棧中彈出,如圖 2-5 所示。圖 2-5 動(dòng)作 Left-Arc
【參考文獻(xiàn)】:
期刊論文
[1]漢英詞語(yǔ)對(duì)齊規(guī)范[J]. 趙紅梅,劉群,張瑞強(qiáng),呂雅娟,隅田英一郎,吳翠玲. 中文信息學(xué)報(bào). 2009(03)
[2]漢語(yǔ)句法樹(shù)庫(kù)標(biāo)注體系[J]. 周強(qiáng). 中文信息學(xué)報(bào). 2004(04)
碩士論文
[1]柬埔寨語(yǔ)依存句法分析方法研究[D]. 徐璐.昆明理工大學(xué) 2017
[2]基于深度學(xué)習(xí)的自然語(yǔ)言句法分析研究[D]. 周青宇.哈爾濱工業(yè)大學(xué) 2016
[3]基于主動(dòng)學(xué)習(xí)的漢語(yǔ)依存樹(shù)庫(kù)構(gòu)建[D]. 陳鑫.哈爾濱工業(yè)大學(xué) 2011
本文編號(hào):3098041
【文章來(lái)源】:廣東外語(yǔ)外貿(mào)大學(xué)廣東省
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
對(duì)取自WSJ語(yǔ)料庫(kù)的一個(gè)英文句子Thereisnoasbestosinourproductsnow.做句法分析
動(dòng)作Shift
圖 2-4 動(dòng)作 Leftger 方法rc-eager 轉(zhuǎn)移系統(tǒng)中,每個(gè)狀態(tài)都由一個(gè)三元組< , , >構(gòu)成,其用于存放已被遍歷的詞; 為一個(gè)隊(duì)列結(jié)構(gòu)(緩存區(qū)),用于存放句詞; 代表已經(jīng)建立的依存弧集合。對(duì)于要分析的句子 = ( , 為< , , >,終結(jié)狀態(tài)為< , , >。該系統(tǒng)包含了四類動(dòng)t-Arc, Reduce 和 Shift。對(duì)于棧頂詞 ,當(dāng)不存在詞 充當(dāng)其中心詞存于隊(duì)首詞 ,此時(shí)采用動(dòng)作 Left-Arc,即在兩個(gè)詞語(yǔ)間建立一條左為隊(duì)首詞的孩子,同時(shí)將棧頂詞從棧中彈出,如圖 2-5 所示。圖 2-5 動(dòng)作 Left-Arc
【參考文獻(xiàn)】:
期刊論文
[1]漢英詞語(yǔ)對(duì)齊規(guī)范[J]. 趙紅梅,劉群,張瑞強(qiáng),呂雅娟,隅田英一郎,吳翠玲. 中文信息學(xué)報(bào). 2009(03)
[2]漢語(yǔ)句法樹(shù)庫(kù)標(biāo)注體系[J]. 周強(qiáng). 中文信息學(xué)報(bào). 2004(04)
碩士論文
[1]柬埔寨語(yǔ)依存句法分析方法研究[D]. 徐璐.昆明理工大學(xué) 2017
[2]基于深度學(xué)習(xí)的自然語(yǔ)言句法分析研究[D]. 周青宇.哈爾濱工業(yè)大學(xué) 2016
[3]基于主動(dòng)學(xué)習(xí)的漢語(yǔ)依存樹(shù)庫(kù)構(gòu)建[D]. 陳鑫.哈爾濱工業(yè)大學(xué) 2011
本文編號(hào):3098041
本文鏈接:http://sikaile.net/waiyulunwen/zhichangyingyu/3098041.html
最近更新
教材專著