基于句子跨度的哈薩克語句法分析研究
發(fā)布時間:2021-07-07 09:50
哈薩克語句法分析的研究隨著神經(jīng)網(wǎng)絡技術的廣泛應用也取得了較大的進展,從過去使用大量的語言語法規(guī)則進行句法分析以及使用大規(guī)模語料訓練統(tǒng)計模型的句法分析方法逐漸將神經(jīng)網(wǎng)絡技術融入其中,并對句法分析的效果有了進一步的提升。短語句法分析技術主要分為兩大類:基于轉移的句法分析與基于線圖的句法分析。本文進行哈薩克語句法分析研究中在以上兩種方法的基礎上進行了句法分析。本文在基于轉移的方法上將句子跨度作為基本單位進行處理,在移進-歸約的操作上主要分為兩種:結構動作與短語標記動作。其中結構動作主要是對句子跨度的分支點進行存儲,短語標記動作主要是對句子跨度進行相應的短語標記。在此基礎上使用Bi LSTM神經(jīng)網(wǎng)絡獲取句子跨度特征,使用多層感知機進行參數(shù)訓練,在句法樹解碼方法上對動態(tài)規(guī)劃算法、貪心算法以及柱搜索算法進行了比較。根據(jù)實驗對比分析得到以下結論:1)使用Bi LSTM神經(jīng)網(wǎng)絡獲取句子跨度特征時兩層的Bi LSTM比一層的Bi LSTM更能將句子跨度在句子上下文中的特征信息獲取到。2)在解碼算法的選擇上使用貪心算法時,解碼速度較快,但準確率不高,使用柱搜索算法解碼時,句法分析準確率較高。3)在柱搜索算...
【文章來源】:新疆大學新疆維吾爾自治區(qū) 211工程院校
【文章頁數(shù)】:47 頁
【學位級別】:碩士
【部分圖文】:
短語“thegooddesk”樹形結構集線圖表示線圖方法其優(yōu)點主要有:
LSTM結構
1( [ , ] )t f t t ff W h x b (2-4)門to 以及新單元狀態(tài)tC 的更新如下:t t t 1t tC f C i C (2-5)1( [ , ] )t o t t oo W h x b (2-6)tanh( )t t th o C(2-7)般使用 sigmoid 函數(shù)輸出一個 0~1 之間的數(shù)字,描述每個成分 , , ,i C f oW W W W 為參數(shù)矩陣, , , ,i C f ob b b b 為偏置向量。TM(bi-directional LSTM)是雙向 LSTM,由一個前向 LSTM 神 LSTM 神經(jīng)網(wǎng)絡組成,利用前向 LSTM 得到的向量與后向 L行拼接得到詞在整個句子中的上下文中位置。其對一個句子的 所示:
【參考文獻】:
期刊論文
[1]由粗到精的哈薩克語短語結構句法分析研究[J]. 梁金蓮,古麗拉·阿東別克. 中文信息學報. 2018(01)
[2]基于PChart算法的哈薩克語句法分析[J]. 尚文清,古麗拉·阿東別克,牛娜,于智娟. 計算機工程與設計. 2016(03)
[3]基于PCFG模型的哈薩克語句法分析[J]. 尚文清,古麗拉·阿東別克,牛娜,于智娟. 現(xiàn)代計算機(專業(yè)版). 2015(14)
[4]基于統(tǒng)計的句法分析方法[J]. 袁里馳. 中南大學學報(自然科學版). 2014(08)
[5]基于統(tǒng)計學習模型的句法分析方法綜述[J]. 吳偉成,周俊生,曲維光. 中文信息學報. 2013(03)
[6]漢語自動句法分析的理論與方法[J]. 劉挺,馬金山. 當代語言學. 2009(02)
[7]基于規(guī)則的漢語句法分析方法研究[J]. 王鵬,戴新宇,陳家駿,王啟祥. 計算機工程與應用. 2003(29)
[8]四種基本統(tǒng)計句法分析模型在漢語句法分析中的性能比較[J]. 孟遙,李生,趙鐵軍,曹海龍. 中文信息學報. 2003(03)
[9]基于短語結構語法的自動句法分析方法[J]. 馮志偉. 當代語言學. 2000(02)
[10]淺層句法分析方法概述[J]. 孫宏林,俞士汶. 當代語言學. 2000(02)
博士論文
[1]基于神經(jīng)網(wǎng)絡的句法分析研究[D]. 周浩.南京大學 2017
[2]漢語依存句法分析關鍵技術研究[D]. 李正華.哈爾濱工業(yè)大學 2013
碩士論文
[1]基于深度學習的自然語言句法分析研究[D]. 周青宇.哈爾濱工業(yè)大學 2016
[2]基于CVG模型的中文短語結構句法分析研究[D]. 李靜毅.鄭州大學 2015
[3]漢語依存句法分析技術研究[D]. 郭振.北京交通大學 2015
[4]基于GLR算法的維吾爾語句法分析研究[D]. 朱敬國.新疆大學 2011
[5]基于Chart算法的維吾爾語句法分析系統(tǒng)的設計與實現(xiàn)[D]. 哈里旦木·阿布都克里木.新疆大學 2010
[6]基于層疊條件隨機場的漢語句法分析技術的研究[D]. 劉新.沈陽航空工業(yè)學院 2010
[7]基于圖和轉移算法相結合的中文依存關系解析[D]. 劉春紅.大連理工大學 2009
[8]基于轉換的依存句法分析研究[D]. 沈超.復旦大學 2009
[9]基于依存語法的漢語句法分析研究[D]. 高玲玲.中國海洋大學 2009
[10]基于概率上下文無關文法的漢語句法分析方法研究[D]. 胡芊.北京郵電大學 2009
本文編號:3269414
【文章來源】:新疆大學新疆維吾爾自治區(qū) 211工程院校
【文章頁數(shù)】:47 頁
【學位級別】:碩士
【部分圖文】:
短語“thegooddesk”樹形結構集線圖表示線圖方法其優(yōu)點主要有:
LSTM結構
1( [ , ] )t f t t ff W h x b (2-4)門to 以及新單元狀態(tài)tC 的更新如下:t t t 1t tC f C i C (2-5)1( [ , ] )t o t t oo W h x b (2-6)tanh( )t t th o C(2-7)般使用 sigmoid 函數(shù)輸出一個 0~1 之間的數(shù)字,描述每個成分 , , ,i C f oW W W W 為參數(shù)矩陣, , , ,i C f ob b b b 為偏置向量。TM(bi-directional LSTM)是雙向 LSTM,由一個前向 LSTM 神 LSTM 神經(jīng)網(wǎng)絡組成,利用前向 LSTM 得到的向量與后向 L行拼接得到詞在整個句子中的上下文中位置。其對一個句子的 所示:
【參考文獻】:
期刊論文
[1]由粗到精的哈薩克語短語結構句法分析研究[J]. 梁金蓮,古麗拉·阿東別克. 中文信息學報. 2018(01)
[2]基于PChart算法的哈薩克語句法分析[J]. 尚文清,古麗拉·阿東別克,牛娜,于智娟. 計算機工程與設計. 2016(03)
[3]基于PCFG模型的哈薩克語句法分析[J]. 尚文清,古麗拉·阿東別克,牛娜,于智娟. 現(xiàn)代計算機(專業(yè)版). 2015(14)
[4]基于統(tǒng)計的句法分析方法[J]. 袁里馳. 中南大學學報(自然科學版). 2014(08)
[5]基于統(tǒng)計學習模型的句法分析方法綜述[J]. 吳偉成,周俊生,曲維光. 中文信息學報. 2013(03)
[6]漢語自動句法分析的理論與方法[J]. 劉挺,馬金山. 當代語言學. 2009(02)
[7]基于規(guī)則的漢語句法分析方法研究[J]. 王鵬,戴新宇,陳家駿,王啟祥. 計算機工程與應用. 2003(29)
[8]四種基本統(tǒng)計句法分析模型在漢語句法分析中的性能比較[J]. 孟遙,李生,趙鐵軍,曹海龍. 中文信息學報. 2003(03)
[9]基于短語結構語法的自動句法分析方法[J]. 馮志偉. 當代語言學. 2000(02)
[10]淺層句法分析方法概述[J]. 孫宏林,俞士汶. 當代語言學. 2000(02)
博士論文
[1]基于神經(jīng)網(wǎng)絡的句法分析研究[D]. 周浩.南京大學 2017
[2]漢語依存句法分析關鍵技術研究[D]. 李正華.哈爾濱工業(yè)大學 2013
碩士論文
[1]基于深度學習的自然語言句法分析研究[D]. 周青宇.哈爾濱工業(yè)大學 2016
[2]基于CVG模型的中文短語結構句法分析研究[D]. 李靜毅.鄭州大學 2015
[3]漢語依存句法分析技術研究[D]. 郭振.北京交通大學 2015
[4]基于GLR算法的維吾爾語句法分析研究[D]. 朱敬國.新疆大學 2011
[5]基于Chart算法的維吾爾語句法分析系統(tǒng)的設計與實現(xiàn)[D]. 哈里旦木·阿布都克里木.新疆大學 2010
[6]基于層疊條件隨機場的漢語句法分析技術的研究[D]. 劉新.沈陽航空工業(yè)學院 2010
[7]基于圖和轉移算法相結合的中文依存關系解析[D]. 劉春紅.大連理工大學 2009
[8]基于轉換的依存句法分析研究[D]. 沈超.復旦大學 2009
[9]基于依存語法的漢語句法分析研究[D]. 高玲玲.中國海洋大學 2009
[10]基于概率上下文無關文法的漢語句法分析方法研究[D]. 胡芊.北京郵電大學 2009
本文編號:3269414
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3269414.html
最近更新
教材專著