基于轉(zhuǎn)移的哈薩克語(yǔ)句子分析技術(shù)研究
本文關(guān)鍵詞:基于轉(zhuǎn)移的哈薩克語(yǔ)句子分析技術(shù)研究 出處:《新疆大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 串行分析 聯(lián)合模型 基于轉(zhuǎn)移的分析方法 Beam-Search解碼算法
【摘要】:哈薩克語(yǔ)句子級(jí)別的分析技術(shù)主要包括詞性標(biāo)注,組塊,句法分析和語(yǔ)義分析,現(xiàn)在哈薩克語(yǔ)處理已經(jīng)進(jìn)展到短語(yǔ)結(jié)構(gòu)句法分析層面。本文主要對(duì)哈薩克語(yǔ)詞性標(biāo)注,組塊和短語(yǔ)結(jié)構(gòu)句法分析進(jìn)行相應(yīng)研究。傳統(tǒng)的哈薩克語(yǔ)句子分析技術(shù)一般采用層次順序串行分析每個(gè)任務(wù),每個(gè)任務(wù)分析時(shí)都采用最佳模型進(jìn)行分析。但是這種串行分析的方法存在兩個(gè)問題:第一是錯(cuò)誤蔓延,即低層任務(wù)的結(jié)果作為上層任務(wù)的輸入,如果低層任務(wù)出現(xiàn)錯(cuò)誤,勢(shì)必會(huì)影響上層任務(wù)的結(jié)果。第二是每層任務(wù)采用局部最優(yōu),高層任務(wù)的信息無(wú)法傳送到低層任務(wù)。對(duì)于這個(gè)問題,聯(lián)合模型很好的解決了這個(gè)問題。由于聯(lián)合模型的解碼時(shí)搜索空間是各個(gè)任務(wù)搜索空間的乘積,因此聯(lián)合分析模型中最多選擇兩個(gè)任務(wù)進(jìn)行聯(lián)合分析。統(tǒng)計(jì)模型的方法包括基于轉(zhuǎn)移的分析方法和基于圖模型的分析方法。基于轉(zhuǎn)移的分析方法相比于基于圖的分析方法在性能上略差,但是其解碼效率上有明顯的優(yōu)勢(shì)。為了提高基于轉(zhuǎn)移的分析方法性能,有兩種可行性方法。第一,提高下層任務(wù)性能,從而提高整體任務(wù)性能。第二,建立聯(lián)合模型,利用任務(wù)之間的相互作用提升整體性能。在本文中對(duì)詞性標(biāo)注、組塊、句法分析三個(gè)任務(wù)展開四個(gè)方面的研究工作:1.本文設(shè)計(jì)詞性標(biāo)注和組塊進(jìn)行聯(lián)合分析,詞性和組塊進(jìn)行相互作用提升各自準(zhǔn)確率,并把其結(jié)果作為句法分析的輸入,從而提高句法分析的準(zhǔn)確率。2.設(shè)計(jì)混合模型對(duì)詞性標(biāo)注和組塊聯(lián)合分析,既解決了串行模型錯(cuò)誤蔓延和下層任務(wù)不能利用上層任務(wù)信息的問題,在本文中利用組塊信息解決兼類詞的歧義問題;又解決了聯(lián)合模型特征選擇受限問題,整體上提高詞性標(biāo)注和組塊的準(zhǔn)確率。3.本文改進(jìn)Beam-Search解碼算法,即把固定柱值B改為動(dòng)態(tài)柱值。即對(duì)候選集合中選項(xiàng)的分值都與集合中的最大分值相比,并設(shè)計(jì)固定閾值進(jìn)行剪枝比值較小的候選結(jié)果。改進(jìn)精準(zhǔn)了搜索空間,使結(jié)果準(zhǔn)確率提高。4.在句法分析中,設(shè)計(jì)獎(jiǎng)勵(lì)函數(shù)來(lái)降低Beam-Search解碼算法在搜索時(shí)剪枝最佳結(jié)果的風(fēng)險(xiǎn),使解碼更為精準(zhǔn),從而提高準(zhǔn)確率。
【學(xué)位授予單位】:新疆大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.1
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前6條
1 尚文清;古麗拉·阿東別克;牛娜;于智娟;;基于PChart算法的哈薩克語(yǔ)句法分析[J];計(jì)算機(jī)工程與設(shè)計(jì);2016年03期
2 韓冰;劉一佳;車萬(wàn)翔;劉挺;;基于感知器的中文分詞增量訓(xùn)練方法研究[J];中文信息學(xué)報(bào);2015年05期
3 桑海巖;古麗拉·阿東別克;牛寧寧;;基于最大熵的哈薩克語(yǔ)詞性標(biāo)注模型[J];計(jì)算機(jī)工程與應(yīng)用;2013年11期
4 吳偉成;周俊生;曲維光;;基于統(tǒng)計(jì)學(xué)習(xí)模型的句法分析方法綜述[J];中文信息學(xué)報(bào);2013年03期
5 馬驥;朱慕華;肖桐;朱靖波;;面向移進(jìn)—?dú)w約句法分析器的單模型系統(tǒng)整合算法[J];中文信息學(xué)報(bào);2012年03期
6 侯呈風(fēng);古麗拉·阿東別克;;改進(jìn)的HMM應(yīng)用于哈薩克語(yǔ)詞性標(biāo)注[J];計(jì)算機(jī)工程與應(yīng)用;2010年36期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 張梅山;中文詞法句法語(yǔ)義聯(lián)合分析模型研究[D];哈爾濱工業(yè)大學(xué);2014年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 于智娟;基于層疊CRFs的哈薩克語(yǔ)樹庫(kù)構(gòu)建技術(shù)研究[D];新疆大學(xué);2015年
,本文編號(hào):1307986
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1307986.html