天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

融合多策略的維吾爾語詞干提取方法

發(fā)布時間:2017-06-28 17:04

  本文關(guān)鍵詞:融合多策略的維吾爾語詞干提取方法,由筆耕文化傳播整理發(fā)布。


【摘要】:維吾爾語是形態(tài)變化復雜的黏著性語言之一,詞的構(gòu)成和其詞義都是依賴于形式復雜的詞綴連接來表示的。詞綴不僅改變詞根的詞義,也會決定一個詞在句子中的作用。因此只要正確的把詞干和詞綴分開才能正確的表示整體單詞所表達的真正意義。到目前為止,維吾爾語詞干提取的性能仍存在較大的改進空間。因此我們從維吾爾語構(gòu)詞特點出發(fā),對維吾爾語詞干進行了研究。本文針對維吾爾語詞的形態(tài)結(jié)構(gòu)特點出發(fā),提出了兩種維吾爾語詞干提取模型,一個是融合多策略的維吾爾語詞干提取模型。前輩的基于規(guī)則和統(tǒng)計相結(jié)合的維吾爾語詞干提取方法的準確率達到了95%,為了解決前輩的系統(tǒng)切分當中存在的歧義現(xiàn)象和過度切分問題提出了融合詞性特征和上下文詞干信息。實驗結(jié)果表明,與基準系統(tǒng)比較,融入的詞性特征和上下文詞干信息的詞級實驗準確率分別達到了95.19%和96.60%。另一個維吾爾語詞干提取模型是基于詞干-詞綴統(tǒng)計量的維吾爾語詞干提取模型,此方法的詞干提取準確率達到了94%,為了進一步提高系統(tǒng)的性能,我們引入詞干-詞綴權(quán)重比例后準確率達到了95.69%。雖然這個方法對維吾爾語詞干提取系統(tǒng)性能有所貢獻,但后續(xù)還要進一步分析研究維吾爾語的詞干-詞綴,詞干-復合詞綴之間的語法規(guī)則來進一步提高詞干提取系統(tǒng)的準確率。
【關(guān)鍵詞】:詞法分析 詞干提取 N-gram模型 詞性特征 上下文詞干信息
【學位授予單位】:新疆大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1;H215
【目錄】:
  • 摘要2-3
  • Abstract3-6
  • 第一章 引言6-14
  • 1.1 課題研究背景及意義6-9
  • 1.1.1 研究背景6-7
  • 1.1.2 研究意義7-9
  • 1.2 國內(nèi)外研究進展9-12
  • 1.2.1 國外詞干提取研究狀況9-11
  • 1.2.2 國內(nèi)詞干提取研究狀況11-12
  • 1.3 主要工作和組織結(jié)構(gòu)12-14
  • 第二章 維吾爾語詞法規(guī)則14-22
  • 2.1 維吾爾語詞法特征14-17
  • 2.1.1 維吾爾語弱化特性15-16
  • 2.1.2 維吾爾語和諧規(guī)律16
  • 2.1.3 元音脫落和輔音增音16-17
  • 2.2 維吾爾語詞類17
  • 2.2.1 維吾爾語詞性分類17
  • 2.3 上下文信息概述17-18
  • 2.4 維吾爾語詞干切分分析18-19
  • 2.5 維吾爾語音節(jié)切分分析19-20
  • 2.6 詞干提取語料庫介紹20-22
  • 第三章 詞干提取模型22-27
  • 3.1 基于規(guī)則的詞干提取方法22
  • 3.2 基于統(tǒng)計的詞干提取方法22-25
  • 3.2.1 N-Gram的語言模型23
  • 3.2.2 隱馬爾可夫模型23-24
  • 3.2.3 后續(xù)變化模型24-25
  • 3.3 基于混合詞干提取方法25
  • 3.4 常用平滑算法25-27
  • 第四章 融合多策略的維吾爾語詞干提取方法27-38
  • 4.1 規(guī)則庫的建立27-28
  • 4.2 統(tǒng)計語言模型的建立28-30
  • 4.3 基準系統(tǒng)存在的問題及解決方案30-31
  • 4.4 維吾爾語詞性特征31-33
  • 4.5 上下文詞干信息33-35
  • 4.6 實驗結(jié)果及分析35-38
  • 4.6.1 實驗設置35
  • 4.6.2 實驗結(jié)果及分析35-38
  • 第五章 基于詞干詞綴統(tǒng)計量的維吾爾語詞干提取方法38-44
  • 5.1 基于詞干詞綴統(tǒng)計量的維吾爾語詞干提取過程39-41
  • 5.2 實驗結(jié)果及分析41-44
  • 5.2.1 實驗設置41
  • 5.2.2 實驗結(jié)果與分析41-44
  • 第六章 總結(jié)與展望44-45
  • 參考文獻45-48
  • 攻讀碩士期間發(fā)表論文和參加科研情況48-49
  • 致謝49-50

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 祖菲亞·玉努斯;淺論維吾爾語中借詞的出現(xiàn)及其對維吾爾語所產(chǎn)生的影響[J];新疆教育學院學報;2000年03期

2 曹春梅;淺析維吾爾語中的飲食用語[J];新疆職工大學學報;2000年03期

3 吾買爾·賽地;;淺議維吾爾語復合詞[J];和田師范?茖W校學報;2002年02期

4 華錦木;對我區(qū)維吾爾語專業(yè)現(xiàn)狀與改革的思考[J];喀什師范學院學報;2003年05期

5 黃中民;淺論維吾爾語詞的理據(jù)[J];喀什師范學院學報;2004年01期

6 李素秋;試論維吾爾語中的禮貌表示法[J];語言與翻譯;2004年04期

7 菲達·烏馬爾別克,阿孜古麗·阿不都熱合曼;維吾爾語元音歷史演變[J];新疆社科論壇;2005年03期

8 李燕萍;;維吾爾語人體詞的隱喻特征和文化意蘊[J];語言與翻譯;2006年02期

9 穆合塔爾·阿不都熱西提;;淺談維吾爾語詈詞及文化內(nèi)涵[J];語言與翻譯;2007年04期

10 廖澤余;;維吾爾語詞語理據(jù)說略[J];語言與翻譯;2008年04期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 吾買爾江·庫爾班;阿里甫·庫爾班;;維吾爾語框架語義知識庫語義角色描述體系研究[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設聯(lián)合學術(shù)研討會論文集[C];2010年

2 阿里甫·庫爾班;吾買爾江·庫爾班;尼加提·阿不都肉蘇力;;維吾爾語框架語義網(wǎng)的數(shù)據(jù)庫結(jié)構(gòu)的設計[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設聯(lián)合學術(shù)研討會論文集[C];2010年

3 古麗娜爾·艾力;買買提玉素甫·蘇來曼;;維吾爾語語音數(shù)據(jù)自動標注[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設聯(lián)合學術(shù)研討會論文集[C];2010年

4 阿布都熱依木·熱合曼;艾山·吾買爾;吐爾根·依布拉音;帕里旦·吐爾遜;哈里旦木·阿布都克里木;;維吾爾語句法樹庫標注體系[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設聯(lián)合學術(shù)研討會論文集[C];2010年

5 艾斯卡爾·艾木都拉;;維吾爾語鼻音的聲學特征分析[A];第九屆中國語音學學術(shù)會議論文集[C];2010年

6 梁潔;楊新璐;;維吾爾語韻律層級邊界感知及其聲學特征研究[A];第九屆中國語音學學術(shù)會議論文集[C];2010年

7 阿依克孜.卡德爾;開沙爾.卡德爾;吐爾根.依布拉音;;面向自然語言信息處理的維吾爾語名詞形態(tài)分析研究[A];第二屆全國學生計算語言學研討會論文集[C];2004年

8 吾守爾.斯拉木;馬歡;;維吾爾語文語轉(zhuǎn)換系統(tǒng)的研究[A];第十屆全國少數(shù)民族語言文字信息處理學術(shù)研討會論文集[C];2005年

9 易斌;;維吾爾語元音/y/的聲學特征分析[A];第十屆全國少數(shù)民族語言文字信息處理學術(shù)研討會論文集[C];2005年

10 艾斯卡爾·艾木都拉;賽爾達爾·雅力坤;祖麗皮亞·阿曼;地里木拉提·吐爾遜;;維吾爾語濁塞音的聲學特征分析[A];第十二屆全國人機語音通訊學術(shù)會議(NCMMSC'2013)論文集[C];2013年

中國重要報紙全文數(shù)據(jù)庫 前10條

1 記者井波、實習生郁萌;維吾爾語水平考試系統(tǒng)進入研發(fā)階段[N];新疆日報(漢);2010年

2 特約記者 藺高峰 通訊員 武瑞;女法醫(yī)“西日古麗”[N];喀什日報(漢);2010年

3 本報記者 任紅芳;阿克蘇電視臺維吾爾語譯制中心錄音棚投用[N];阿克蘇日報;2010年

4 一東;以多語種服務打造溝通新渠道[N];亞洲中心時報(漢);2011年

5 自治區(qū)地方志編委會、自治區(qū)黨委駐伽師縣工作隊 張堅義;語言架起溝通心靈的橋梁[N];新疆日報(漢);2012年

6 劉冰;從王蒙流利的維吾爾語想到的[N];中國民族報;2013年

7 記者 江亞平;搞分裂慌不擇言,熱比婭謊話連篇[N];新華每日電訊;2009年

8 陳學迅;王蒙談維吾爾民族語言文化[N];新疆日報(漢);2005年

9 記者 王新紅;中央人民廣播電臺新疆維吾爾語編輯部工程開建[N];新疆日報(漢);2010年

10 記者 達·照日格圖;我國首部蒙古文字手機研制成功[N];內(nèi)蒙古日報(漢);2006年

中國博士學位論文全文數(shù)據(jù)庫 前10條

1 阿布都那扎爾·阿布都拉;維吾爾語構(gòu)詞詞綴歷時比較研究[D];中央民族大學;2009年

2 巴克力·阿卜杜熱西提;古代維吾爾語醫(yī)學文獻的語文學研究[D];中央民族大學;2013年

3 倪宏鳴;維吾爾語和阿美語語言特征對比分析[D];中央民族大學;2007年

4 魏玉清;維吾爾語和諧現(xiàn)象的音系學研究[D];華東師范大學;2010年

5 尼加提·蘇皮;維吾爾語伊犁土語研究[D];中央民族大學;2010年

6 斯迪克江·伊布拉音;現(xiàn)代維吾爾語中的比喻研究[D];華東師范大學;2008年

7 阿克里·先木西;維吾爾語表語—系動詞謂語結(jié)構(gòu)[D];中央民族大學;2012年

8 吐爾遜·卡得;維吾爾語柯坪土語研究[D];中央民族大學;2011年

9 木再帕爾(Muzappar Abdurusul);論維吾爾語的名詞化短語[D];中央民族大學;2007年

10 席艷玲;維吾爾語失語癥特點及其檢查法的標準化研究和維吾爾族、漢族正常人腦激活區(qū)差異性的fMRI研究[D];新疆醫(yī)科大學;2013年

中國碩士學位論文全文數(shù)據(jù)庫 前10條

1 魏文娟;改革開放以來維吾爾語新詞研究[D];新疆大學;2008年

2 阿孜古麗·阿不都熱西提;維吾爾語伊犁土語中的借詞研究[D];西北民族大學;2008年

3 張紅;探析維吾爾語中茶文化[D];新疆師范大學;2012年

4 熱依拉·艾紕漏拉;漢語—維吾爾語顏色詞翻譯對比研究[D];中央民族大學;2013年

5 孔席梅;維吾爾語和回族話中借詞的分析比較[D];新疆師范大學;2013年

6 熱那古力·如孜;察哈臺語文獻《祖胡利詩集》(Divān_(-1) (?)uh ūr_1)的研究[D];中央民族大學;2015年

7 美合日班·吐爾洪;腭咽閉合不全患者維吾爾語輔音/gh/特點及其矯正方法的初探[D];新疆醫(yī)科大學;2016年

8 阿地拉·瓦爾斯;維吾爾語子女教育主題的諺語分析[D];新疆師范大學;2016年

9 穆開熱姆·伊薩米丁;維吾爾語專業(yè)學生使用兼代副動詞偏誤分析[D];新疆師范大學;2016年

10 楊勇;維吾爾語專業(yè)學生聽說教材使用調(diào)查研究[D];新疆師范大學;2016年


  本文關(guān)鍵詞:融合多策略的維吾爾語詞干提取方法,,由筆耕文化傳播整理發(fā)布。



本文編號:494584

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/494584.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2f6b2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com