藏文自動分詞技術(shù)方法研究
發(fā)布時間:2021-01-21 22:41
藏文分詞是藏文信息處理中一項不可缺少的基礎(chǔ)性工作。從文本的輸入系統(tǒng)〔如智能語句輸入法、語音輸入、手寫輸入),到文字處理(如文本校對)以及語音合成、文本檢索、文本分類、自然語言接口、自動文摘等,無處不滲透著分詞系統(tǒng)的應(yīng)用,它是藏文信息處理重要基礎(chǔ)之一。眾所周知,英文以詞為單位,以空格隔開。計算機可以容易地理解英文單詞。而藏文句子中,詞與詞之間沒有明顯的分隔符(如空格)。藏文以字(音節(jié)字)為單位,連字成句才能描述一個完整的意思。而對由詞組成的藏文句子,必須通過藏文分詞技術(shù)才得以理解。把藏文的音節(jié)字序列切分成有意義的詞,是藏文分詞的研究工作。通過研究和分析藏文分詞的概念以及國內(nèi)外相關(guān)成果,本文系統(tǒng)地提出了分詞系統(tǒng)中藏文分詞切分單位的劃定原則以及藏文分詞技術(shù)方法,結(jié)合藏文自然標記斷句、以格助詞來為分塊、塊內(nèi)匹配與統(tǒng)計相結(jié)合的分詞方法,提出了藏文自動分詞方法、格助詞的識別方法、交集型和組合型歧義的識別方法及未登錄詞識別方法。進而提出了藏文自動分詞的基礎(chǔ)理論知識及分詞技術(shù)方法。
【文章來源】:西藏大學(xué)西藏自治區(qū) 211工程院校
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
下面結(jié)合藏文句子來進行說明:
【參考文獻】:
期刊論文
[1]藏文分詞中交集型歧義字段的切分方法研究[J]. 普布旦增,歐珠. 西藏大學(xué)學(xué)報(社會科學(xué)版). 2010(S1)
[2]回顧藏文信息處理技術(shù)的發(fā)展[J]. 高定國,關(guān)白. 西藏大學(xué)學(xué)報(社會科學(xué)版). 2009(03)
[3]面向信息處理的藏文分詞規(guī)范研究[J]. 扎西加,珠杰. 中文信息學(xué)報. 2009(04)
[4]藏文自動分詞系統(tǒng)中緊縮詞的識別[J]. 才智杰. 中文信息學(xué)報. 2009(01)
[5]基于藏語信息處理的詞類體系研究[J]. 扎西加,索南尖措. 西藏大學(xué)學(xué)報(自然科學(xué)版). 2008(01)
[6]信息處理用藏文自動分詞研究[J]. 祁坤鈺. 西北民族大學(xué)學(xué)報(哲學(xué)社會科學(xué)版). 2006(04)
[7]基于大型藏文語料庫的藏文字符、部件、音節(jié)、詞匯頻度與通用度統(tǒng)計及其應(yīng)用研究[J]. 盧亞軍,馬少平,張敏,羅廣. 西北民族大學(xué)學(xué)報(自然科學(xué)版). 2003(02)
[8]藏文自動分詞系統(tǒng)的設(shè)計與實現(xiàn)[J]. 陳玉忠,李保利,俞士汶. 中文信息學(xué)報. 2003(03)
[9]基于格助詞和接續(xù)特征的藏文自動分詞方案[J]. 陳玉忠,李保利,俞士汶,蘭措吉. 語言文字應(yīng)用. 2003(01)
[10]基于統(tǒng)計的無詞典分詞方法[J]. 傅賽香,袁鼎榮,黃柏雄,鐘智. 廣西科學(xué)院學(xué)報. 2002(04)
碩士論文
[1]中文自動分詞若干技術(shù)的研究[D]. 柴寶杰.燕山大學(xué) 2007
[2]詞典與后綴數(shù)組相結(jié)合的中文分詞[D]. 張淑梅.吉林大學(xué) 2006
[3]漢語自動分詞中排除歧義字段算法的研究[D]. 劉禹孜.重慶大學(xué) 2005
本文編號:2992015
【文章來源】:西藏大學(xué)西藏自治區(qū) 211工程院校
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
下面結(jié)合藏文句子來進行說明:
【參考文獻】:
期刊論文
[1]藏文分詞中交集型歧義字段的切分方法研究[J]. 普布旦增,歐珠. 西藏大學(xué)學(xué)報(社會科學(xué)版). 2010(S1)
[2]回顧藏文信息處理技術(shù)的發(fā)展[J]. 高定國,關(guān)白. 西藏大學(xué)學(xué)報(社會科學(xué)版). 2009(03)
[3]面向信息處理的藏文分詞規(guī)范研究[J]. 扎西加,珠杰. 中文信息學(xué)報. 2009(04)
[4]藏文自動分詞系統(tǒng)中緊縮詞的識別[J]. 才智杰. 中文信息學(xué)報. 2009(01)
[5]基于藏語信息處理的詞類體系研究[J]. 扎西加,索南尖措. 西藏大學(xué)學(xué)報(自然科學(xué)版). 2008(01)
[6]信息處理用藏文自動分詞研究[J]. 祁坤鈺. 西北民族大學(xué)學(xué)報(哲學(xué)社會科學(xué)版). 2006(04)
[7]基于大型藏文語料庫的藏文字符、部件、音節(jié)、詞匯頻度與通用度統(tǒng)計及其應(yīng)用研究[J]. 盧亞軍,馬少平,張敏,羅廣. 西北民族大學(xué)學(xué)報(自然科學(xué)版). 2003(02)
[8]藏文自動分詞系統(tǒng)的設(shè)計與實現(xiàn)[J]. 陳玉忠,李保利,俞士汶. 中文信息學(xué)報. 2003(03)
[9]基于格助詞和接續(xù)特征的藏文自動分詞方案[J]. 陳玉忠,李保利,俞士汶,蘭措吉. 語言文字應(yīng)用. 2003(01)
[10]基于統(tǒng)計的無詞典分詞方法[J]. 傅賽香,袁鼎榮,黃柏雄,鐘智. 廣西科學(xué)院學(xué)報. 2002(04)
碩士論文
[1]中文自動分詞若干技術(shù)的研究[D]. 柴寶杰.燕山大學(xué) 2007
[2]詞典與后綴數(shù)組相結(jié)合的中文分詞[D]. 張淑梅.吉林大學(xué) 2006
[3]漢語自動分詞中排除歧義字段算法的研究[D]. 劉禹孜.重慶大學(xué) 2005
本文編號:2992015
本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/2992015.html
最近更新
教材專著