漢語方言資源數(shù)據(jù)庫管理系統(tǒng)
【學(xué)位授予單位】:西北民族大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:H17;TP311.13
【圖文】:
西北民族大學(xué)碩士學(xué)位論文2音節(jié)聲韻調(diào)切分模塊此模塊是將現(xiàn)有的音節(jié)與聲母、韻母的國際音標(biāo)比較,從而得出自己的聲韻母和聲調(diào)。一個(gè)漢字就是一個(gè)音節(jié),按照音韻學(xué)的分類方法,一個(gè)音節(jié)是聲母、韻母和聲調(diào)三個(gè)部分組成的。聲母就是等于一個(gè)輔音,它可以缺省,做零聲母(表示有效位置)。韻母可包括三個(gè)音素:介音、主要元音、尾音。介和尾音是可以缺省的。普通話的聲調(diào)一般有 5種:陰平,陽平,上聲、去聲、聲。普通話的音節(jié)結(jié)構(gòu)可概括如圖 2.1。在音節(jié)字符串中,要準(zhǔn)確的找到聲、韻母和聲調(diào),主要是要找到音節(jié)的邊界字符,因?yàn)闈h藏語言絕大部分都是調(diào)語言,它的音節(jié)可以分析出這三種構(gòu)成成分。漢語音節(jié)包括 24個(gè)聲母,6單韻母和 30個(gè)復(fù)韻母,還有 4種聲調(diào)(陰平、陽平、上聲、去聲)。本模塊主要任務(wù)是將音節(jié)的聲母、韻母還有聲調(diào)分離開,例如:巴(pa陰平)分解,聲母為 p,韻母為 a,聲調(diào)是陰平;他(t a陰平)分解后,聲母為 t ,韻母為調(diào)為陰平。本模塊分解后的表如 2.2 所示。
容易學(xué)習(xí)又容易使用,函數(shù)名和表達(dá)更接近于書寫計(jì)算公式的表達(dá)方強(qiáng)大而智能化的圖形功能;開放性好,易于擴(kuò)充等等。這也是 MAT深入到科學(xué)研究及工程計(jì)算各個(gè)領(lǐng)域,如此受歡迎的重要原因。3.2 系統(tǒng)總體設(shè)計(jì)及界面實(shí)現(xiàn)系統(tǒng)打算分為以下幾個(gè)模塊:語音選擇區(qū)、檢索區(qū)、音位統(tǒng)計(jì)區(qū)區(qū)、功能區(qū)和結(jié)果顯示區(qū)等。語言選擇區(qū)包括 20個(gè)方言點(diǎn),如北京沙、成都等;檢索區(qū)包括漢字、拼音、聲母、韻母、聲調(diào);音位統(tǒng)計(jì)母、韻母和聲調(diào)三大部分,聲母分為兩個(gè)部分:發(fā)音部位(雙唇音)法(塞音),韻母也分為兩個(gè)部分,結(jié)構(gòu)(鼻化元音)和韻頭(開口調(diào)分為:陰平、陽平、陰上、陽上、陰去、陽去、陰入、陰入等等;區(qū)包括音位負(fù)擔(dān)計(jì)算和方言距離的計(jì)算;功能區(qū)包括音韻調(diào)切分、屬注和頻次;音頻視頻的顯示與播放可以在結(jié)果顯示區(qū)點(diǎn)擊單字顯示,的結(jié)果可保存為 excel 表。圖 3.1和圖 3.2是系統(tǒng)總體的設(shè)計(jì)圖和系統(tǒng)體界面圖。
圖 3.2 系統(tǒng)總體界面圖3.3 系統(tǒng)功能實(shí)現(xiàn)3.3.1音節(jié)聲韻調(diào)切分模塊實(shí)現(xiàn)本模塊的核心思想是最大正向匹配算法,其基本思路為:假設(shè) a為聲母庫中最大聲母的字符數(shù),那么匹配字段為被處理數(shù)據(jù)的當(dāng)前字串中的前 i個(gè)字,在聲母庫中查找。如果這樣的一個(gè) a在聲母庫中被查找到,那么匹配成功,匹配字段就被作為這個(gè)音節(jié)的聲母而切分出來。如果聲母中沒有找到這樣的一個(gè)a字符,那么匹配失敗,接著去掉匹配字段 a 中的最后一個(gè)字符,重新匹配剩下的子串,如此循環(huán)下去,直到匹配到聲母成功為止,也就是直到最后切分出一個(gè)聲母,這樣的話,聲母就會(huì)被尋找出來,由于聲母找到,韻母就是聲母留下的部分,而聲調(diào)就是 a 這個(gè)音節(jié)的最后兩個(gè)。一個(gè)音節(jié)被分開成聲母、韻母和聲調(diào)后,就會(huì)然后再匹配處理下一個(gè) a,直到掃描完整個(gè)數(shù)據(jù)庫為止。數(shù)據(jù)庫中的音節(jié)儲(chǔ)存形式為(以北京話為例)這樣的,巴(pa陰平)、宿( iou去
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 富林;;國家社會(huì)科學(xué)基金重大項(xiàng)目“漢語方言音系匯纂及方音對照處理系統(tǒng)研究”啟動(dòng)[J];陜西師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2015年04期
2 曹志耘;;方言瀕危、文化碎片和方言學(xué)者的使命[J];中國語言學(xué)報(bào);2014年00期
3 韓夏;李龍;潘悟云;;計(jì)算機(jī)田野調(diào)查及處理系統(tǒng)[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年06期
4 范俊軍;;漢語方言自然口語語料庫建設(shè)的幾個(gè)基本問題[J];學(xué)術(shù)研究;2013年02期
5 解林清;方華萍;金雅聲;;漢語普通話常用字、音節(jié)和音位的統(tǒng)計(jì)分析[J];西北民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年03期
6 范俊軍;;基于調(diào)查字表詞表注音的漢藏語言音系處理系統(tǒng)[J];語言文字應(yīng)用;2012年02期
7 安見才讓;;面向漢語教學(xué)的漢藏語料庫系統(tǒng)設(shè)計(jì)和實(shí)現(xiàn)[J];微處理機(jī);2012年02期
8 李宇明;;論中國語言資源有聲數(shù)據(jù)庫的建設(shè)[J];中國語文;2010年04期
9 洪拓夷;;漢語方言語音數(shù)據(jù)庫建設(shè)構(gòu)想[J];圖書情報(bào)工作;2009年05期
10 金慧敏;廖燕莎;史菁;陳琪;;藏語方言計(jì)算機(jī)輔助系統(tǒng)的研究[J];科技信息;2009年01期
相關(guān)碩士學(xué)位論文 前2條
1 顧宇杰;面向微博評論的中文文本情感分類研究[D];云南財(cái)經(jīng)大學(xué);2018年
2 張義;基于MAPGIS的中國歷史方言地理信息系統(tǒng)(CHDGIS)設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2006年
本文編號(hào):2786501
本文鏈接:http://sikaile.net/guanlilunwen/glzh/2786501.html