藏語語音情感識別方法研究
發(fā)布時間:2021-06-28 17:48
隨著自然語言處理技術的發(fā)展和研究工作的不斷深入,藏文信息處理技術也邁入了自然語言處理時代。藏文信息處理技術研究重點已經從“字”為單位的研究轉向語言和語音處理層面,目前藏文自動分詞、詞性標注、語義理解、藏文信息檢索、藏文機器翻譯、藏語語音識別和藏語語音情感識別等關鍵技術成為學者們研究的領域,其中藏語語音識別,特別是藏語語音情感識別越來越備受重視。語音情感識別研究起步較晚和技術不成熟等客觀原因,使該領域技術空白較多、研究成果匱乏。但是社會需求較多、研究價值頗高,故此藏語語音情感識別技術成為了藏語語音信息處理領域的研究熱點。本文主要內容如下:1.通過研究國內外中英文領域語音識別和語音情感識別技術,在緒論部分詳細分析、介紹中英文語音識別和語音情感識別技術在國內外研究現(xiàn)狀及趨勢,然后結合藏語本身的特點來提出本論文的選題來源及選題意義。2.學習研究語音識別技術問題,總結語音識別模板匹配、聲學-語言模型和人工神經網絡三大關鍵技術,并介紹語料庫建設流程、發(fā)音字典創(chuàng)建過程、特征參數(shù)提取方法以及語音識別所涉及到的算法,其中主要介紹了隱馬爾科夫模型、Baum-welch算法、EM算法、高斯混合模型、DTW算...
【文章來源】:西藏大學西藏自治區(qū) 211工程院校
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【部分圖文】:
模式匹配流程圖
圖 2-2 語料庫建設流程圖 文本標注:主要是進行分詞以及詞性標注,為語言模型構建和發(fā)音詞典創(chuàng)建做準備。 語音標注:它用于標記語音的起止(起始、終點)、劃分(語音段、非語音段)、詞位位置、音節(jié)。.2.3 發(fā)音字典創(chuàng)建聲學—語言模型法之發(fā)音字典創(chuàng)建流程如下圖 2-3 所示。
預加重:H(z) = 1 αz ,0.9 ≤ α ≤ 1.0 Mel 頻率:mel = 2595 × log10(1 + freq/700)2.3 語音識別的原理根據(jù)不同實驗設計方式方法要求的不同語音識別系統(tǒng)實驗也有多種方法,但用到的基本技術和實驗原理大致相似。語音識別系統(tǒng)的原理圖如下圖 2-5 所示
【參考文獻】:
期刊論文
[1]基于HMM和ANN混合模型的語音情感識別研究[J]. 林巧民,齊柱柱. 計算機技術與發(fā)展. 2018(10)
[2]臨近最優(yōu)主動學習的藏語語音識別方法研究[J]. 趙悅,李要嬙,徐曉娜,吳立成. 計算機工程與應用. 2018(22)
[3]藏語語音時域參數(shù)提取關鍵技術研究[J]. 卓嘎,姜軍,董志誠. 電腦知識與技術. 2018(08)
[4]一種新的基于DTW的孤立詞語音識別算法[J]. 周炳良,鄧立新,洪民江. 計算機技術與發(fā)展. 2018(04)
[5]基于BP神經網絡與隱馬爾科夫模型的推薦算法[J]. 胡文,宰祥順. 哈爾濱商業(yè)大學學報(自然科學版). 2017(05)
[6]藏語拉薩語LPC語音參數(shù)提取研究[J]. 卓嘎,董志誠. 現(xiàn)代電子技術. 2017(18)
[7]基于隱馬爾可夫模型的新型SQL注入攻擊檢測方法[J]. 楊連群,孟魁,王斌,韓勇. 信息網絡安全. 2017(09)
[8]基于Matlab的藏語語音MFCC參數(shù)提取研究[J]. 卓嘎,姜軍,邊巴旺堆. 西藏大學學報(自然科學版). 2017(01)
[9]基于決策樹和改進SVM混合模型的語音情感識別[J]. 趙涓涓,馬瑞良,張小龍. 北京理工大學學報. 2017(04)
[10]面向聲紋識別的藏語特征提取研究[J]. 李亞瑩,周雁. 西藏科技. 2016(11)
碩士論文
[1]面向信息處理的藏語同形異音詞讀音識別技術研究[D]. 拉巴頓珠.西藏大學 2018
[2]基于語音信號的情感監(jiān)測系統(tǒng)研究[D]. 張欣.華東交通大學 2017
[3]藏語語音識別在遠程教育中的應用[D]. 趙睿.中央民族大學 2017
[4]藏文文本情感分析方法研究[D]. 李苗苗.西藏大學 2017
[5]藏文自動分詞與詞性標注研究[D]. 洛桑嘎登.中央民族大學 2016
[6]基于深度學習的藏語拉薩方言語音識別的研究[D]. 張宇聰.西北師范大學 2016
[7]藏語語音識別技術研究[D]. 拉龍東智.西藏大學 2015
[8]基于HMM與RBF的語音情感識別[D]. 耿麗紅.鄭州大學 2012
[9]小詞匯量語音識別系統(tǒng)[D]. 王坤卿.中國石油大學 2010
本文編號:3254771
【文章來源】:西藏大學西藏自治區(qū) 211工程院校
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【部分圖文】:
模式匹配流程圖
圖 2-2 語料庫建設流程圖 文本標注:主要是進行分詞以及詞性標注,為語言模型構建和發(fā)音詞典創(chuàng)建做準備。 語音標注:它用于標記語音的起止(起始、終點)、劃分(語音段、非語音段)、詞位位置、音節(jié)。.2.3 發(fā)音字典創(chuàng)建聲學—語言模型法之發(fā)音字典創(chuàng)建流程如下圖 2-3 所示。
預加重:H(z) = 1 αz ,0.9 ≤ α ≤ 1.0 Mel 頻率:mel = 2595 × log10(1 + freq/700)2.3 語音識別的原理根據(jù)不同實驗設計方式方法要求的不同語音識別系統(tǒng)實驗也有多種方法,但用到的基本技術和實驗原理大致相似。語音識別系統(tǒng)的原理圖如下圖 2-5 所示
【參考文獻】:
期刊論文
[1]基于HMM和ANN混合模型的語音情感識別研究[J]. 林巧民,齊柱柱. 計算機技術與發(fā)展. 2018(10)
[2]臨近最優(yōu)主動學習的藏語語音識別方法研究[J]. 趙悅,李要嬙,徐曉娜,吳立成. 計算機工程與應用. 2018(22)
[3]藏語語音時域參數(shù)提取關鍵技術研究[J]. 卓嘎,姜軍,董志誠. 電腦知識與技術. 2018(08)
[4]一種新的基于DTW的孤立詞語音識別算法[J]. 周炳良,鄧立新,洪民江. 計算機技術與發(fā)展. 2018(04)
[5]基于BP神經網絡與隱馬爾科夫模型的推薦算法[J]. 胡文,宰祥順. 哈爾濱商業(yè)大學學報(自然科學版). 2017(05)
[6]藏語拉薩語LPC語音參數(shù)提取研究[J]. 卓嘎,董志誠. 現(xiàn)代電子技術. 2017(18)
[7]基于隱馬爾可夫模型的新型SQL注入攻擊檢測方法[J]. 楊連群,孟魁,王斌,韓勇. 信息網絡安全. 2017(09)
[8]基于Matlab的藏語語音MFCC參數(shù)提取研究[J]. 卓嘎,姜軍,邊巴旺堆. 西藏大學學報(自然科學版). 2017(01)
[9]基于決策樹和改進SVM混合模型的語音情感識別[J]. 趙涓涓,馬瑞良,張小龍. 北京理工大學學報. 2017(04)
[10]面向聲紋識別的藏語特征提取研究[J]. 李亞瑩,周雁. 西藏科技. 2016(11)
碩士論文
[1]面向信息處理的藏語同形異音詞讀音識別技術研究[D]. 拉巴頓珠.西藏大學 2018
[2]基于語音信號的情感監(jiān)測系統(tǒng)研究[D]. 張欣.華東交通大學 2017
[3]藏語語音識別在遠程教育中的應用[D]. 趙睿.中央民族大學 2017
[4]藏文文本情感分析方法研究[D]. 李苗苗.西藏大學 2017
[5]藏文自動分詞與詞性標注研究[D]. 洛桑嘎登.中央民族大學 2016
[6]基于深度學習的藏語拉薩方言語音識別的研究[D]. 張宇聰.西北師范大學 2016
[7]藏語語音識別技術研究[D]. 拉龍東智.西藏大學 2015
[8]基于HMM與RBF的語音情感識別[D]. 耿麗紅.鄭州大學 2012
[9]小詞匯量語音識別系統(tǒng)[D]. 王坤卿.中國石油大學 2010
本文編號:3254771
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3254771.html
最近更新
教材專著