天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

藏語安多方言文本相關(guān)的說話人識別研究

發(fā)布時(shí)間:2020-04-15 13:30
【摘要】:伴隨著科學(xué)與技術(shù)的快速發(fā)展,智能設(shè)備已經(jīng)逐漸進(jìn)入了人們生活中。作為最核心的部分人機(jī)交互也從以往的手指、手勢操控而慢慢地轉(zhuǎn)變?yōu)槿祟惤涣髯匀磺腋咝У姆绞健Z音。語音體現(xiàn)人機(jī)交互的方式主要有兩個(gè)方面,一個(gè)是讓機(jī)器自己發(fā)出聲音,另一個(gè)是讓機(jī)器聽懂人類所說的話。而語音識別作為當(dāng)下人工智能的產(chǎn)物,又分為語義識別和說話人識別。顧名思義,語義識別是讓機(jī)器聽懂人說了什么話,而說話人識別是讓機(jī)器辨別出說話人的身份。本文就是結(jié)合了兩者進(jìn)行藏語安多方言的相關(guān)研究,在基于HTK(Hidden Markov Model Toolkit)平臺中的隱馬爾科夫模型(Hidden Markov Model,HMM)讓機(jī)器識別說話人身份的同時(shí)還要識別出語義的內(nèi)容。首先對說話人進(jìn)行錄音,建立語料庫,然后將語料進(jìn)行預(yù)處理,接著對語音信號進(jìn)行特征分析,提取梅爾頻率倒譜系數(shù)(Mel Frequency Cepstrum Coefficient,MFCC),建立HMM。再將建立好的模型與特征參數(shù)進(jìn)行匹配,認(rèn)為最高的概率值所代表的含義即為說話人的身份和語義的內(nèi)容。本文主要研究工作如下所示:1.建立藏語安多方言語料庫。對于藏語安多方言,實(shí)驗(yàn)室目前沒有語料庫,因此本文隨機(jī)選取了6位藏語安多方言說話人,分別為4男2女,年齡在18-20歲,總計(jì)錄制60句話120個(gè)詞。建立好的語句、孤立詞被分別用來說話人識別和語義識別。緊接著對語料進(jìn)行預(yù)處理。2.提取特征參數(shù)。對于說話人識別,將預(yù)處理后的語音信號進(jìn)行聲學(xué)分析,提取特征參數(shù),本文選擇了說話人識別中常用到的特征參數(shù)MFCC。而對于語義識別,由于本文研究的是藏語安多方言,因此藏文轉(zhuǎn)寫、建立語法詞典、語音標(biāo)注是實(shí)驗(yàn)順利進(jìn)行的前提。3.建立模型庫。將訓(xùn)練階段提取出的特征參數(shù)分別建立說話人模型庫和語義模型庫,然后與識別階段的特征參數(shù)進(jìn)行概率比對,選出最大值,得出識別結(jié)果,然后將每次實(shí)驗(yàn)說話人的識別結(jié)果與語義的識別結(jié)果進(jìn)行統(tǒng)計(jì),得出兩者同時(shí)識別出結(jié)果的雙重識別率。實(shí)驗(yàn)表明,識別出說話人的平均識別率為71.9%,識別出語義的平均識別率為88.3%,最終同時(shí)識別出兩者的平均識別率為58.4%。
【圖文】:

框圖,框圖


說話人識別系統(tǒng)框圖

濾波器組,三角,帶通濾波器,傳遞函數(shù)


圖 3.3Mel 三角濾波器組 3.3 中可以觀察到在其中共安放了 n 個(gè)帶通濾波器(Band Pass Filte f ( m )為中心頻率,,每一個(gè) BPF 的傳遞函數(shù)為:0 ( 1)k f m
【學(xué)位授予單位】:西北師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TN912.34

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 齊耀輝;潘復(fù)平;葛鳳培;顏永紅;;鑒別性最大后驗(yàn)概率線性回歸說話人自適應(yīng)研究[J];北京理工大學(xué)學(xué)報(bào);2015年09期

2 孫健;;基于MATLAB的語音信號時(shí)頻分析研究[J];電腦知識與技術(shù);2015年16期

3 程紅偉;陶俊勇;蔣瑜;陳循;;基于高斯混合模型的非高斯隨機(jī)振動幅值概率密度函數(shù)[J];振動與沖擊;2014年05期

4 黎林;朱軍;;基于小波分析與神經(jīng)網(wǎng)絡(luò)的語音端點(diǎn)檢測研究[J];電子測量與儀器學(xué)報(bào);2013年06期

5 王鐘斐;王彪;;基于短時(shí)能量—LPCC的語音特征提取方法研究[J];計(jì)算機(jī)與數(shù)字工程;2012年11期

6 肖東;莫福源;陳庚;馬力;;混合激勵(lì)線性預(yù)測語音編碼標(biāo)準(zhǔn)中線譜頻率量化的研究[J];應(yīng)用聲學(xué);2012年02期

7 李冠宇;孟猛;;藏語拉薩話大詞表連續(xù)語音識別聲學(xué)模型研究[J];計(jì)算機(jī)工程;2012年05期

8 李冠宇;;隱馬爾可夫模型及其在語音識別中的應(yīng)用[J];科技風(fēng);2011年23期

9 徐坤玉;張彩珍;藥雪崧;;語音信號的加窗傅里葉變換研究[J];山西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期

10 崔宣;孫華;劉瀏;;基于SVM-GMM混合模型的說話人辨認(rèn)研究[J];西華大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年01期

相關(guān)會議論文 前2條

1 劉靜萍;德熙嘉措;;安多藏語輔音識別的設(shè)計(jì)[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年

2 李洪波;于洪志;;藏語語音識別的預(yù)處理研究[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年

相關(guān)博士學(xué)位論文 前1條

1 王智國;嵌入式人機(jī)語音交互系統(tǒng)關(guān)鍵技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2014年

相關(guān)碩士學(xué)位論文 前10條

1 潘怡霖;基于i-vector特征規(guī)整的概率線性判別分析說話人確認(rèn)方法研究[D];哈爾濱工業(yè)大學(xué);2017年

2 朱虹;基于Kinect的特定說話人跟蹤系統(tǒng)的研究與實(shí)現(xiàn)[D];延邊大學(xué);2017年

3 張帥林;基于HMM的關(guān)鍵詞語音識別技術(shù)在智能家居中的應(yīng)用研究[D];蘭州交通大學(xué);2017年

4 趙存成;在線式開集說話人識別系統(tǒng)的設(shè)計(jì)與實(shí)施[D];北京郵電大學(xué);2017年

5 于云;基于非重構(gòu)壓縮采樣的抗噪說話人識別技術(shù)研究[D];南京郵電大學(xué);2016年

6 李青龍;基于碼本聚類優(yōu)化的VQ說話人識別SOPC設(shè)計(jì)[D];齊齊哈爾大學(xué);2016年

7 薛帥強(qiáng);基于文本無關(guān)的說話人識別技術(shù)的研究[D];西南科技大學(xué);2016年

8 張文克;融合LPCC和MFCC特征參數(shù)的語音識別技術(shù)的研究[D];湘潭大學(xué);2016年

9 馬倩倩;基于個(gè)性特征的語音轉(zhuǎn)換技術(shù)研究[D];河北經(jīng)貿(mào)大學(xué);2013年

10 李旭飛;說話人識別在身份認(rèn)證中的應(yīng)用研究[D];西安電子科技大學(xué);2013年



本文編號:2628605

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2628605.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶95a69***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com