基于模糊綜合評價的語音評測模型的研究與實現(xiàn)
本文關鍵詞:基于模糊綜合評價的語音評測模型的研究與實現(xiàn) 出處:《東華理工大學》2017年碩士論文 論文類型:學位論文
【摘要】:隨著移動互聯(lián)網(wǎng)的迅速發(fā)展,語音評測技術已經(jīng)成為當前國內外口語學習領域的研究熱點,目前主要應用于教育行業(yè)中的口語考試評測和口語輔助教學當中。在外語學習過程中,口語學習一直是眾多外語學習者的軟肋,因此如何有效的利用語音評測技術解決外語口語不達標的問題成為當前研究的重點和難點。本文針對目前英語學習中口語評測問題,在分析了英語發(fā)音特點以及語音韻律特征的基礎上,提出了基于模糊綜合評價的語音評測模型,同時將該方法進行移植并實現(xiàn)了基于Android平臺的語音評測系統(tǒng)。主要工作內容如下:首先建立基于云平臺下的標準語音評測庫。采用英國和美國國家語料庫作為標準語音庫。通過線上收集的方法抓取網(wǎng)頁上英語語音文件并分類保存到云平臺上,以及通過線下收集方法對英語單詞進行分類后收集了10個人(不同性別)讀300個單元音的4種情況(正常、升調、降調、錯讀)、300個雙元音、600個多元音的7種情況(正常、快讀、慢讀、升調、降調、部分錯、全部錯)總共75000個語音文件數(shù)據(jù)作為語音訓練庫,由10位英語專家根據(jù)發(fā)音情況進行評測并建立專家評測庫,通過Android平臺的語音上傳模塊以及語音評測模塊不斷擴充云平臺的語音測試庫。其次在分析英語發(fā)音中音高、音長和輕重音等發(fā)音特點的基礎上提取語音的韻律特征信息(梅爾頻率倒譜系數(shù)特征、基頻特征和短時能量特征),利用層次分析法計算出各特征參數(shù)對語音評測結果的權重值,采用動態(tài)時間規(guī)則算法對標準語音和測試語音進行相似度比對,同時提出了基于模糊綜合評價的語音評測模型并給出最后語音評測結果。通過Matlab仿真實驗對改進的語音評測模型進行詳細的性能分析以及實驗對比,實驗顯示該改進模型有很強的高效性和實用性。最后將改進的語音評測模型移植到Android平臺上,設計并實現(xiàn)了基于云平臺的語音評測系統(tǒng),通過實驗人員對系統(tǒng)進行評測效果測試,測試結果基本可以滿足語音評測系統(tǒng)要求。
[Abstract]:With the rapid development of mobile Internet, voice evaluation technology has become a hot topic in the field of oral English learning at home and abroad. At present, it is mainly used in the evaluation of oral examination and oral assistant teaching in education industry. In the process of foreign language learning, oral learning has always been the weakness of many foreign language learners. Therefore, how to effectively use the phonetic evaluation technology to solve the problem of oral English substandard has become the focus and difficulty of current research. This paper aims at the problem of oral evaluation in English learning. Based on the analysis of English pronunciation and phonetic prosody, a speech evaluation model based on fuzzy comprehensive evaluation is proposed. At the same time, the method is transplanted and the voice evaluation system based on Android platform is realized. The main work is as follows:. Firstly, the standard voice evaluation database based on cloud platform is established. The national corpus of the United Kingdom and the United States is used as the standard voice database. The English voice files on the web page are captured and stored on the cloud platform by the method of online collection. After classifying English words offline, 10 people (of different genders) were collected in 4 situations (normal, ascending, descending, misreading, 300 divowels). A total of 75000 voice file data as a voice training library for 7 cases of 600 polyvowels (normal, fast, slow, ascending, down, partially wrong, all wrong). According to the pronunciation of 10 English experts to evaluate and establish an expert evaluation database. Through the voice upload module of Android platform and the voice evaluation module, the voice test library of cloud platform is expanded. Secondly, the analysis of the high pitch of English pronunciation is made. The prosodic feature information (Mel frequency cepstrum coefficient feature, fundamental frequency feature and short time energy feature) is extracted based on the phonetic characteristics such as length and light and heavy tone. AHP is used to calculate the weight of each characteristic parameter to the result of speech evaluation, and the dynamic time rule algorithm is used to compare the similarity between the standard speech and the tested speech. At the same time, the speech evaluation model based on fuzzy comprehensive evaluation is proposed and the final speech evaluation results are given. The improved speech evaluation model is analyzed and compared in detail by Matlab simulation experiment. Experiments show that the improved model has high efficiency and practicability. Finally, the improved voice evaluation model is transplanted to Android platform, and a voice evaluation system based on cloud platform is designed and implemented. The test results can meet the requirements of the speech evaluation system.
【學位授予單位】:東華理工大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TN912.3
【相似文獻】
相關期刊論文 前10條
1 杜守富,詹永照;說話人語音改變技術研究與實現(xiàn)[J];計算機工程;2004年12期
2 謝貴武;楊繼紅;肖勇;閔剛;;基于語音分段的自適應時長調整算法[J];軍事通信技術;2008年02期
3 樊建中;孫晴;楊永杰;;一種智能盲文學習機設計[J];現(xiàn)代電子技術;2010年05期
4 溫洪昌;黃應強;傅貴興;;單片機的多段語音組合錄放系統(tǒng)設計[J];單片機與嵌入式系統(tǒng)應用;2011年10期
5 張劍;袁華強;;Rhetorical-State SVM在抽取式語音摘要中的應用[J];科學技術與工程;2013年21期
6 盧堅 ,毛兵 ,孫正興 ,張福炎;一種改進的基于說話者的語音分割算法[J];軟件學報;2002年02期
7 章文義,朱杰;幾種無語音檢測噪音估計方法的比較研究[J];計算機工程與設計;2003年10期
8 林鑫;陳樺;王開志;王繼成;;語音驅動唇形自動合成算法[J];計算機工程;2007年17期
9 蔡鐵;;基于在線單類支持向量機的自適應語音活動檢測[J];深圳信息職業(yè)技術學院學報;2008年02期
10 章釗;郭武;;話者識別中結合模型和能量的語音激活檢測算法[J];小型微型計算機系統(tǒng);2010年09期
相關會議論文 前9條
1 田野;王作英;陸大金;;基于韻律結構信息的非語音拒識[A];第六屆全國人機語音通訊學術會議論文集[C];2001年
2 徐明;胡瑞敏;黃云森;;基于音素識別的語音評價方法[A];第二屆和諧人機環(huán)境聯(lián)合學術會議(HHME2006)——第15屆中國多媒體學術會議(NCMT'06)論文集[C];2006年
3 王歡良;韓紀慶;李海峰;王承發(fā);;面向嵌入式應用的小詞匯量語音串識別系統(tǒng)[A];第七屆全國人機語音通訊學術會議(NCMMSC7)論文集[C];2003年
4 那斯爾江·吐爾遜;吾守爾·斯拉木;麥麥提艾力;;維吾爾語大詞匯量連續(xù)語音識別研究——語音語料庫的建立[A];民族語言文字信息技術研究——第十一屆全國民族語言文字信息學術研討會論文集[C];2007年
5 簡志華;王向文;;考慮幀間信息的語音轉換算法[A];浙江省信號處理學會2012學術年會論文集[C];2012年
6 魏維;馬海燕;;一種丟失語音信包重建的新算法[A];通信理論與信號處理新進展——2005年通信理論與信號處理年會論文集[C];2005年
7 陳凡;羅四維;;一個實用語音開發(fā)應用系統(tǒng)的設計與實現(xiàn)[A];第二屆全國人機語音通訊學術會議論文集[C];1992年
8 劉紅星;戴蓓劏;陸偉;;基于圖像增強方法的共振峰諧波能量參數(shù)的語音和端點檢測[A];第九屆全國人機語音通訊學術會議論文集[C];2007年
9 林愛華;張文俊;王毅敏;;基于肌肉模型的語音驅動唇形動畫[A];第十三屆全國圖象圖形學學術會議論文集[C];2006年
相關重要報紙文章 前5條
1 atvoc;數(shù)碼語音電路產(chǎn)品概述[N];電子資訊時報;2008年
2 記者 李山;德用雙音素改進人工語音表達[N];科技日報;2012年
3 中國科學院自動化研究所模式識別國家重點實驗室 于劍邋陶建華;個性化語音生成技術面面觀[N];計算機世界;2007年
4 江西 林慧勇;語音合成芯片MSM6295及其應用[N];電子報;2006年
5 ;與“小超人”對話[N];中國計算機報;2001年
相關博士學位論文 前10條
1 高偉勛;智能家居環(huán)境中個性化語音生成關鍵技術研究[D];東華大學;2015年
2 陳麗萍;說話人確認中語音段差異建模相關問題的研究[D];中國科學技術大學;2016年
3 朱錚宇;語音唇動關聯(lián)性分析方法研究及其在錄音回放檢測中的應用[D];華南理工大學;2016年
4 陶冶;文本語音匹配的研究和應用[D];山東大學;2009年
5 何俊;聲紋身份識別中非常態(tài)語音應對方法研究[D];華南理工大學;2012年
6 李冬冬;基于拓展和聚類的情感魯棒說話人識別研究[D];浙江大學;2008年
7 雙志偉;個性化語音生成研究[D];中國科學技術大學;2011年
8 古今;語音感知認證的關鍵技術研究[D];中國科學技術大學;2009年
9 彭波;Internet上語音的魯棒性傳輸研究[D];華南理工大學;2001年
10 黃湘松;基于混淆網(wǎng)絡的漢語語音檢索技術研究[D];哈爾濱工程大學;2010年
相關碩士學位論文 前10條
1 王明明;基于GMM和碼本映射相結合的語音轉換方法研究[D];西安建筑科技大學;2015年
2 印雪晨;宋詞朗讀呼吸信號和韻律時長研究[D];西北民族大學;2015年
3 邱一良;噪聲環(huán)境下的語音檢測方法研究[D];電子科技大學;2015年
4 朱俊梅;基于性別預分類的年齡自動估計研究[D];江蘇師范大學;2014年
5 張占松;基于DSP的語音干擾方法研究與實現(xiàn)[D];北京交通大學;2016年
6 李鵬;基于系統(tǒng)融合的語音查詢項檢索技術研究[D];解放軍信息工程大學;2015年
7 趙蓉蓉;基于計算聽覺場景分析的單通道語音盲分離技術[D];太原理工大學;2016年
8 崔瑞蓮;語種識別中的語音段表示方法研究[D];中國科學技術大學;2016年
9 劉學;基于語音樣例查詢的關鍵詞識別方法研究[D];中國科學技術大學;2016年
10 王振文;漢藏雙語跨語言語音轉換方法的研究[D];西北師范大學;2015年
,本文編號:1428452
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1428452.html