天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

語(yǔ)音自動(dòng)識(shí)別技術(shù)及其在電信彩鈴業(yè)務(wù)中的應(yīng)用研究

發(fā)布時(shí)間:2018-06-11 11:04

  本文選題:語(yǔ)音識(shí)別 + 隱馬爾可夫模型; 參考:《西安電子科技大學(xué)》2014年碩士論文


【摘要】:語(yǔ)音識(shí)別技術(shù)(Automatic Speech Recognitio n)又稱ASR技術(shù),它是一種將人聲語(yǔ)音信號(hào)轉(zhuǎn)化為可以被計(jì)算機(jī)程序識(shí)別的文字信息,從而識(shí)別、了解講話人所發(fā)出指令和意圖的技術(shù)。語(yǔ)音識(shí)別技術(shù)的終極目標(biāo)是實(shí)現(xiàn)機(jī)器與人之間可通過(guò)自然語(yǔ)言進(jìn)行互動(dòng)。二十世紀(jì)五十年代,美國(guó)電話電報(bào)公司(ATT)貝爾實(shí)驗(yàn)室里建成第一臺(tái)語(yǔ)音識(shí)別系統(tǒng)——Audry系統(tǒng),它僅能識(shí)別十個(gè)英文數(shù)字。上世紀(jì)八十年代末期,數(shù)字信息技術(shù)、計(jì)算機(jī)軟硬件技術(shù)的發(fā)展掀起前所未有的高潮,為語(yǔ)音識(shí)別的研發(fā)帶來(lái)堅(jiān)實(shí)的技術(shù)支撐。語(yǔ)音識(shí)別技術(shù)在商業(yè)領(lǐng)域首先得以應(yīng)用,并迅速擴(kuò)展到社會(huì)生產(chǎn)和生活的每一領(lǐng)域,自身也受到不斷更新的技術(shù)的要求。本文首先在第一章簡(jiǎn)要介紹國(guó)內(nèi)外語(yǔ)音識(shí)別技術(shù)的發(fā)展現(xiàn)狀。其次,從ASR技術(shù)的基本模型方面,介紹了端點(diǎn)檢測(cè)、預(yù)處理、模塊生成、模塊匹配和模塊管理等環(huán)節(jié)中的模式識(shí)別和數(shù)字信號(hào)處理的原理。本文通過(guò)分析和研究語(yǔ)音識(shí)別技術(shù)的發(fā)展歷程,分別通過(guò)HMM(隱馬爾科夫模型)和DTW(動(dòng)態(tài)時(shí)間規(guī)正法)設(shè)計(jì)漢語(yǔ)語(yǔ)言的語(yǔ)音識(shí)別系統(tǒng)。HMM具有較強(qiáng)的時(shí)間序列建模能力,對(duì)時(shí)間進(jìn)行特征參數(shù)的訓(xùn)練,每個(gè)語(yǔ)音對(duì)應(yīng)自己的隱馬爾科夫模型,語(yǔ)音與隱馬爾科夫模型進(jìn)行對(duì)應(yīng)匹配,完成識(shí)別過(guò)程。HMM通常適用在需要識(shí)別大詞匯量的情況。DTW能夠很好的處理語(yǔ)音信號(hào)特征參數(shù)的時(shí)間長(zhǎng)短不同性問(wèn)題,具有識(shí)別速度快、系統(tǒng)費(fèi)用少和有效的小詞匯量處理作用。每節(jié)結(jié)尾都通過(guò)Matlab進(jìn)行仿真,并提供腳本。最后對(duì)整個(gè)彩鈴語(yǔ)音識(shí)別平臺(tái)的系統(tǒng)進(jìn)行了系統(tǒng)的介紹。彩鈴語(yǔ)音識(shí)別平臺(tái)通過(guò)運(yùn)用聲動(dòng)炫鈴系統(tǒng)中的IVR架構(gòu)設(shè)計(jì)技術(shù),并結(jié)合語(yǔ)音識(shí)別和語(yǔ)音合成等語(yǔ)音領(lǐng)域的關(guān)鍵技術(shù),采用voice xml標(biāo)準(zhǔn)語(yǔ)言工具研發(fā)的一個(gè)應(yīng)用系統(tǒng)。用戶通過(guò)輸入一個(gè)特定的號(hào)碼進(jìn)入服務(wù)器,用語(yǔ)音或者按鍵選出歌手名或者歌曲的形式傳輸給系統(tǒng)命令,就能獲得自己定制彩鈴。通過(guò)采用專用的語(yǔ)言界面,方便用戶的操作過(guò)程,主要使用VXML技術(shù)實(shí)現(xiàn)電話流程。彩鈴語(yǔ)音識(shí)別系統(tǒng)還設(shè)有彩鈴語(yǔ)音識(shí)別平臺(tái)場(chǎng)景及腳本代碼。
[Abstract]:Automatic speech recognition (ASR) is a technology that converts speech signals into text information that can be recognized by computer programs, so as to recognize and understand the instructions and intentions issued by speakers. The ultimate goal of speech recognition technology is to realize the interaction between machines and people through natural language. In the 1950s, AT & T Bell Labs built the first speech recognition system, the Audry system, which recognized only ten English numbers. In the late eighties of last century, the development of digital information technology, computer software and hardware technology set off an unprecedented climax, which brought solid technical support for the research and development of speech recognition. Speech recognition technology has been first applied in the commercial field, and has been rapidly extended to every field of social production and life. It is also subject to the requirements of constantly updated technology. In the first chapter, this paper briefly introduces the development of speech recognition technology at home and abroad. Secondly, from the basic model of ASR technology, the principles of pattern recognition and digital signal processing are introduced, such as endpoint detection, preprocessing, module generation, module matching and module management. By analyzing and studying the development of speech recognition technology, this paper designs the speech recognition system of Chinese language by hmm (Hidden Markov Model) and DTW (dynamic time normalization method), respectively. Each speech has its own Hidden Markov Model, and the speech and Hidden Markov Model are matched. The completion of the recognition process. Hmm is usually applicable to the need to identify large vocabulary. DTW can deal with the different time of speech signal feature parameters well. It has the advantages of fast recognition, low system cost and effective small vocabulary processing. The end of each section is simulated by Matlab, and the script is provided. Finally, the system of CRBT speech recognition platform is introduced systematically. The platform of color ring tone recognition adopts voice xml standard language tool to develop an application system, which is based on the design technology of voice xml architecture, and combined with the key technologies in speech field such as speech recognition and speech synthesis. By entering a specific number into the server and selecting the singer's name or song by voice or keystroke to transmit to the system command, the user can obtain his own custom color bell. By using a special language interface to facilitate the user's operation process, the main use of VXML technology to achieve the telephone flow. The CRBT speech recognition system also has the scene and script code of CRBT speech recognition platform.
【學(xué)位授予單位】:西安電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TN912.34

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 郭遠(yuǎn)瓊;提高語(yǔ)音識(shí)別率點(diǎn)滴[J];電腦技術(shù);2000年03期

2 邢文;語(yǔ)音識(shí)別[J];個(gè)人電腦;2000年02期

3 ;語(yǔ)音識(shí)別的真相[J];個(gè)人電腦;2001年12期

4 ;語(yǔ)音識(shí)別漸入佳境[J];個(gè)人電腦;2002年03期

5 ;微軟語(yǔ)音識(shí)別軟件可與人直接對(duì)話[J];自動(dòng)化博覽;2003年04期

6 ;語(yǔ)音識(shí)別[J];印刷世界;2004年01期

7 杰里米·瓦格斯塔夫;讓語(yǔ)音識(shí)別軟件 解放你的雙手[J];農(nóng)業(yè)圖書情報(bào)學(xué)刊;2004年03期

8 韓紀(jì)慶,王歡良,李海峰,鄭鐵然;基于語(yǔ)音識(shí)別的發(fā)音學(xué)習(xí)技術(shù)[J];電聲技術(shù);2004年09期

9 陳孝強(qiáng);語(yǔ)音識(shí)別擬起新潮[J];微電腦世界;2005年07期

10 韓紀(jì)慶;張磊;鄭鐵然;;網(wǎng)絡(luò)環(huán)境下的語(yǔ)音識(shí)別方法[J];計(jì)算機(jī)科學(xué);2005年01期

相關(guān)會(huì)議論文 前10條

1 張歆奕;吳今培;張其善;;語(yǔ)音的共性特征及其在語(yǔ)音識(shí)別中的應(yīng)用[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年

2 杜樹木;何良華;;一種新的基于段長(zhǎng)分布的語(yǔ)音識(shí)別模型[A];2009年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2009年

3 李楨;高萬(wàn)林;歐文浩;徐山川;;基于關(guān)鍵詞語(yǔ)音識(shí)別的農(nóng)業(yè)信息語(yǔ)音服務(wù)系統(tǒng)的研究與實(shí)現(xiàn)[A];中國(guó)農(nóng)業(yè)工程學(xué)會(huì)電氣信息與自動(dòng)化專業(yè)委員會(huì)、中國(guó)電機(jī)工程學(xué)會(huì)農(nóng)村電氣化分會(huì)科技與教育專委會(huì)2010年學(xué)術(shù)年會(huì)論文摘要[C];2010年

4 張冰;龍長(zhǎng)才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語(yǔ)音識(shí)別[A];泛在信息社會(huì)中的聲學(xué)——中國(guó)聲學(xué)學(xué)會(huì)2010年全國(guó)會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文集[C];2010年

5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語(yǔ)音識(shí)別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年

6 杜笑平;楊啟綱;楊家沅;;過(guò)零周期轉(zhuǎn)移概率矩陣語(yǔ)音識(shí)別部件的研制[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年

7 季宏;劉志文;杜燕玲;黃曾陽(yáng);;語(yǔ)音識(shí)別中的音字轉(zhuǎn)換[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年

8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語(yǔ)音識(shí)別的幾個(gè)問(wèn)題(一)[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年

9 朱奇峰;俞鐵城;;聽覺(jué)中的協(xié)同現(xiàn)象和其對(duì)語(yǔ)音識(shí)別影響的探討[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年

10 姚磊;黃泰翼;陳景東;;一種高魯棒性語(yǔ)音識(shí)別的通用自適應(yīng)方法研究[A];第四屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1996年

相關(guān)重要報(bào)紙文章 前10條

1 黃夢(mèng);方案商積極切入語(yǔ)音識(shí)別市場(chǎng)[N];電腦商報(bào);2006年

2 閆婷;語(yǔ)音識(shí)別 理想與現(xiàn)實(shí)的距離[N];計(jì)算機(jī)世界;2007年

3 劉喜喜;語(yǔ)音識(shí)別將把鼠標(biāo)鍵盤打入冷宮?[N];中國(guó)計(jì)算機(jī)報(bào);2008年

4 樂(lè)天;語(yǔ)音識(shí)別:讓你的手機(jī)更聰明[N];計(jì)算機(jī)世界;2011年

5 特約作者 王佳彬;語(yǔ)音識(shí)別漸入佳境[N];電腦報(bào);2002年

6 雨夏;語(yǔ)音識(shí)別重在應(yīng)用[N];計(jì)算機(jī)世界;2001年

7 ;語(yǔ)音識(shí)別企業(yè)應(yīng)用前景光明[N];計(jì)算機(jī)世界;2003年

8 王向東 欒煥博 林守勛 錢躍良;語(yǔ)音識(shí)別:抗噪音能力有待加強(qiáng)[N];計(jì)算機(jī)世界;2006年

9 上海 高博;讓電腦“聽懂”人話[N];電腦報(bào);2008年

10 張彤;語(yǔ)音識(shí)別融入統(tǒng)一通信[N];網(wǎng)絡(luò)世界;2008年

相關(guān)博士學(xué)位論文 前10條

1 許金普;農(nóng)產(chǎn)品市場(chǎng)信息采集的語(yǔ)音識(shí)別魯棒性方法研究[D];中國(guó)農(nóng)業(yè)科學(xué)院;2015年

2 吳斌;語(yǔ)音識(shí)別中的后處理技術(shù)研究[D];北京郵電大學(xué);2008年

3 奉小慧;音頻噪聲環(huán)境下唇動(dòng)信息在語(yǔ)音識(shí)別中的應(yīng)用技術(shù)研究[D];華南理工大學(xué);2010年

4 孫f,

本文編號(hào):2004969


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/2004969.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶115a4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com