天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

基于流形學(xué)習(xí)的語音特征提取研究

發(fā)布時間:2018-02-15 11:19

  本文關(guān)鍵詞: 流形學(xué)習(xí) 語音識別 特征提取 MFCC 倒譜系數(shù) 出處:《山東大學(xué)》2017年碩士論文 論文類型:學(xué)位論文


【摘要】:語音識別技術(shù)是語音信號處理技術(shù)的最重要的研究方向之一,其主要研究的對象是人類的話音信號。語音識別系統(tǒng)通過模擬人類的聽覺過程,使得電腦可以利用某些算法實現(xiàn)準確理解人的話音。進入新世紀以來,個人計算機和數(shù)字信號處理等的信息科學(xué)技術(shù)有了極大的進步,特別是近5年以來,云計算和大數(shù)據(jù)技術(shù)的廣泛應(yīng)用,使得語音識別領(lǐng)域的研究進展迅速。語音識別技術(shù)的應(yīng)用越來越廣泛,已經(jīng)深入到人們的生活中,不斷改變著人們的生活習(xí)慣。在ASR系統(tǒng)中,提取語音的聲學(xué)特征是語音信號處理的第一個也是最關(guān)鍵的一個步驟。本文在對語音產(chǎn)生原理及人的聽覺機理的研究基礎(chǔ)上,利用流形學(xué)習(xí)算法對語音信號進行參數(shù)化,提出了一種全新的語音特征參數(shù)提取方法。流形學(xué)習(xí)算法是一種最近十幾年才發(fā)展起來的非線性的數(shù)據(jù)降維方法,目前流形學(xué)習(xí)研究的重點在圖像處理相關(guān)的領(lǐng)域,特別是在圖像檢索、面部姿態(tài)識別、手寫文字識別等領(lǐng)域相較傳統(tǒng)算法有更好的表現(xiàn),而在聲音信號處理特別是語音識別領(lǐng)域的相關(guān)研究相對較少。語音識別中較成熟的特征參數(shù)MFCC、LPCC等均基于線性系統(tǒng)理論,而語音的發(fā)聲系統(tǒng)為非線性時變系統(tǒng),MFCC等特征很難反映出語音信號的本質(zhì)特征。流形學(xué)習(xí)的目的是尋找非線性數(shù)據(jù)的本質(zhì)特征,發(fā)掘蘊含于高維數(shù)據(jù)內(nèi)部之幾何結(jié)構(gòu)。利用流形學(xué)習(xí)方法對語音信號進行研究,就是找出語音信號的內(nèi)在特征,即發(fā)現(xiàn)語音信號中存在的低維流形,提高自動語音識別系統(tǒng)的識別準確率。通過提高語音識別的準確率,進而提高人工智能、語言輸入、身份識別等應(yīng)用的效率,具有一定的實際現(xiàn)實意義。本文首先介紹了流形學(xué)習(xí)相關(guān)的理論、語音的產(chǎn)生原理和常見的基于倒譜的語音特征參數(shù)提取方法,同時結(jié)合聲管模型分析了語音信號中低維流形結(jié)構(gòu)的存在性,創(chuàng)設(shè)了一類運用流形學(xué)習(xí)算法提取的語音信號特征參數(shù)的方法。該方法的創(chuàng)新性在于將流形學(xué)習(xí)技術(shù)與人類的發(fā)聲原理和聽覺機理聯(lián)系起來,通過該方法提取的語音特征在語音音素的可分性、音素聚類以及小詞匯量識別等方面與傳統(tǒng)的特征提取方法相比具有更好的性能。該方法的提出,為人工智能、語言輸入及身份識別等語音識別應(yīng)用中的特征參數(shù)提取提供了新的選擇,為研究人員進行相關(guān)研究提供了借鑒意義。
[Abstract]:Speech recognition technology is one of the most important research directions of speech signal processing technology. In the new century, the information science and technology of personal computer and digital signal processing have made great progress, especially in the past five years. With the wide application of cloud computing and big data technology, the research of speech recognition is developing rapidly. The application of speech recognition technology is more and more extensive, and it has been deeply into people's lives and changing people's living habits. Extracting acoustic features of speech is the first and most important step in speech signal processing. Based on the research of speech production principle and human auditory mechanism, this paper uses manifold learning algorithm to parameterize speech signal. A new method for extracting speech feature parameters is proposed. Manifold learning algorithm is a nonlinear data dimensionality reduction method which has been developed in recent ten years. At present, the research of manifold learning is focused on the field of image processing. Especially in the fields of image retrieval, facial posture recognition, handwritten character recognition and so on, it has better performance than traditional algorithms. However, there are relatively few researches in the field of sound signal processing, especially in the field of speech recognition. The more mature feature parameters MFCC / LPCC and so on are based on linear system theory. It is difficult to reflect the essential characteristics of speech signal by the phonetic system such as MFCC, which is a nonlinear time-varying system. The purpose of manifold learning is to find out the essential features of nonlinear data. The study of speech signal by manifold learning method is to find out the inherent characteristics of speech signal, that is, to find the low dimensional manifold in speech signal. Improve the recognition accuracy of automatic speech recognition system. By improving the accuracy of speech recognition, and then improve the efficiency of artificial intelligence, language input, identity recognition and other applications, This paper first introduces the theory of manifold learning, the principle of speech production and the common speech feature extraction method based on cepstrum. At the same time, combining the acoustic tube model, the existence of the low dimensional manifold structure of speech signal is analyzed. A new method for extracting feature parameters of speech signal using manifold learning algorithm is developed. The innovation of this method is to link manifold learning technology with the principle of human phonation and auditory mechanism. The speech features extracted by this method have better performance than the traditional feature extraction methods in terms of speech phoneme separability, phoneme clustering and small vocabulary recognition. The extraction of feature parameters in speech recognition applications, such as language input and identity recognition, provides a new choice and provides a reference for researchers to do relevant research.
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TN912.3

【相似文獻】

相關(guān)期刊論文 前10條

1 曾憲華;羅四維;;動態(tài)增殖流形學(xué)習(xí)算法[J];計算機研究與發(fā)展;2007年09期

2 曾憲華;羅四維;;局部保持的流形學(xué)習(xí)算法對比研究[J];計算機工程與應(yīng)用;2008年29期

3 劉志勇;;基于保距與保拓撲的流形學(xué)習(xí)算法[J];長江大學(xué)學(xué)報(自然科學(xué)版)理工卷;2010年02期

4 閆志敏;劉希玉;;流形學(xué)習(xí)及其算法研究[J];計算機技術(shù)與發(fā)展;2011年05期

5 楊海紅;;流形學(xué)習(xí)中鄰域大小的選擇算法[J];山西煤炭管理干部學(xué)院學(xué)報;2011年01期

6 周華;蔡超;丁明躍;;基于流形學(xué)習(xí)和流形高階近似的圖像距離度量[J];華中科技大學(xué)學(xué)報(自然科學(xué)版);2012年03期

7 石陸魁;張軍;宮曉騰;;基于鄰域保持的流形學(xué)習(xí)算法評價模型[J];計算機應(yīng)用;2012年09期

8 談超;關(guān)佶紅;周水庚;;增量與演化流形學(xué)習(xí)綜述[J];智能系統(tǒng)學(xué)報;2012年05期

9 徐蓉;姜峰;姚鴻勛;;流形學(xué)習(xí)概述[J];智能系統(tǒng)學(xué)報;2006年01期

10 羅四維;趙連偉;;基于譜圖理論的流形學(xué)習(xí)算法[J];計算機研究與發(fā)展;2006年07期

相關(guān)會議論文 前4條

1 宋欣;王娟;張斌;葉世偉;;流形學(xué)習(xí)算法分析及在人臉數(shù)據(jù)庫上的應(yīng)用[A];2008年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(上冊)[C];2008年

2 劉曉平;季浩;鄧偉財;;基于流形學(xué)習(xí)的非線性系統(tǒng)可視化算法[A];全國第21屆計算機技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2010)暨全國第2屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會議論文集[C];2010年

3 何慧;陳博;郭軍;;基于流形學(xué)習(xí)的半監(jiān)督文本情感分類算法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年

4 蔣全勝;賈民平;胡建中;許飛云;;一種基于流形學(xué)習(xí)的故障模式識別方法[A];第九屆全國振動理論及應(yīng)用學(xué)術(shù)會議論文集[C];2007年

相關(guān)博士學(xué)位論文 前10條

1 蘇祖強;基于泛化流形學(xué)習(xí)的風(fēng)電機組傳動系統(tǒng)早期故障診斷方法研究[D];重慶大學(xué);2015年

2 馬婧華;基于流形學(xué)習(xí)的旋轉(zhuǎn)機械早期故障融合診斷方法研究[D];重慶大學(xué);2015年

3 邢向磊;流形學(xué)習(xí)與稀疏表示在模式識別中的應(yīng)用[D];南京大學(xué);2013年

4 盧磊;機械加工過程中的早期故障微弱信號處理方法研究[D];哈爾濱工業(yè)大學(xué);2016年

5 郝中華;基于微分流形的非線性降維方法研究[D];上海大學(xué);2016年

6 黃紅兵;層次流形學(xué)習(xí)及其在監(jiān)督分類中的應(yīng)用[D];上海交通大學(xué);2015年

7 杜春;流形學(xué)習(xí)及其應(yīng)用算法研究[D];國防科學(xué)技術(shù)大學(xué);2014年

8 黃鴻;圖嵌入框架下流形學(xué)習(xí)理論及應(yīng)用研究[D];重慶大學(xué);2008年

9 尹峻松;流形學(xué)習(xí)理論與方法研究及在人臉識別中的應(yīng)用[D];國防科學(xué)技術(shù)大學(xué);2007年

10 黃啟宏;流形學(xué)習(xí)方法理論研究及圖像中應(yīng)用[D];電子科技大學(xué);2007年

相關(guān)碩士學(xué)位論文 前10條

1 胡浩松;基于流形學(xué)習(xí)的旋轉(zhuǎn)機械故障識別方法研究[D];燕山大學(xué);2015年

2 丁春濤;基于圖嵌入的判別近鄰分析研究及應(yīng)用[D];蘇州大學(xué);2015年

3 余嬋娟;交互式人臉檢索中人機人臉認知一致性研究[D];上海大學(xué);2015年

4 陳明霞;基于半監(jiān)督的多流形學(xué)習(xí)算法研究[D];華僑大學(xué);2015年

5 顧陽陽;基于流形學(xué)習(xí)的雷達輻射源識別技術(shù)[D];西安電子科技大學(xué);2014年

6 高漢宇;基于最優(yōu)r-覆蓋堆積數(shù)本征維數(shù)估計方法及其應(yīng)用[D];西安電子科技大學(xué);2014年

7 羅廷金;基于流形學(xué)習(xí)的數(shù)據(jù)降維算法研究[D];國防科學(xué)技術(shù)大學(xué);2013年

8 周韻然;基于流形學(xué)習(xí)的A股上市公司抽樣的信用評價[D];電子科技大學(xué);2014年

9 史仍浩;基于流形學(xué)習(xí)的在線社會網(wǎng)絡(luò)節(jié)點分類[D];上海交通大學(xué);2013年

10 陳詩文;流形學(xué)習(xí)在數(shù)據(jù)降維中的應(yīng)用研究[D];浙江工業(yè)大學(xué);2015年



本文編號:1513143

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1513143.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5151c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com