天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

面向低資源場(chǎng)景的語音表示學(xué)習(xí)及其應(yīng)用

發(fā)布時(shí)間:2020-10-17 02:58
   面向低資源場(chǎng)景的語音表示學(xué)習(xí)是計(jì)算機(jī)語音語言處理的一個(gè)非常基礎(chǔ)的任務(wù),其特點(diǎn)是低資源即目標(biāo)語音數(shù)據(jù)缺少語言學(xué)相關(guān)的人工標(biāo)注信息,其目的是為語音信號(hào)提供具有語言學(xué)內(nèi)容及語音基礎(chǔ)單元表達(dá)能力的表示方法。關(guān)于低資源場(chǎng)景語音表示學(xué)習(xí)的研究具有廣泛而深遠(yuǎn)的意義。一方面,它可為語言習(xí)得等認(rèn)知科學(xué)領(lǐng)域的探索提供基礎(chǔ)計(jì)算模型和驗(yàn)證方法;另一方面,它可為自動(dòng)語音識(shí)別等工程應(yīng)用提供基礎(chǔ)技術(shù)支撐。本文針對(duì)低資源的特點(diǎn),圍繞無監(jiān)督的語音基礎(chǔ)結(jié)構(gòu)信息挖掘和跨語種信息借用的策略,提出多種具有語音基礎(chǔ)結(jié)構(gòu)信息表達(dá)能力的語音特征表示方法,并考察這些特征學(xué)習(xí)方法在基于樣例的口語詞匯檢出和語音文檔主題分割任務(wù)上的應(yīng)用效果,F(xiàn)對(duì)本文工作主要貢獻(xiàn)總結(jié)如下:(1)提出一種基于狄利克雷過程高斯混合模型(Dirichlet process Gaussian mixture model,DPGMM)的無監(jiān)督類音素聚類及后驗(yàn)概率特征提取方法。為了盡量降低語音表示學(xué)習(xí)的人工參與,本文采用非參貝葉斯模型表示語音基礎(chǔ)結(jié)構(gòu)信息。鑒于非參貝葉斯模型推斷效率較低,本文采用DPGMM這一淺層非參貝葉斯模型及其基于Metropolis-Hastings的可并行推斷算法來實(shí)現(xiàn)語音幀的聚類。本文將類簇視作類音素單元,并提取后驗(yàn)概率特征作為觀測(cè)語音的特征表示。本文基于DPGMM的后驗(yàn)概率特征在國際測(cè)評(píng)Zero Speech2015數(shù)據(jù)集上獲得最佳的音素區(qū)分性效果。(2)提出一種基于DPGMM的無監(jiān)督瓶頸(Bottle-Neck)特征學(xué)習(xí)方法。鑒于后驗(yàn)概率特征維度較高,不利于計(jì)算密集的后端應(yīng)用,同時(shí)也注意到深度神經(jīng)網(wǎng)絡(luò)模型(Deep neural network,DNN)具有優(yōu)秀的特征學(xué)習(xí)能力,因此本文結(jié)合DPGMM與DNN的特點(diǎn),提出具有語音基礎(chǔ)結(jié)構(gòu)表達(dá)能力的無監(jiān)督瓶頸特征學(xué)習(xí)方法。在不依賴人工標(biāo)注的情況下,該方法可以獲得能夠媲美有監(jiān)督跨語種瓶頸特征的特征表示。在基于樣例的口語詞匯檢出中,本文的無監(jiān)督瓶頸特征也取得了較后驗(yàn)概率特征更佳的準(zhǔn)確度。(3)提出一種基于DPGMM的無監(jiān)督多語種瓶頸特征學(xué)習(xí)方法。針對(duì)多個(gè)語種的低資源語言,結(jié)合DPGMM無監(jiān)督學(xué)習(xí)的特點(diǎn)以及多任務(wù)學(xué)習(xí)(Multi-task learning,MTL)的深度神經(jīng)網(wǎng)絡(luò)模型(MTL–DNN)抓取學(xué)習(xí)任務(wù)共享信息的特點(diǎn),本文提出一種基于DPGMM和MTL–DNN,利用多語種數(shù)據(jù)學(xué)習(xí)多語種共享的瓶頸特征表示的方法。該特征表示方法對(duì)不同低資源語言均有良好的語音基礎(chǔ)結(jié)構(gòu)信息表達(dá)能力,在國際測(cè)評(píng)Zero Speech2017中取得了良好的音素區(qū)分性性能。(4)提出一種融合低資源目標(biāo)語種無監(jiān)督類音素信息與富資源跨語種音素信息的MTL特征學(xué)習(xí)方法。注意到跨語種富資源語言有大量人工標(biāo)注數(shù)據(jù)可用,本文采用MTL–DNN融合跨語種的音素信息與無監(jiān)督類音素信息,提出一種語音基礎(chǔ)結(jié)構(gòu)與內(nèi)容信息表達(dá)能力優(yōu)于有監(jiān)督跨語種瓶頸特征和無監(jiān)督瓶頸特征的低維度瓶頸特征表示方法。從口語詞匯檢出、音素區(qū)分性測(cè)試以及特征可視化多個(gè)角度,本文也具體分析了多任務(wù)瓶頸特征的語音內(nèi)容表達(dá)能力。(5)提出一種基于語音表示的塊數(shù)自確定語音文檔主題分割方法。本文以語音文檔主題分割,探討了本文特征提取方法在低資源場(chǎng)景下的應(yīng)用前景。針對(duì)低資源場(chǎng)景的文檔主題分割任務(wù),本文提出一種基于語音表示的塊數(shù)自確定語音文檔主題分割方法,避免語音文檔主題分割對(duì)人工抄本和主題塊數(shù)人工預(yù)設(shè)的依賴。
【學(xué)位單位】:西北工業(yè)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位年份】:2018
【中圖分類】:TN912.3;TP183
【部分圖文】:

距離矩陣,動(dòng)態(tài)時(shí)間規(guī)整,最佳匹配路徑,長句


圖 4-8 DTW 距離矩陣 意圖語 查詢實(shí)例 organizations 和測(cè)試語 長句 planned parenthood organizations promote birthcontrol 之間的距離矩陣及分 長度歸 化動(dòng)態(tài)時(shí)間規(guī)整算法發(fā)現(xiàn)的最佳匹配路徑。- 57 -

距離矩陣,語詞,檢出


DTW距離矩陣意圖
【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 殷柏濤;一種改進(jìn)的無監(jiān)督競(jìng)爭(zhēng)學(xué)習(xí)算法[J];聲學(xué)與電子工程;1995年02期

2 徐峻嶺;周毓明;陳林;徐寶文;;基于互信息的無監(jiān)督特征選擇[J];計(jì)算機(jī)研究與發(fā)展;2012年02期

3 楊斌;劉衛(wèi)國;;一種基于聚類的無監(jiān)督異常檢測(cè)方法[J];計(jì)算機(jī)工程與應(yīng)用;2008年01期

4 陶美平;馬力;黃文靜;吳雨隆;;基于無監(jiān)督特征學(xué)習(xí)的手勢(shì)識(shí)別方法[J];微電子學(xué)與計(jì)算機(jī);2016年01期

5 梁春林;彭凌西;;基于免疫網(wǎng)絡(luò)的無監(jiān)督式分類算法[J];山東大學(xué)學(xué)報(bào)(工學(xué)版);2010年05期

6 史殿習(xí);李勇謀;丁博;;無監(jiān)督特征學(xué)習(xí)的人體活動(dòng)識(shí)別[J];國防科技大學(xué)學(xué)報(bào);2015年05期

7 陳雁;萬壽紅;岳麗華;龔育昌;;一種無需初始化的遙感圖像無監(jiān)督分割方法[J];小型微型計(jì)算機(jī)系統(tǒng);2010年10期

8 王瑞琴;孔繁勝;;無監(jiān)督詞義消歧研究[J];軟件學(xué)報(bào);2009年08期

9 吳姍;倪志偉;羅賀;鄭盈盈;;一種基于密度的無監(jiān)督聯(lián)系發(fā)現(xiàn)方法[J];中國管理科學(xué);2008年S1期

10 黃璞;陳才扣;;增強(qiáng)的無監(jiān)督人臉鑒別技術(shù)[J];計(jì)算機(jī)工程與應(yīng)用;2010年18期


相關(guān)博士學(xué)位論文 前10條

1 陳虹潔;面向低資源場(chǎng)景的語音表示學(xué)習(xí)及其應(yīng)用[D];西北工業(yè)大學(xué);2018年

2 張志銳;面向神經(jīng)機(jī)器翻譯的數(shù)據(jù)增強(qiáng)方法及應(yīng)用[D];中國科學(xué)技術(shù)大學(xué);2019年

3 劉彥北;高維數(shù)據(jù)無監(jiān)督特征選擇算法研究[D];天津大學(xué);2017年

4 王寅同;無監(jiān)督與半監(jiān)督降維相關(guān)問題研究[D];南京航空航天大學(xué);2016年

5 魏松;人機(jī)對(duì)話系統(tǒng)中若干關(guān)鍵問題研究[D];北京郵電大學(xué);2007年

6 周楠;基于稀疏和信息論的無監(jiān)督特征學(xué)習(xí)算法研究[D];電子科技大學(xué);2017年

7 楊波;圖驅(qū)動(dòng)的無監(jiān)督降維和判別子空間學(xué)習(xí)研究及其應(yīng)用[D];南京航空航天大學(xué);2010年

8 宋鳳義;非控制條件下的人臉分析與驗(yàn)證[D];南京航空航天大學(xué);2014年

9 馮小東;基于稀疏表示的高維數(shù)據(jù)無監(jiān)督挖掘研究[D];北京科技大學(xué);2015年

10 甘露;基于三重馬爾可夫場(chǎng)的無監(jiān)督SAR圖像分割算法研究[D];西安電子科技大學(xué);2015年


相關(guān)碩士學(xué)位論文 前10條

1 梁潤宇;基于主題情感混合模型的無監(jiān)督微博情感分類[D];天津工業(yè)大學(xué);2019年

2 萬家樂;混合稀疏正則化的多視角無監(jiān)督特征選擇[D];天津大學(xué);2018年

3 桂存斌;基于最小化最大平均差異損失的無監(jiān)督領(lǐng)域自適應(yīng)[D];北京郵電大學(xué);2019年

4 田剛鵬;多模態(tài)下基于遷移學(xué)習(xí)的無監(jiān)督軟測(cè)量建模研究與應(yīng)用[D];太原理工大學(xué);2019年

5 趙季娟;基于極限學(xué)習(xí)機(jī)的無監(jiān)督領(lǐng)域適應(yīng)學(xué)習(xí)[D];中國礦業(yè)大學(xué);2019年

6 黃迪;基于深度學(xué)習(xí)的無監(jiān)督型圖像語義分析[D];杭州電子科技大學(xué);2018年

7 張建紅;基于無監(jiān)督分割和ELM的織物缺陷檢測(cè)和分類方法研究[D];昆明理工大學(xué);2018年

8 鮑國強(qiáng);無監(jiān)督TSK模糊系統(tǒng)及其應(yīng)用研究[D];江南大學(xué);2018年

9 楊青相;基于卷積神經(jīng)網(wǎng)絡(luò)和雙目視差的無監(jiān)督深度預(yù)測(cè)[D];北京工業(yè)大學(xué);2018年

10 劉鑫;無監(jiān)督異常檢測(cè)方法研究及其應(yīng)用[D];電子科技大學(xué);2018年



本文編號(hào):2844166

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2844166.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fef68***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com