天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

說(shuō)話(huà)人識(shí)別情感合成問(wèn)題的概率模型研究

發(fā)布時(shí)間:2017-09-15 22:17

  本文關(guān)鍵詞:說(shuō)話(huà)人識(shí)別情感合成問(wèn)題的概率模型研究


  更多相關(guān)文章: 情感說(shuō)話(huà)人識(shí)別 信道適配 貝葉斯統(tǒng)計(jì) 非參數(shù)模型 Metropolis-Hasting采樣 聯(lián)合因子分析 模型選擇 統(tǒng)計(jì)距離 指數(shù)分布組 新奇度檢測(cè)


【摘要】:說(shuō)話(huà)人識(shí)別技術(shù)對(duì)智能通信和信息處理具有重要的推進(jìn)作用。同時(shí),語(yǔ)音數(shù)據(jù)具有高維時(shí)間序列的典型特征,是信號(hào)處理和模式識(shí)別領(lǐng)域各種算法驗(yàn)證的珍貴數(shù)據(jù)資源。因此,這個(gè)領(lǐng)域的研究工作一直火熱地進(jìn)行著。語(yǔ)音識(shí)別系統(tǒng)的效率容易受到會(huì)話(huà)差異的影響。即測(cè)試語(yǔ)音和訓(xùn)練語(yǔ)音不匹配的情況下,算法準(zhǔn)確率會(huì)相對(duì)下降。其中由于錄音者情感變化導(dǎo)致的測(cè)試和訓(xùn)練語(yǔ)音不匹配被稱(chēng)為情感失配,這至今是一個(gè)開(kāi)放問(wèn)題,一直沒(méi)有很好地被解決。本論文針對(duì)說(shuō)話(huà)人識(shí)別情感失配問(wèn)題,進(jìn)行了原理的分析和現(xiàn)象的總結(jié)。證明說(shuō)話(huà)人情感變換與常見(jiàn)的信道失配問(wèn)題的不同,解釋了現(xiàn)有算法難以解決這個(gè)問(wèn)題的原因。并針對(duì)情感噪音的特質(zhì)提出了基于概率模型的統(tǒng)計(jì)推斷方法。完善了已有情感合成算法的理論基礎(chǔ),獲得了在MASC數(shù)據(jù)庫(kù)上個(gè)人可以重現(xiàn)的最佳效果。針對(duì)當(dāng)前主流的因子分析模型過(guò)度擬合的問(wèn)題,將原模型改進(jìn)為更符合語(yǔ)音數(shù)據(jù)特征的完全貝葉斯模型和非參數(shù)IBP模型,并給出求解的迭代算法和MCMC采樣算法。成功地在不降低推斷效果的基礎(chǔ)上,將因子分析的模型參數(shù)縮減到原問(wèn)題的30%。本論文的主要貢獻(xiàn)如下:1.針對(duì)說(shuō)話(huà)人識(shí)別情感失配問(wèn)題,進(jìn)行了原理的分析和現(xiàn)象的總結(jié)。針對(duì)不同的說(shuō)話(huà)人以及不同的情感,目前仍然沒(méi)有通用的模型可以描述情感變化的原因。針對(duì)不同的語(yǔ)音元素(音素)、說(shuō)話(huà)人身份、情緒特性等等對(duì)說(shuō)話(huà)人特征引起的變化具有很強(qiáng)的非線(xiàn)性特性。與一般的信道失配不同,情感失配沒(méi)有辦法用分隔開(kāi)的空間分別表征說(shuō)話(huà)人身份和信道的特征。由于數(shù)據(jù)量的不足,也沒(méi)有辦法通過(guò)LDA等技術(shù)進(jìn)行無(wú)關(guān)信息的降維處理。值得注意的是,情感變化具有鄰居相似的特性。即中性語(yǔ)音特征相似的說(shuō)話(huà)人,一般在其他情感下也具有類(lèi)似的特征。2.對(duì)說(shuō)話(huà)人識(shí)別問(wèn)題的概率推斷模型進(jìn)行抽象,將測(cè)試樣本和模型參數(shù)數(shù)量引入分布提出了基于統(tǒng)計(jì)距離的分類(lèi)模型,F(xiàn)階段常用的通用背景模型系統(tǒng)經(jīng)常依賴(lài)階數(shù)很高的高斯混合模型訓(xùn)練。這類(lèi)模型依賴(lài)相對(duì)龐大的背景語(yǔ)音數(shù)據(jù)庫(kù)以及長(zhǎng)度相對(duì)統(tǒng)一的訓(xùn)練和測(cè)試數(shù)據(jù);谪惾~斯統(tǒng)計(jì)的推斷方法依指數(shù)分布族的共軛先驗(yàn)對(duì)進(jìn)行生成模型的估計(jì),不需要高斯混合模型的EM迭代訓(xùn)練,與之相比具有計(jì)算復(fù)雜性和算法效率上的優(yōu)勢(shì)。此外,通過(guò)基于AIC和BIC等模型選擇理論的統(tǒng)計(jì)距離標(biāo)準(zhǔn),可以有效地解決因語(yǔ)音長(zhǎng)度變化等引起的信道失配問(wèn)題。3.基于流型學(xué)習(xí)理論,對(duì)原有的近鄰合成算法進(jìn)行了推廣,并在該框架下提出最優(yōu)合成的求解方式,獲得了模型合成最好的結(jié)果。由于情感變化具有鄰居相似的特點(diǎn),我們可以通過(guò)背景數(shù)據(jù)集中與訓(xùn)練模型相似的數(shù)據(jù)合成對(duì)應(yīng)說(shuō)話(huà)人其他情感的模型。本文提出了鄰域最優(yōu)線(xiàn)性合成算法,這種算法通過(guò)求解有約束的二階優(yōu)化問(wèn)題,基于背景對(duì)中性語(yǔ)音模型進(jìn)行最優(yōu)重建。這個(gè)重建具有多種映射不變的特性,因此這個(gè)規(guī)律可以遷移到其他情感空間,采用對(duì)應(yīng)的情感模型參數(shù),對(duì)訓(xùn)練語(yǔ)音模型的情感參數(shù)進(jìn)行估計(jì)。4.針對(duì)聯(lián)合因子分析模型過(guò)度擬合的問(wèn)題,提出了完整的概率方法,規(guī)范了模型的理論依據(jù),并進(jìn)行了非參數(shù)推廣。聯(lián)合因子分析模型在求解時(shí),采用的是對(duì)特征變量進(jìn)行估計(jì),再對(duì)參數(shù)矩陣進(jìn)行優(yōu)化的EM迭代。由于對(duì)參數(shù)的稀疏性沒(méi)有限制,并且參數(shù)矩陣的參數(shù)個(gè)數(shù)遠(yuǎn)大于特征向量,模型十分容易過(guò)度擬合,讓說(shuō)話(huà)人因子的范數(shù)無(wú)限接近O。通過(guò)對(duì)參數(shù)矩陣添加先驗(yàn)分布,我們可以用坐標(biāo)下降的方法對(duì)模型進(jìn)行迭代更新。實(shí)驗(yàn)證明這個(gè)算法可以有效地解決過(guò)度擬合的問(wèn)題。在此基礎(chǔ)上,本文又提出了基于IBP的非參數(shù)GMM超向量因子分析模型?梢宰詣(dòng)適應(yīng)說(shuō)話(huà)人特征維度,將與說(shuō)話(huà)人特征無(wú)關(guān)的高斯分量參數(shù)舍棄,提高模型的魯棒性。實(shí)驗(yàn)證明可以以一般JFA模型30%的參數(shù)達(dá)到與其相同的識(shí)別效果。
【關(guān)鍵詞】:情感說(shuō)話(huà)人識(shí)別 信道適配 貝葉斯統(tǒng)計(jì) 非參數(shù)模型 Metropolis-Hasting采樣 聯(lián)合因子分析 模型選擇 統(tǒng)計(jì)距離 指數(shù)分布組 新奇度檢測(cè)
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TN912.34
【目錄】:
  • 摘要5-7
  • Abstract7-14
  • 第1章 緒論14-22
  • 1.1 引言14-15
  • 1.2 說(shuō)話(huà)人識(shí)別簡(jiǎn)介15-17
  • 1.3 測(cè)試語(yǔ)音失配問(wèn)題的解決方法17-18
  • 1.4 情感說(shuō)話(huà)人識(shí)別面臨的主要問(wèn)題及目前的解決辦法18-20
  • 1.5 本文的主要研究工作20-22
  • 第2章 說(shuō)話(huà)人識(shí)別概率模型算法簡(jiǎn)介22-35
  • 2.1 簡(jiǎn)介22
  • 2.2 語(yǔ)音特征提取22-25
  • 2.2.1 MFCC特征23-25
  • 2.3 基于概率模型推斷的說(shuō)話(huà)人識(shí)別25-34
  • 2.3.1 高斯混合模型27-28
  • 2.3.2 通用背景模型28-30
  • 2.3.3 聯(lián)合因子分析30-32
  • 2.3.4 基于I-Vector特征的模型32-34
  • 2.4 本章小結(jié)34-35
  • 第3章 情感說(shuō)話(huà)人識(shí)別35-43
  • 3.1 情感變化對(duì)說(shuō)話(huà)人識(shí)別算法的影響35-38
  • 3.1.1 信道失配問(wèn)題概述35-36
  • 3.1.2 情感失配情況下的說(shuō)話(huà)人識(shí)別效率36-38
  • 3.2 情感失配的分析與表達(dá)38-39
  • 3.2.1 情感變換的規(guī)律38-39
  • 3.2.2 情感說(shuō)話(huà)人識(shí)別的處理方法39
  • 3.3 基于模型合成的情感說(shuō)話(huà)人識(shí)別系統(tǒng)39-42
  • 3.3.1 問(wèn)題說(shuō)明39-42
  • 3.3.2 已有算法的不足42
  • 3.4 本章小結(jié)42-43
  • 第4章 情感變化幅度的概率模型43-56
  • 4.1 簡(jiǎn)介43
  • 4.2 新奇檢測(cè)43-47
  • 4.2.1 離群點(diǎn)檢測(cè)44-45
  • 4.2.2 新奇度判別算法45-47
  • 4.3 貝葉斯差異47-49
  • 4.3.1 指數(shù)分布族的貝葉斯差異計(jì)算48
  • 4.3.2 高斯分布和高斯混合模型貝葉斯差異的計(jì)算48-49
  • 4.4 穩(wěn)定貝葉斯差異49-52
  • 4.4.1 AIC50-51
  • 4.4.2 AIC相關(guān)的準(zhǔn)則51
  • 4.4.3 BIC51-52
  • 4.4.4 AIC和BIC的比較52
  • 4.5 說(shuō)話(huà)人識(shí)別實(shí)驗(yàn)52-55
  • 4.5.1 單高斯模型統(tǒng)計(jì)距離分類(lèi)53-54
  • 4.5.2 高斯混合模型的統(tǒng)計(jì)距離分類(lèi)54-55
  • 4.6 本章小結(jié)55-56
  • 第5章 說(shuō)話(huà)人情感模型合成56-61
  • 5.1 簡(jiǎn)介56
  • 5.2 GMM模型均值合成56-57
  • 5.3 最優(yōu)線(xiàn)性GMM均值合成57-59
  • 5.3.1 局部線(xiàn)性映射57-58
  • 5.3.2 基于LLM的情感模型合成58-59
  • 5.4 實(shí)驗(yàn)結(jié)果59-60
  • 5.4.1 實(shí)驗(yàn)數(shù)據(jù)庫(kù)59
  • 5.4.2 均值合成算法59-60
  • 5.5 本章小結(jié)60-61
  • 第6章 貝葉斯因子分析與情感特征合成61-72
  • 6.1 簡(jiǎn)介61-62
  • 6.1.1 JFA及相關(guān)算法的局限性61-62
  • 6.1.2 改進(jìn)JFA的魯棒性62
  • 6.2 貝葉斯因子分析62-64
  • 6.2.1 基本模型62-63
  • 6.2.2 非參數(shù)模型63-64
  • 6.3 貝葉斯稀疏因子模型64-67
  • 6.3.1 基于IBP的非參數(shù)隱含特征模型65
  • 6.3.2 吉布斯采樣65-66
  • 6.3.3 變分推導(dǎo)66-67
  • 6.4 基于稀疏字典的情感因子重建67-68
  • 6.5 實(shí)驗(yàn)結(jié)果68-70
  • 6.5.1 NIST測(cè)試68
  • 6.5.2 MASC測(cè)試68-70
  • 6.6 本章小結(jié)70-72
  • 第7章 總結(jié)與展望72-76
  • 7.1 總結(jié)72-74
  • 7.2 未來(lái)工作展望74-76
  • 參考文獻(xiàn)76-86
  • 致謝86

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 石艷;王曉曄;;新穎檢測(cè)法在說(shuō)話(huà)人識(shí)別技術(shù)中的應(yīng)用[J];現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版);2008年07期

2 劉雪燕;張娜;袁寶玲;;說(shuō)話(huà)人識(shí)別綜述[J];電腦知識(shí)與技術(shù);2009年01期

3 邱政權(quán);范小春;王俊年;;基于動(dòng)態(tài)環(huán)境下的說(shuō)話(huà)人識(shí)別[J];科學(xué)技術(shù)與工程;2010年02期

4 單進(jìn);;說(shuō)話(huà)人識(shí)別技術(shù)研究[J];科技資訊;2010年21期

5 申志生;于明;;說(shuō)話(huà)人識(shí)別算法的定點(diǎn)DSP實(shí)現(xiàn)[J];單片機(jī)與嵌入式系統(tǒng)應(yīng)用;2011年03期

6 謝建勛;;淺談?wù)f話(huà)人識(shí)別技術(shù)[J];電腦知識(shí)與技術(shù);2011年11期

7 安茂波;劉建;;一個(gè)快速說(shuō)話(huà)人識(shí)別系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[J];網(wǎng)絡(luò)新媒體技術(shù);2012年03期

8 楊迪;戚銀城;劉明軍;張華芳子;武軍娜;;說(shuō)話(huà)人識(shí)別綜述[J];電子科技;2012年06期

9 武光利;;說(shuō)話(huà)人識(shí)別方法概述[J];硅谷;2012年19期

10 曹業(yè)敏,侯風(fēng)雷,王炳錫;說(shuō)話(huà)人識(shí)別技術(shù)現(xiàn)狀與進(jìn)展[J];河南科技;1998年09期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 鮑福良;方志剛;徐潔;;說(shuō)話(huà)人識(shí)別綜述[A];第六屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集(2)[C];2008年

2 孫帆;遲惠生;;循環(huán)網(wǎng)絡(luò)說(shuō)話(huà)人識(shí)別[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年

3 肖劍;歐貴文;;多層前饋神經(jīng)網(wǎng)絡(luò)組的文本無(wú)關(guān)說(shuō)話(huà)人識(shí)別[A];第七屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC7)論文集[C];2003年

4 張玲華;鄭寶玉;楊震;;模糊超橢球聚類(lèi)算法及其在說(shuō)話(huà)人識(shí)別中的應(yīng)用研究[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

5 王宏;潘金貴;;基于矩陣正態(tài)分布的文本有關(guān)說(shuō)話(huà)人識(shí)別[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年

6 戴紅霞;趙力;;文本無(wú)關(guān)說(shuō)話(huà)人識(shí)別系統(tǒng)的研究[A];2007’促進(jìn)西部發(fā)展聲學(xué)學(xué)術(shù)交流會(huì)論文集[C];2007年

7 陳聯(lián)武;郭武;戴禮榮;;說(shuō)話(huà)人識(shí)別系統(tǒng)中多樣訓(xùn)練的應(yīng)用[A];第十一屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集(一)[C];2011年

8 崔玉紅;胡光銳;;基于神經(jīng)網(wǎng)絡(luò)特征維數(shù)壓縮方法及其在說(shuō)話(huà)人識(shí)別中的應(yīng)用[A];第十屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年

9 吳麗麗;;基于仿生模式識(shí)別的說(shuō)話(huà)人識(shí)別學(xué)習(xí)模型研究[A];第二屆中國(guó)科學(xué)院博士后學(xué)術(shù)年會(huì)暨高新技術(shù)前沿與發(fā)展學(xué)術(shù)會(huì)議程序冊(cè)[C];2010年

10 張晶;董金明;馮文全;;說(shuō)話(huà)人識(shí)別系統(tǒng)研究與實(shí)現(xiàn)[A];全國(guó)第二屆信號(hào)處理與應(yīng)用學(xué)術(shù)會(huì)議專(zhuān)刊[C];2008年

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前2條

1 汪永安;科大訊飛說(shuō)話(huà)人識(shí)別技術(shù)世界領(lǐng)先[N];安徽日?qǐng)?bào);2008年

2 吳長(zhǎng)鋒;科大訊飛勇奪說(shuō)話(huà)人識(shí)別國(guó)際大賽第一[N];科技日?qǐng)?bào);2008年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 單振宇;情感說(shuō)話(huà)人識(shí)別及其解決方法的研究[D];浙江大學(xué);2010年

2 陸偉;基于缺失特征的文本無(wú)關(guān)說(shuō)話(huà)人識(shí)別魯棒性研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2008年

3 劉鏑;說(shuō)話(huà)人識(shí)別中信息融合算法的研究[D];北京交通大學(xué);2011年

4 付中華;說(shuō)話(huà)人識(shí)別系統(tǒng)魯棒性研究[D];西北工業(yè)大學(xué);2004年

5 林琳;基于模糊聚類(lèi)與遺傳算法的說(shuō)話(huà)人識(shí)別理論研究及應(yīng)用[D];吉林大學(xué);2007年

6 邱政權(quán);在噪聲環(huán)境下的說(shuō)話(huà)人識(shí)別[D];華南理工大學(xué);2007年

7 郭武;復(fù)雜信道下的說(shuō)話(huà)人識(shí)別[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年

8 錢(qián)博;基于漢語(yǔ)元音映射的說(shuō)話(huà)人識(shí)別技術(shù)研究[D];南京理工大學(xué);2007年

9 姜濤;網(wǎng)絡(luò)環(huán)境下說(shuō)話(huà)人識(shí)別關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2011年

10 俞一彪;基于互信息理論的說(shuō)話(huà)人識(shí)別研究[D];上海大學(xué);2004年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 叢菡菡;基于支持相量機(jī)的穩(wěn)鍵說(shuō)話(huà)人識(shí)別[D];電子科技大學(xué);2008年

2 任舒彬;面向手持應(yīng)用的說(shuō)話(huà)人識(shí)別算法研究[D];浙江大學(xué);2006年

3 申志生;文本相關(guān)說(shuō)話(huà)人識(shí)別嵌入式系統(tǒng)及其關(guān)鍵技術(shù)研究[D];河北工業(yè)大學(xué);2011年

4 汪q,

本文編號(hào):859209


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/859209.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)3be17***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
国产日韩欧美专区一区| 国产传媒高清视频在线| 青青草草免费在线视频| 国产亚州欧美一区二区| 久久精品国产在热久久| 国产国产精品精品在线| 国产传媒欧美日韩成人精品| 大香蕉再在线大香蕉再在线| 97人妻精品免费一区二区| 99久久精品午夜一区二区| 日韩欧美三级视频在线| 日本理论片午夜在线观看| 欧美午夜一级特黄大片| 亚洲妇女黄色三级视频| 国产一二三区不卡视频| 国产毛片对白精品看片| 国产91麻豆精品成人区| 国产精品一区二区不卡中文| av在线免费播放一区二区| 亚洲一区二区亚洲日本 | 日本欧美一区二区三区高清| 成人区人妻精品一区二区三区| 国产免费操美女逼视频| 五月婷日韩中文字幕四虎| 熟女一区二区三区国产| 久久国产亚洲精品赲碰热| 日本不卡一本二本三区| 久久机热频这里只精品| 欧美日韩国产亚洲三级理论片| 亚洲做性视频在线播放| 欧美老太太性生活大片| 精品人妻一区二区四区| 好吊妞在线免费观看视频| 欧美日韩国产精品自在自线| 黄色美女日本的美女日人| 亚洲伦理中文字幕在线观看| 欧美极品欧美精品欧美| 微拍一区二区三区福利| 亚洲精品中文字幕熟女| 东京干男人都知道的天堂| 九九热九九热九九热九九热|