天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于殘差網(wǎng)絡的說話人識別算法

發(fā)布時間:2023-04-02 00:57
  隨著語音識別技術地快速發(fā)展,說話人識別作為語音識別的一個重要組成部分,已經(jīng)被廣泛地應用到商務、安防、金融、刑偵及個性化應用等諸多領域,在生物識別技術中也占據(jù)了越來越重要的地位;跉埐罹W(wǎng)絡的說話人識別算法就是將說話人語音的頻譜圖作為輸入,利用殘差網(wǎng)絡來提取頻譜圖的特征描述子,然后通過網(wǎng)絡的聚合層來將特征描述子聚合成特征矩陣,接著用全連接層來生成具有判別性的說話人特征,從而達到判別說話人身份的效果。然而,說話人識別模型在不平衡且?guī)в性肼暤臄?shù)據(jù)集上訓練時,模型識別的表現(xiàn)會發(fā)生嚴重的退化。為了改善說話人識別模型在這方面的表現(xiàn),并且對于短語音也有很好的識別效果,本文主要從以下三個方面進行改進:(1)說話人識別模型在實際應用中所面臨的問題之一就是在噪聲環(huán)境下模型的表現(xiàn)會發(fā)生退化;贕hostVALD算法的殘差網(wǎng)絡模型能夠從帶有噪聲的說話人語音中提取高質量、具有判別性的說話人特征。在以上研究內容的基礎上,本文通過將MultiReader技術與基于GhostVLAD算法的殘差網(wǎng)絡模型相結合,實現(xiàn)了對語音數(shù)據(jù)進行數(shù)據(jù)級別和特征級別的篩選,有效地改善了說話人識別模型在帶有噪聲的不平衡數(shù)據(jù)集上的識別效果...

【文章頁數(shù)】:47 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
1 緒論
    1.1 說話人識別理論的背景意義
    1.2 說話人識別算法發(fā)展歷程及研究現(xiàn)狀
    1.3 本文主要研究內容及結構安排
2 說話人識別算法的基本理論
    2.1 說話人識別算法分類
    2.2 說話人識別算法的評價標準
    2.3 矩陣微分的基本公式
3 基于MultiReder技術及ResNet-GhostVLAD網(wǎng)絡說話人識別算法
    3.1 基于深度學習的說話人識別算法簡介
    3.2 MultiReader技術及ResNet-GhostVLAD網(wǎng)絡的理論及算法改進
        3.2.1 MultiReader技術及ResNet-GhostVLAD網(wǎng)絡的模型理論
        3.2.2 MultiReader技術及ResNet-GhostVLAD網(wǎng)絡的算法改進
    3.3 實驗部分
        3.3.1 數(shù)據(jù)集介紹及訓練細節(jié)
        3.3.2 實驗結果及分析
    3.4 小結
4 短語音場景下的說話人識別算法
    4.1 短語音說話人識別算法簡介及改進
    4.2 實驗結果及分析
    4.3 小結
5 基于貝葉斯優(yōu)化算法的說話人識別模型
    5.1 貝葉斯優(yōu)化算法簡介
    5.2 用于說話人識別模型超參數(shù)搜索的貝葉斯優(yōu)化算法
    5.3 實驗結果及分析
    5.4 小結
結論
參考文獻
致謝
作者簡歷及攻讀碩士學位期間的科研成果



本文編號:3778204

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3778204.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶dece1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com