天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

不同語音特征對聲音分類的有效性研究

發(fā)布時間:2024-11-02 08:26
   聲音信號分類是準確進行語音預(yù)測、解碼和識別的基礎(chǔ)工作。深度神經(jīng)網(wǎng)絡(luò)是目前音頻分類的主流方法。選用19種不同語音特征,以3種噪聲作為分類對象,采用深度長短時記憶神經(jīng)網(wǎng)絡(luò)作為分類算法,比較了不同語音特征及特征融合對噪聲信號分類準確度的影響,總結(jié)了不同特征對信號分類的有效程度,并對實驗結(jié)果進行了說話人識別驗證。該研究對公安領(lǐng)域說話人身份識別具有一定的參考價值。

【文章頁數(shù)】:7 頁

【部分圖文】:

不同語音特征對聲音分類的有效性研究



通過構(gòu)建上述LSTM神經(jīng)網(wǎng)絡(luò)模型,提取多個特征對40個說話人進行識別,從表5的實驗結(jié)果可知:特征融合的維度越高對說話人識別的效果越好(準確度>90%);若是簡單的將1維的聲譜圖特征進行融合,其對說話人識別的表現(xiàn)差(準確度<50%),尤其是將spectralFlatness特征進行....


不同語音特征對聲音分類的有效性研究



LSTM神經(jīng)網(wǎng)絡(luò)包含輸入層、輸出層和若干遞歸隱層,遞歸隱層是由記憶單元組成,每個記憶單元含有一個或多個自連接記憶細胞來進行線性的反饋傳遞,從而加強神經(jīng)元內(nèi)部之間的聯(lián)系[13]。圖1表示LSTM記憶單元的結(jié)構(gòu)圖。LSTM神經(jīng)網(wǎng)絡(luò)引入門的機制控制信息的累積速度,提供對記憶單元的寫、讀....


不同語音特征對聲音分類的有效性研究



倒譜系數(shù)特征在音頻信號處理和分類中時常用到,提取該種特征的一般流程為:先對語音信號進行分幀、加窗等預(yù)處理,接著對每一幀信號進行快速傅里葉變換,計算譜線能量,然后通過濾波器濾波后得到一組系數(shù),最后再進行離散余弦變換和倒譜變換得到倒譜系數(shù)特征。提取的流程圖見圖2。本文采用Mel頻率倒....


不同語音特征對聲音分類的有效性研究



通過構(gòu)建上述LSTM神經(jīng)網(wǎng)絡(luò)模型,提取單個特征對40個說話人進行識別,從表4的實驗結(jié)果可知:13維的mfcc、gtcc特征及其一階、二階特征對說話人識別表現(xiàn)好(準確度達80%~100%),而剩下僅有1維的聲譜圖特征對說話人識別表現(xiàn)差(準確度<30%),其中單一的spectralF....



本文編號:4009304

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/wltx/4009304.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶19356***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
成人日韩视频中文字幕| 国产真人无遮挡免费视频一区| 国产人妻精品区一区二区三区| 最新国产欧美精品91| 日韩精品免费一区三区| 91插插插外国一区二区| 久热久热精品视频在线观看| 免费观看成人免费视频| 欧美字幕一区二区三区| 午夜亚洲精品理论片在线观看| 日韩av亚洲一区二区三区| 香蕉尹人视频在线精品| 色综合视频一区二区观看| 国产精品一区二区高潮| 老熟妇乱视频一区二区| 亚洲av首页免费在线观看| 麻豆果冻传媒一二三区| 亚洲男女性生活免费视频| 国产精品福利一级久久| 日韩精品一区二区毛片| 黄色三级日本在线观看| 色鬼综合久久鬼色88| 亚洲日本久久国产精品久久| 亚洲黄片在线免费小视频| 日韩欧美高清国内精品| 精品视频一区二区三区不卡| 日韩欧美一区二区不卡视频| 91精品欧美综合在ⅹ| 91亚洲国产成人久久精品麻豆| 色婷婷在线视频免费播放| 亚洲精品成人综合色在线| 开心久久综合激情五月天| 国产精品一区二区三区黄色片| 极品熟女一区二区三区| 精品亚洲av一区二区三区| 亚洲精品成人福利在线| 国产精品不卡免费视频| 国产又粗又黄又爽又硬的| 91日韩欧美在线视频| 国产不卡最新在线视频| 中文字幕在线区中文色|