基于深度關(guān)注神經(jīng)網(wǎng)絡(luò)的漢語(yǔ)方言辨識(shí)
本文選題:漢語(yǔ)方言辨識(shí) 切入點(diǎn):方言語(yǔ)音庫(kù) 出處:《江蘇師范大學(xué)》2017年碩士論文
【摘要】:伴隨科技進(jìn)步,信息處理智能化成為社會(huì)發(fā)展的方向。語(yǔ)音識(shí)別是智能信息處理的核心技術(shù),經(jīng)歷近百年的研究發(fā)展,已取得長(zhǎng)足進(jìn)步,但復(fù)雜多語(yǔ)言語(yǔ)音處理系統(tǒng)的真正實(shí)現(xiàn)效果不盡如人意。本文研究的漢語(yǔ)方言辨識(shí)是利用計(jì)算機(jī)自動(dòng)辨別語(yǔ)音片段方言類(lèi)屬特性的語(yǔ)音處理技術(shù),其在公共安全、信息服務(wù)、言語(yǔ)工程等諸多領(lǐng)域,均有重要的應(yīng)用價(jià)值和廣闊的應(yīng)用前景。目前,經(jīng)濟(jì)有效的漢語(yǔ)方言辨識(shí)方法是利用機(jī)器學(xué)習(xí)算法提取方言的類(lèi)屬特征并設(shè)計(jì)建立方言模型,通過(guò)模型匹配完成方言類(lèi)屬判定。但是,由于漢語(yǔ)方言本身的復(fù)雜異變性,該領(lǐng)域仍存在語(yǔ)音庫(kù)匱乏、數(shù)據(jù)失衡;特征的類(lèi)屬特性表征模糊、不穩(wěn)定;模型的學(xué)習(xí)及分類(lèi)能力不足等諸多問(wèn)題需要解決。本文針對(duì)以上問(wèn)題展開(kāi)研究,具體工作如下:(1)完善漢語(yǔ)方言語(yǔ)音庫(kù)。在前人已建漢語(yǔ)方言語(yǔ)音庫(kù)的基礎(chǔ)上繼續(xù)收錄各方言語(yǔ)音,同時(shí)積極尋求各方資源共享,先后增補(bǔ)吳、閩及官話(huà)方言近百小時(shí)。其次對(duì)方言粗語(yǔ)音進(jìn)行參數(shù)規(guī)整、數(shù)據(jù)平衡、標(biāo)注以及時(shí)長(zhǎng)自動(dòng)切分操作,使其符合語(yǔ)音庫(kù)標(biāo)準(zhǔn)及實(shí)驗(yàn)要求。(2)提出基于身份認(rèn)證矢量(Identify vector,I-vector)與韻律特征融合的漢語(yǔ)方言辨識(shí)方法。從句法結(jié)構(gòu)上提升方言類(lèi)屬特性的全局表征效果,增強(qiáng)方言語(yǔ)音的可區(qū)分性。實(shí)驗(yàn)結(jié)果顯示,對(duì)比高斯混合模型-通用背景模型(Gaussian Mixture Models-Universal Background Model,GMM-UBM)方法,融合全局信息的方法將漢語(yǔ)方言辨識(shí)等錯(cuò)誤率(Equal Error Rate,EER)相對(duì)降低56.32%,性能提升顯著。(3)提出基于深度關(guān)注神經(jīng)網(wǎng)絡(luò)的漢語(yǔ)方言辨識(shí)方法。深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)可以有效解決大輸入量、復(fù)雜非線性信號(hào)的分類(lèi)處理問(wèn)題,關(guān)注機(jī)制體現(xiàn)模型對(duì)分配資源進(jìn)一步有效利用。本文設(shè)計(jì)不同輸入特征探究深度關(guān)注神經(jīng)網(wǎng)絡(luò)對(duì)漢語(yǔ)方言辨識(shí)的影響。結(jié)果顯示,深度關(guān)注神經(jīng)網(wǎng)絡(luò)將漢語(yǔ)方言辨識(shí)EER相對(duì)降低28.3%,提高辨識(shí)正確率的同時(shí)展現(xiàn)模型高度的穩(wěn)定性。
[Abstract]:With the progress of science and technology, intelligent information processing has become the direction of social development.Speech recognition is the core technology of intelligent information processing. After nearly 100 years of research and development, it has made great progress, but the real effect of complex multilingual speech processing system is not satisfactory.The Chinese dialect recognition studied in this paper is a kind of speech processing technology which can automatically identify the characteristics of speech segment dialects by computer. It is used in many fields, such as public security, information service, speech engineering and so on.It has important application value and broad application prospect.At present, an economical and effective method for identifying Chinese dialects is to extract the generic features of dialects by using machine learning algorithm and to design and establish dialect models, and complete the classification of dialects by model matching.However, due to the complex variability of Chinese dialects, there are still many problems in this field, such as lack of phonetic corpus, unbalance of data, fuzzy and unstable representation of generic characteristics of features, inadequate learning and classification ability of models, and so on.This paper aims at the above problems, the specific work is as follows: 1) perfect the Chinese dialect phonetic corpus.On the basis of the previous Chinese dialect phonetic database, we continue to collect the pronunciation of each dialect, and actively seek the sharing of resources, and supplement Wu, Min and Guanyu dialects for nearly 100 hours.Secondly, the parameters, data balance, tagging and time length automatic segmentation of dialect coarse speech are carried out to meet the standard of phonetic corpus and experimental requirements. (2) an identification method for Chinese dialects based on the fusion of identity authentication vector identifying vector vectoring I-vectorand prosodic features is proposed.From the syntactic structure, we can improve the global representation effect of dialect generic characteristics and enhance the differentiability of dialect pronunciation.The experimental results show that the Gaussian Mixture Models-Universal Background Model GMM-UBM method is compared with Gao Si mixed model and general background model.The method of integrating global information reduces the equal Error rate of Chinese dialect recognition and equal Error error rate by 56.32, and improves the performance significantly. 3) A method of Chinese dialect identification based on the neural network of depth concern is proposed.Deep Neural Network (DNN) can effectively solve the problem of classification and processing of large input and complex nonlinear signals.This paper designs different input features to explore the effects of neural networks on Chinese dialect recognition.The results show that the neural network with deep attention reduces the EER of Chinese dialect recognition by 28.3and improves the accuracy of identification and shows the high stability of the model at the same time.
【學(xué)位授予單位】:江蘇師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:TN912.3;TP18
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 楊曉帥 ,付玫;神經(jīng)網(wǎng)絡(luò)技術(shù)讓管理更輕松[J];軟件世界;2000年11期
2 云中客;新的神經(jīng)網(wǎng)絡(luò)來(lái)自于仿生學(xué)[J];物理;2001年10期
3 唐春明,高協(xié)平;進(jìn)化神經(jīng)網(wǎng)絡(luò)的研究進(jìn)展[J];系統(tǒng)工程與電子技術(shù);2001年10期
4 李智;一種基于神經(jīng)網(wǎng)絡(luò)的煤炭調(diào)運(yùn)優(yōu)化方法[J];長(zhǎng)沙鐵道學(xué)院學(xué)報(bào);2003年02期
5 程科,王士同,楊靜宇;新型模糊形態(tài)神經(jīng)網(wǎng)絡(luò)及其應(yīng)用研究[J];計(jì)算機(jī)工程與應(yīng)用;2004年21期
6 王凡,孟立凡;關(guān)于使用神經(jīng)網(wǎng)絡(luò)推定操作者疲勞的研究[J];人類(lèi)工效學(xué);2004年03期
7 周麗暉;從統(tǒng)計(jì)角度看神經(jīng)網(wǎng)絡(luò)[J];統(tǒng)計(jì)教育;2005年06期
8 趙奇 ,劉開(kāi)第 ,龐彥軍;灰色補(bǔ)償神經(jīng)網(wǎng)絡(luò)及其應(yīng)用研究[J];微計(jì)算機(jī)信息;2005年14期
9 袁婷;;神經(jīng)網(wǎng)絡(luò)在股票市場(chǎng)預(yù)測(cè)中的應(yīng)用[J];軟件導(dǎo)刊;2006年05期
10 尚晉;楊有;;從神經(jīng)網(wǎng)絡(luò)的過(guò)去談科學(xué)發(fā)展觀[J];重慶三峽學(xué)院學(xué)報(bào);2006年03期
相關(guān)會(huì)議論文 前10條
1 徐春玉;;基于泛集的神經(jīng)網(wǎng)絡(luò)的混沌性[A];1996中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];1996年
2 周樹(shù)德;王巖;孫增圻;孫富春;;量子神經(jīng)網(wǎng)絡(luò)[A];2003年中國(guó)智能自動(dòng)化會(huì)議論文集(上冊(cè))[C];2003年
3 羅山;張琳;范文新;;基于神經(jīng)網(wǎng)絡(luò)和簡(jiǎn)單規(guī)劃的識(shí)別融合算法[A];2009系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2009年
4 郭愛(ài)克;馬盡文;丁康;;序言(二)[A];1999年中國(guó)神經(jīng)網(wǎng)絡(luò)與信號(hào)處理學(xué)術(shù)會(huì)議論文集[C];1999年
5 鐘義信;;知識(shí)論:神經(jīng)網(wǎng)絡(luò)的新機(jī)遇——紀(jì)念中國(guó)神經(jīng)網(wǎng)絡(luò)10周年[A];1999年中國(guó)神經(jīng)網(wǎng)絡(luò)與信號(hào)處理學(xué)術(shù)會(huì)議論文集[C];1999年
6 許進(jìn);保錚;;神經(jīng)網(wǎng)絡(luò)與圖論[A];1999年中國(guó)神經(jīng)網(wǎng)絡(luò)與信號(hào)處理學(xué)術(shù)會(huì)議論文集[C];1999年
7 金龍;朱詩(shī)武;趙成志;陳寧;;數(shù)值預(yù)報(bào)產(chǎn)品的神經(jīng)網(wǎng)絡(luò)釋用預(yù)報(bào)應(yīng)用[A];1999年中國(guó)神經(jīng)網(wǎng)絡(luò)與信號(hào)處理學(xué)術(shù)會(huì)議論文集[C];1999年
8 田金亭;;神經(jīng)網(wǎng)絡(luò)在中學(xué)生創(chuàng)造力評(píng)估中的應(yīng)用[A];第十二屆全國(guó)心理學(xué)學(xué)術(shù)大會(huì)論文摘要集[C];2009年
9 唐墨;王科俊;;自發(fā)展神經(jīng)網(wǎng)絡(luò)的混沌特性研究[A];2009年中國(guó)智能自動(dòng)化會(huì)議論文集(第七分冊(cè))[南京理工大學(xué)學(xué)報(bào)(增刊)][C];2009年
10 張廣遠(yuǎn);萬(wàn)強(qiáng);曹海源;田方濤;;基于遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的故障診斷方法研究[A];第十二屆全國(guó)設(shè)備故障診斷學(xué)術(shù)會(huì)議論文集[C];2010年
相關(guān)重要報(bào)紙文章 前10條
1 美國(guó)明尼蘇達(dá)大學(xué)社會(huì)學(xué)博士 密西西比州立大學(xué)國(guó)家戰(zhàn)略規(guī)劃與分析研究中心資深助理研究員 陳心想;維護(hù)好創(chuàng)新的“神經(jīng)網(wǎng)絡(luò)硬件”[N];中國(guó)教師報(bào);2014年
2 盧業(yè)忠;腦控電腦 驚世駭俗[N];計(jì)算機(jī)世界;2001年
3 葛一鳴 路邊文;人工神經(jīng)網(wǎng)絡(luò)將大顯身手[N];中國(guó)紡織報(bào);2003年
4 中國(guó)科技大學(xué)計(jì)算機(jī)系 邢方亮;神經(jīng)網(wǎng)絡(luò)挑戰(zhàn)人類(lèi)大腦[N];計(jì)算機(jī)世界;2003年
5 記者 孫剛;“神經(jīng)網(wǎng)絡(luò)”:打開(kāi)復(fù)雜工藝“黑箱”[N];解放日?qǐng)?bào);2007年
6 本報(bào)記者 劉霞;美用DNA制造出首個(gè)人造神經(jīng)網(wǎng)絡(luò)[N];科技日?qǐng)?bào);2011年
7 健康時(shí)報(bào)特約記者 張獻(xiàn)懷;干細(xì)胞移植:修復(fù)受損的神經(jīng)網(wǎng)絡(luò)[N];健康時(shí)報(bào);2006年
8 劉力;我半導(dǎo)體神經(jīng)網(wǎng)絡(luò)技術(shù)及應(yīng)用研究達(dá)國(guó)際先進(jìn)水平[N];中國(guó)電子報(bào);2001年
9 ;神經(jīng)網(wǎng)絡(luò)和模糊邏輯[N];世界金屬導(dǎo)報(bào);2002年
10 鄒麗梅 陳耀群;江蘇科大神經(jīng)網(wǎng)絡(luò)應(yīng)用研究通過(guò)鑒定[N];中國(guó)船舶報(bào);2006年
相關(guān)博士學(xué)位論文 前10條
1 楊旭華;神經(jīng)網(wǎng)絡(luò)及其在控制中的應(yīng)用研究[D];浙江大學(xué);2004年
2 李素芳;基于神經(jīng)網(wǎng)絡(luò)的無(wú)線通信算法研究[D];山東大學(xué);2015年
3 石艷超;憶阻神經(jīng)網(wǎng)絡(luò)的混沌性及幾類(lèi)時(shí)滯神經(jīng)網(wǎng)絡(luò)的同步研究[D];電子科技大學(xué);2014年
4 王新迎;基于隨機(jī)映射神經(jīng)網(wǎng)絡(luò)的多元時(shí)間序列預(yù)測(cè)方法研究[D];大連理工大學(xué);2015年
5 付愛(ài)民;極速學(xué)習(xí)機(jī)的訓(xùn)練殘差、穩(wěn)定性及泛化能力研究[D];中國(guó)農(nóng)業(yè)大學(xué);2015年
6 李輝;基于粒計(jì)算的神經(jīng)網(wǎng)絡(luò)及集成方法研究[D];中國(guó)礦業(yè)大學(xué);2015年
7 王衛(wèi)蘋(píng);復(fù)雜網(wǎng)絡(luò)幾類(lèi)同步控制策略研究及穩(wěn)定性分析[D];北京郵電大學(xué);2015年
8 張海軍;基于云計(jì)算的神經(jīng)網(wǎng)絡(luò)并行實(shí)現(xiàn)及其學(xué)習(xí)方法研究[D];華南理工大學(xué);2015年
9 李艷晴;風(fēng)速時(shí)間序列預(yù)測(cè)算法研究[D];北京科技大學(xué);2016年
10 陳輝;多維超精密定位系統(tǒng)建模與控制關(guān)鍵技術(shù)研究[D];東南大學(xué);2015年
相關(guān)碩士學(xué)位論文 前10條
1 章穎;混合不確定性模塊化神經(jīng)網(wǎng)絡(luò)與高校效益預(yù)測(cè)的研究[D];華南理工大學(xué);2015年
2 賈文靜;基于改進(jìn)型神經(jīng)網(wǎng)絡(luò)的風(fēng)力發(fā)電系統(tǒng)預(yù)測(cè)及控制研究[D];燕山大學(xué);2015年
3 李慧芳;基于憶阻器的渦卷混沌系統(tǒng)及其電路仿真[D];西南大學(xué);2015年
4 陳彥至;神經(jīng)網(wǎng)絡(luò)降維算法研究與應(yīng)用[D];華南理工大學(xué);2015年
5 董哲康;基于憶阻器的組合電路及神經(jīng)網(wǎng)絡(luò)研究[D];西南大學(xué);2015年
6 武創(chuàng)舉;基于神經(jīng)網(wǎng)絡(luò)的遙感圖像分類(lèi)研究[D];昆明理工大學(xué);2015年
7 李志杰;基于神經(jīng)網(wǎng)絡(luò)的上證指數(shù)預(yù)測(cè)研究[D];華南理工大學(xué);2015年
8 陳少吉;基于神經(jīng)網(wǎng)絡(luò)血壓預(yù)測(cè)研究與系統(tǒng)實(shí)現(xiàn)[D];華南理工大學(xué);2015年
9 張韜;幾類(lèi)時(shí)滯神經(jīng)網(wǎng)絡(luò)穩(wěn)定性分析[D];渤海大學(xué);2015年
10 邵雪瑩;幾類(lèi)時(shí)滯不確定神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性分析[D];渤海大學(xué);2015年
,本文編號(hào):1705997
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1705997.html