仿人聽覺系統(tǒng)的發(fā)育網(wǎng)絡(luò)模型研究
本文選題:聽覺模型 + 發(fā)育網(wǎng)絡(luò)。 參考:《鄭州大學(xué)》2017年碩士論文
【摘要】:隨著人工智能技術(shù)的普及,機(jī)器人已逐漸進(jìn)入人類的日常生活。讓機(jī)器人聽懂人類的語(yǔ)言,就是使機(jī)器人能夠像人類一樣獲得聽覺。目前,聲音識(shí)別是機(jī)器聽覺領(lǐng)域的核心方向,相比于機(jī)器聽覺,人類聽覺系統(tǒng)能準(zhǔn)確、快速地識(shí)別聲音的內(nèi)容,所以模擬人類聽覺系統(tǒng)構(gòu)建人工聽覺模型已成為機(jī)器聽覺領(lǐng)域研究的熱點(diǎn)。本文引入發(fā)育網(wǎng)絡(luò),通過(guò)粗略模擬人類聽覺系統(tǒng)信息處理的腹側(cè)通路結(jié)構(gòu)來(lái)構(gòu)建聽覺模型,腹側(cè)通路主要處理聲音的內(nèi)容信息,即主要負(fù)責(zé)聲音的內(nèi)容識(shí)別。為了體現(xiàn)所構(gòu)建模型的性能,本文設(shè)置語(yǔ)音識(shí)別實(shí)驗(yàn)進(jìn)行驗(yàn)證。本文的工作主要分為三部分。首先簡(jiǎn)單概述了人類聽覺系統(tǒng)的結(jié)構(gòu),并對(duì)其信息傳導(dǎo)通路進(jìn)行詳細(xì)的分析,為構(gòu)建聽覺模型提供理論基礎(chǔ)。接著重點(diǎn)介紹了腦殼封閉的發(fā)育網(wǎng)絡(luò)的基礎(chǔ)理論,對(duì)自主發(fā)育的思想進(jìn)行了闡述,并解釋了發(fā)育網(wǎng)絡(luò)的基本模型和學(xué)習(xí)算法。其次,基于發(fā)育網(wǎng)絡(luò),粗略模擬人類聽覺系統(tǒng)信息處理的腹側(cè)通路結(jié)構(gòu)建立發(fā)育網(wǎng)絡(luò)模型。簡(jiǎn)述了發(fā)育網(wǎng)絡(luò)模型的特點(diǎn),并對(duì)其模型結(jié)構(gòu)提出改進(jìn)。對(duì)發(fā)育網(wǎng)絡(luò)引入多種仿生機(jī)制,如設(shè)計(jì)神經(jīng)元的連接方式和學(xué)習(xí)狀態(tài)實(shí)現(xiàn)神經(jīng)元的自主學(xué)習(xí);采用神經(jīng)元再生機(jī)制實(shí)現(xiàn)神經(jīng)元的充分利用;增加神經(jīng)元釋放機(jī)制解決神經(jīng)元的資源分配問(wèn)題。設(shè)計(jì)了發(fā)育網(wǎng)絡(luò)模型的發(fā)育程序,并錄制語(yǔ)音創(chuàng)建語(yǔ)音庫(kù),然后設(shè)置了語(yǔ)音識(shí)別實(shí)驗(yàn)對(duì)發(fā)育網(wǎng)絡(luò)模型的性能進(jìn)行驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,發(fā)育網(wǎng)絡(luò)模型對(duì)英文單詞和短語(yǔ)的識(shí)別率分別可達(dá)到94.44%和90.19%,說(shuō)明模型初步具備了對(duì)實(shí)際環(huán)境中語(yǔ)音的識(shí)別能力。最后,為了進(jìn)一步提高發(fā)育網(wǎng)絡(luò)模型的性能,引入了深度信念網(wǎng)絡(luò)構(gòu)建特征提取器對(duì)語(yǔ)音提取深度特征,分析了語(yǔ)音經(jīng)過(guò)深度信念網(wǎng)絡(luò)的特征表示,并對(duì)其特征進(jìn)行可視化。在原有語(yǔ)音數(shù)據(jù)庫(kù)的基礎(chǔ)上,結(jié)合新特征,對(duì)發(fā)育網(wǎng)絡(luò)模型進(jìn)行語(yǔ)音識(shí)別實(shí)驗(yàn)。從實(shí)驗(yàn)結(jié)果可以看出,發(fā)育網(wǎng)絡(luò)模型在新特征的基礎(chǔ)上對(duì)英文單詞和短語(yǔ)識(shí)別率分別可達(dá)96.30%和92.96%,表明模型的性能得到了較大的改善。與傳統(tǒng)的語(yǔ)音識(shí)別模型相比,發(fā)育網(wǎng)絡(luò)模型表現(xiàn)出較優(yōu)的性能。
[Abstract]:With the popularization of artificial intelligence technology, robots have gradually entered the daily life of human beings.To make robots understand human language is to enable robots to get hearing just like humans.At present, sound recognition is the core direction in the field of machine hearing. Compared with machine hearing, human auditory system can recognize the content of sound accurately and quickly.Therefore, simulating human auditory system to build artificial auditory model has become a hot spot in the field of machine hearing.In this paper, the developmental network is introduced to construct the auditory model by roughly simulating the ventral pathway structure of human auditory system information processing. The ventral pathway mainly deals with the content information of sound, that is, it is mainly responsible for the content recognition of sound.In order to reflect the performance of the model, this paper set up speech recognition experiments to verify.The work of this paper is divided into three parts.Firstly, the structure of human auditory system is briefly summarized, and its information transmission pathway is analyzed in detail, which provides a theoretical basis for the construction of auditory model.Then the basic theory of the closed development network of the skull is introduced, the idea of autonomous development is expounded, and the basic model and learning algorithm of the development network are explained.Secondly, the development network model is established based on the development network, which roughly simulates the ventral pathway structure of human auditory system information processing.In this paper, the characteristics of the developmental network model are briefly described, and the improvement of its model structure is put forward.A variety of biomimetic mechanisms are introduced to the development network, such as designing the connection mode and learning state of neurons to realize autonomous learning of neurons, adopting the mechanism of neuron regeneration to make full use of neurons.The mechanism of neuronal release is added to solve the problem of resource allocation of neurons.The development program of the development network model is designed and the speech database is recorded. Then the performance of the development network model is verified by setting up the speech recognition experiment.The experimental results show that the developmental network model has a recognition rate of 94.44% and 90.19% for English words and phrases respectively.Finally, in order to further improve the performance of the development network model, a feature extractor constructed by the depth belief network is introduced to extract the depth features of speech, and the feature representation of speech passing through the depth belief network is analyzed, and the features are visualized.Based on the original speech database and the new features, the speech recognition experiment of the development network model is carried out.It can be seen from the experimental results that the recognition rates of English words and phrases are 96.30% and 92.96%, respectively, based on the new features of the developmental network model, which indicates that the performance of the model has been greatly improved.Compared with the traditional speech recognition model, the developmental network model has better performance.
【學(xué)位授予單位】:鄭州大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP242
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 曲超;;容量網(wǎng)絡(luò)模型及其性質(zhì)研究[J];東莞理工學(xué)院學(xué)報(bào);2011年03期
2 黃威,林麗閩,宋亮;基于第三方整合的商業(yè)網(wǎng)絡(luò)模型[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年S1期
3 韋洛霞;耦合生長(zhǎng)網(wǎng)絡(luò)模型的模擬[J];河南大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年02期
4 郝玉;葉世偉;;基于軟競(jìng)爭(zhēng)機(jī)制的對(duì)傳網(wǎng)絡(luò)模型及應(yīng)用[J];計(jì)算機(jī)仿真;2006年03期
5 馬費(fèi)成;王曉光;;知識(shí)轉(zhuǎn)移的社會(huì)網(wǎng)絡(luò)模型研究[J];江西社會(huì)科學(xué);2006年07期
6 孟凡玲;范向軍;;水電工程監(jiān)理評(píng)標(biāo)BP網(wǎng)絡(luò)模型研究[J];人民黃河;2007年07期
7 李文林;苗靜;劉振紅;;含時(shí)滯的復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)模型的指數(shù)同步[J];河南師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年05期
8 魯智勇;張權(quán);張希;唐朝京;;等效分組級(jí)聯(lián)BP網(wǎng)絡(luò)模型及其應(yīng)用[J];電子學(xué)報(bào);2010年06期
9 江瓊琴;宋文廣;;一種改進(jìn)的BP網(wǎng)絡(luò)模型在唇裂手術(shù)預(yù)測(cè)分析中的應(yīng)用[J];池州學(xué)院學(xué)報(bào);2012年06期
10 殷洪義 ,榮明宗 ,周昭南 ,周曼殊;網(wǎng)絡(luò)模型的統(tǒng)一表征[J];國(guó)防科技大學(xué)學(xué)報(bào);1981年02期
相關(guān)會(huì)議論文 前10條
1 張書超;那日薩;;具有老化機(jī)制的阿波羅網(wǎng)絡(luò)模型[A];2006全國(guó)復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文集[C];2006年
2 王仲君;黃紅球;;一個(gè)具有確定度分布的有向網(wǎng)絡(luò)模型[A];2006全國(guó)復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文集[C];2006年
3 李季明;張寧;;具有隨機(jī)性的確定性網(wǎng)絡(luò)模型[A];2006全國(guó)復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文集[C];2006年
4 秦紹萌;陳勇;;生態(tài)系統(tǒng)宏觀演化的網(wǎng)絡(luò)模型[A];2006全國(guó)復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文集[C];2006年
5 駱繼明;郭新軍;;分布復(fù)雜機(jī)電系統(tǒng)網(wǎng)絡(luò)模型圖自動(dòng)生成算法研究[A];煤礦機(jī)電一體化新技術(shù)創(chuàng)新與發(fā)展2012學(xué)術(shù)年會(huì)論文集[C];2012年
6 周勝利;耿顯民;;具有真實(shí)網(wǎng)絡(luò)一般特性的復(fù)雜網(wǎng)絡(luò)模型[A];第七屆中國(guó)不確定系統(tǒng)年會(huì)論文集[C];2009年
7 楊洪勇;王福生;;基于帶寬的Internet網(wǎng)絡(luò)模型[A];2007中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];2007年
8 趙雁飛;劉永忠;陳三強(qiáng);孫皓;;冷凍干燥過(guò)程相遷移和相分布的孔尺度網(wǎng)絡(luò)模型與模擬[A];第八屆全國(guó)冷凍干燥學(xué)術(shù)交流會(huì)論文集[C];2005年
9 梁昌洪;鄭家駿;;復(fù)電介質(zhì)反演的精確網(wǎng)絡(luò)模型[A];2001年全國(guó)微波毫米波會(huì)議論文集[C];2001年
10 劉杰;陸君安;;兩類復(fù)雜網(wǎng)絡(luò)模型及其同步能力研究[A];2006全國(guó)復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文集[C];2006年
相關(guān)重要報(bào)紙文章 前10條
1 ;智能光網(wǎng)絡(luò)的網(wǎng)絡(luò)模型[N];人民郵電;2003年
2 琪東;老年人的聽覺變化及調(diào)適[N];中國(guó)醫(yī)藥報(bào);2004年
3 馮衛(wèi)東;美構(gòu)建可快速確認(rèn)基因功能的基因網(wǎng)絡(luò)模型[N];科技日?qǐng)?bào);2008年
4 賀贊暉 唐大海;價(jià)格網(wǎng)絡(luò)與金融屬性定價(jià)[N];期貨日?qǐng)?bào);2010年
5 本報(bào)記者 王峰;消除耳朵里的嗡鳴聲[N];中國(guó)消費(fèi)者報(bào);2002年
6 黃夢(mèng);方案商積極切入語(yǔ)音識(shí)別市場(chǎng)[N];電腦商報(bào);2006年
7 閆婷;語(yǔ)音識(shí)別 理想與現(xiàn)實(shí)的距離[N];計(jì)算機(jī)世界;2007年
8 劉喜喜;語(yǔ)音識(shí)別將把鼠標(biāo)鍵盤打入冷宮?[N];中國(guó)計(jì)算機(jī)報(bào);2008年
9 樂天;語(yǔ)音識(shí)別:讓你的手機(jī)更聰明[N];計(jì)算機(jī)世界;2011年
10 特約作者 王佳彬;語(yǔ)音識(shí)別漸入佳境[N];電腦報(bào);2002年
相關(guān)博士學(xué)位論文 前10條
1 齊峰;人工神經(jīng)樹網(wǎng)絡(luò)模型的優(yōu)化研究與應(yīng)用[D];山東師范大學(xué);2011年
2 李淑靜;復(fù)合復(fù)雜網(wǎng)絡(luò)模型研究與應(yīng)用[D];青島大學(xué);2011年
3 譚利;復(fù)雜網(wǎng)絡(luò)模型及應(yīng)用研究[D];中南大學(xué);2010年
4 隋毅;多子網(wǎng)復(fù)合復(fù)雜網(wǎng)絡(luò)模型及其相關(guān)性質(zhì)的研究[D];青島大學(xué);2012年
5 黃朝琴;基于離散縫洞網(wǎng)絡(luò)模型的多尺度兩相流動(dòng)模擬理論研究[D];中國(guó)石油大學(xué)(華東);2012年
6 岳博;Bayes網(wǎng)絡(luò)模型及其學(xué)習(xí)算法研究[D];西安電子科技大學(xué);2002年
7 彭利民;基于Cayley圖的無(wú)線P2P覆蓋網(wǎng)絡(luò)模型及相關(guān)技術(shù)研究[D];華南理工大學(xué);2011年
8 王晨晨;碳酸鹽巖介質(zhì)雙孔隙網(wǎng)絡(luò)模型構(gòu)建理論與方法[D];中國(guó)石油大學(xué)(華東);2013年
9 李克勇;聽覺系統(tǒng)聲誘發(fā)反應(yīng)的磁聲場(chǎng)記錄[D];中國(guó)協(xié)和醫(yī)科大學(xué);1996年
10 蔡先鋒;礦井三維地理網(wǎng)絡(luò)模型及網(wǎng)絡(luò)分析研究[D];中國(guó)礦業(yè)大學(xué)(北京);2012年
相關(guān)碩士學(xué)位論文 前10條
1 譚達(dá)佩;仿人聽覺系統(tǒng)的發(fā)育網(wǎng)絡(luò)模型研究[D];鄭州大學(xué);2017年
2 王芳;基于深度信念網(wǎng)絡(luò)的資源檢索與推薦系統(tǒng)[D];北京郵電大學(xué);2015年
3 楊光勇;科研合作超網(wǎng)絡(luò)模型的構(gòu)建及其應(yīng)用研究[D];上海理工大學(xué);2013年
4 李倩;深度網(wǎng)絡(luò)模型構(gòu)建及學(xué)習(xí)算法研究[D];西安電子科技大學(xué);2014年
5 閆廷亞;基于GHSOM網(wǎng)絡(luò)模型的FY-2E夜間衛(wèi)星云圖分類方法研究[D];華東交通大學(xué);2015年
6 劉峰;軌道車輛MVB網(wǎng)絡(luò)模型研究與設(shè)計(jì)[D];長(zhǎng)春工業(yè)大學(xué);2016年
7 齊亞萍;具有實(shí)數(shù)詞匯結(jié)構(gòu)的語(yǔ)言競(jìng)爭(zhēng)復(fù)雜agent網(wǎng)絡(luò)模型[D];昆明理工大學(xué);2016年
8 邵春昌;基于圖理論的信息網(wǎng)絡(luò)模型研究[D];中央民族大學(xué);2016年
9 鄭光璞;模擬視覺皮層工作機(jī)制的發(fā)育網(wǎng)絡(luò)模型研究[D];鄭州大學(xué);2016年
10 張磊;微博超網(wǎng)絡(luò)模型的建立及關(guān)鍵節(jié)點(diǎn)識(shí)別方法研究[D];南京航空航天大學(xué);2016年
,本文編號(hào):1747640
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1747640.html