語(yǔ)音產(chǎn)生的神經(jīng)生理控制建模
發(fā)布時(shí)間:2021-07-31 20:27
大腦對(duì)于語(yǔ)音產(chǎn)生的控制過(guò)程是非常復(fù)雜的,包括許多的神經(jīng)控制過(guò)程如語(yǔ)音規(guī)劃、聽(tīng)覺(jué)感知反饋和體感感知反饋等。在控制過(guò)程中,各個(gè)相關(guān)的腦區(qū)是協(xié)同和并行工作的,一個(gè)區(qū)域的控制信號(hào)會(huì)傳輸?shù)搅硗鈳讉(gè)區(qū)域,這其中包含著許多“一對(duì)多”的關(guān)系。然而,在之前的神經(jīng)計(jì)算模型結(jié)構(gòu)中,各區(qū)域狀態(tài)之間的關(guān)系都是“一對(duì)一”的,并不是“一對(duì)多”的。因此,為了表現(xiàn)出一對(duì)多的控制關(guān)系,本文對(duì)模型的結(jié)構(gòu)進(jìn)行了修改,將模型中的運(yùn)動(dòng)規(guī)劃狀態(tài)、運(yùn)動(dòng)執(zhí)行狀態(tài)、體感狀態(tài)和聲學(xué)狀態(tài)分別使用一個(gè)狀態(tài)層來(lái)表示,并將每一層與腦區(qū)中的一個(gè)特定區(qū)域相對(duì)應(yīng)。最后將訓(xùn)練結(jié)果分別用一個(gè)自組織圖(Self-organizing Map,SOM)來(lái)表示。本文提出的神經(jīng)計(jì)算模型使用了一種基于語(yǔ)音產(chǎn)生的生理計(jì)算模型。該生理模型作為神經(jīng)計(jì)算模型的末梢語(yǔ)音產(chǎn)生模塊是用來(lái)模擬人體發(fā)聲時(shí)的聲道狀態(tài)的,它替代了過(guò)去大部分神經(jīng)控制模型所使用的幾何模型,這樣可以更好地反映人體語(yǔ)音產(chǎn)生過(guò)程中的具體生理特征。本文使用神經(jīng)計(jì)算模型對(duì)輔音-元音-(Consonant-vowel-,CV-)音節(jié)的動(dòng)態(tài)特性進(jìn)行了處理,設(shè)計(jì)了對(duì)于CV-音節(jié)的神經(jīng)化映射方法并構(gòu)造了數(shù)據(jù)量較大(25000...
【文章來(lái)源】:天津大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
DIVA模型結(jié)構(gòu)圖
的神經(jīng)激活模式)由前饋控制模塊來(lái)運(yùn)行。一個(gè)音節(jié)(在語(yǔ)音獲取階段已習(xí)或訓(xùn)練)的感知狀態(tài)(聽(tīng)覺(jué)狀態(tài)和體感狀態(tài))和運(yùn)動(dòng)規(guī)劃狀態(tài)會(huì)通過(guò)語(yǔ)Phonetic Map)來(lái)激活,語(yǔ)音圖可以被理解為是一個(gè)通過(guò)中心神經(jīng)映射方的字音表。對(duì)于每一個(gè)頻繁出現(xiàn)的音節(jié),音素圖會(huì)為每一個(gè)音素狀態(tài)創(chuàng)建定神經(jīng)元的激活形式,并隨后逐漸激活出兩個(gè)感知狀態(tài)和運(yùn)動(dòng)規(guī)劃狀態(tài)。頻繁出現(xiàn)的音節(jié),運(yùn)動(dòng)規(guī)劃狀態(tài)會(huì)在運(yùn)動(dòng)計(jì)劃模塊的亞音節(jié)單元級(jí)進(jìn)行產(chǎn)例來(lái)說(shuō),一個(gè)音節(jié)的產(chǎn)生包括音節(jié)初始化、音節(jié)韻律產(chǎn)生和音節(jié)語(yǔ)音信號(hào)過(guò)程。在運(yùn)動(dòng)規(guī)劃圖級(jí)別上,每一個(gè)語(yǔ)音項(xiàng)目(當(dāng)前語(yǔ)音項(xiàng)目)會(huì)激活一別的運(yùn)動(dòng)狀態(tài)(運(yùn)動(dòng)規(guī)劃),這個(gè)高級(jí)別的運(yùn)動(dòng)狀態(tài)定義了語(yǔ)音動(dòng)作或聲單元的時(shí)間協(xié)調(diào)過(guò)程。一個(gè)語(yǔ)音項(xiàng)目的運(yùn)動(dòng)規(guī)劃由運(yùn)動(dòng)執(zhí)行模塊來(lái)執(zhí)行,了發(fā)聲器官的具體運(yùn)動(dòng)過(guò)程,運(yùn)動(dòng)執(zhí)行模塊會(huì)計(jì)算出初始運(yùn)動(dòng)規(guī)劃圖級(jí)別的每一個(gè)語(yǔ)音動(dòng)作過(guò)程。例如,對(duì)與關(guān)閉嘴唇這個(gè)動(dòng)作包括一系列的協(xié)調(diào)動(dòng)少包括放低下巴、上下移動(dòng)嘴唇等動(dòng)作。因此,這些發(fā)聲器官必須通過(guò)協(xié)來(lái)完成一個(gè)具體的語(yǔ)音協(xié)同動(dòng)作。發(fā)聲器官的具體運(yùn)動(dòng)過(guò)程是通過(guò)神經(jīng)控運(yùn)動(dòng)模塊來(lái)控制各個(gè)發(fā)聲器官執(zhí)行的。
有人體具體的發(fā)聲生理特征。所以為了更好地探究人體的語(yǔ)音發(fā)生過(guò)程控制過(guò)程,必須使用一種更貼近于人體,基于人體發(fā)音生理特征的生理來(lái)替代原有的幾何模型。3 自組織圖(Self-organizing map, SOM)算法.1 自組織圖算法簡(jiǎn)介神經(jīng)計(jì)算模型所使用的語(yǔ)音知識(shí)訓(xùn)練學(xué)習(xí)方法為自組織圖算法。它最早蘭赫爾辛基大學(xué)的 Kohonen T.教授提出[38]。他指出,在人的神經(jīng)系統(tǒng)一個(gè)“側(cè)抑制”現(xiàn)象,即:如果有一個(gè)神經(jīng)元細(xì)胞產(chǎn)生興奮之后,它會(huì)的其他神經(jīng)元細(xì)胞產(chǎn)生一定的抑制作用,也就是說(shuō)每個(gè)神經(jīng)元細(xì)胞都會(huì)興奮度最強(qiáng)的神經(jīng)元細(xì)胞所影響而產(chǎn)生抑制作用。所以當(dāng)一個(gè)神經(jīng)網(wǎng)絡(luò)同的輸入模式后,神經(jīng)網(wǎng)絡(luò)中的各個(gè)區(qū)域根據(jù)不同的輸入模式會(huì)產(chǎn)生出應(yīng)狀態(tài)[39]。
【參考文獻(xiàn)】:
期刊論文
[1]Feedforward Control of a 3-D Physiological Articulatory Model for Vowel Production[J]. 方強(qiáng),Akikazu Nishikido. Tsinghua Science and Technology. 2009(05)
本文編號(hào):3314137
【文章來(lái)源】:天津大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
DIVA模型結(jié)構(gòu)圖
的神經(jīng)激活模式)由前饋控制模塊來(lái)運(yùn)行。一個(gè)音節(jié)(在語(yǔ)音獲取階段已習(xí)或訓(xùn)練)的感知狀態(tài)(聽(tīng)覺(jué)狀態(tài)和體感狀態(tài))和運(yùn)動(dòng)規(guī)劃狀態(tài)會(huì)通過(guò)語(yǔ)Phonetic Map)來(lái)激活,語(yǔ)音圖可以被理解為是一個(gè)通過(guò)中心神經(jīng)映射方的字音表。對(duì)于每一個(gè)頻繁出現(xiàn)的音節(jié),音素圖會(huì)為每一個(gè)音素狀態(tài)創(chuàng)建定神經(jīng)元的激活形式,并隨后逐漸激活出兩個(gè)感知狀態(tài)和運(yùn)動(dòng)規(guī)劃狀態(tài)。頻繁出現(xiàn)的音節(jié),運(yùn)動(dòng)規(guī)劃狀態(tài)會(huì)在運(yùn)動(dòng)計(jì)劃模塊的亞音節(jié)單元級(jí)進(jìn)行產(chǎn)例來(lái)說(shuō),一個(gè)音節(jié)的產(chǎn)生包括音節(jié)初始化、音節(jié)韻律產(chǎn)生和音節(jié)語(yǔ)音信號(hào)過(guò)程。在運(yùn)動(dòng)規(guī)劃圖級(jí)別上,每一個(gè)語(yǔ)音項(xiàng)目(當(dāng)前語(yǔ)音項(xiàng)目)會(huì)激活一別的運(yùn)動(dòng)狀態(tài)(運(yùn)動(dòng)規(guī)劃),這個(gè)高級(jí)別的運(yùn)動(dòng)狀態(tài)定義了語(yǔ)音動(dòng)作或聲單元的時(shí)間協(xié)調(diào)過(guò)程。一個(gè)語(yǔ)音項(xiàng)目的運(yùn)動(dòng)規(guī)劃由運(yùn)動(dòng)執(zhí)行模塊來(lái)執(zhí)行,了發(fā)聲器官的具體運(yùn)動(dòng)過(guò)程,運(yùn)動(dòng)執(zhí)行模塊會(huì)計(jì)算出初始運(yùn)動(dòng)規(guī)劃圖級(jí)別的每一個(gè)語(yǔ)音動(dòng)作過(guò)程。例如,對(duì)與關(guān)閉嘴唇這個(gè)動(dòng)作包括一系列的協(xié)調(diào)動(dòng)少包括放低下巴、上下移動(dòng)嘴唇等動(dòng)作。因此,這些發(fā)聲器官必須通過(guò)協(xié)來(lái)完成一個(gè)具體的語(yǔ)音協(xié)同動(dòng)作。發(fā)聲器官的具體運(yùn)動(dòng)過(guò)程是通過(guò)神經(jīng)控運(yùn)動(dòng)模塊來(lái)控制各個(gè)發(fā)聲器官執(zhí)行的。
有人體具體的發(fā)聲生理特征。所以為了更好地探究人體的語(yǔ)音發(fā)生過(guò)程控制過(guò)程,必須使用一種更貼近于人體,基于人體發(fā)音生理特征的生理來(lái)替代原有的幾何模型。3 自組織圖(Self-organizing map, SOM)算法.1 自組織圖算法簡(jiǎn)介神經(jīng)計(jì)算模型所使用的語(yǔ)音知識(shí)訓(xùn)練學(xué)習(xí)方法為自組織圖算法。它最早蘭赫爾辛基大學(xué)的 Kohonen T.教授提出[38]。他指出,在人的神經(jīng)系統(tǒng)一個(gè)“側(cè)抑制”現(xiàn)象,即:如果有一個(gè)神經(jīng)元細(xì)胞產(chǎn)生興奮之后,它會(huì)的其他神經(jīng)元細(xì)胞產(chǎn)生一定的抑制作用,也就是說(shuō)每個(gè)神經(jīng)元細(xì)胞都會(huì)興奮度最強(qiáng)的神經(jīng)元細(xì)胞所影響而產(chǎn)生抑制作用。所以當(dāng)一個(gè)神經(jīng)網(wǎng)絡(luò)同的輸入模式后,神經(jīng)網(wǎng)絡(luò)中的各個(gè)區(qū)域根據(jù)不同的輸入模式會(huì)產(chǎn)生出應(yīng)狀態(tài)[39]。
【參考文獻(xiàn)】:
期刊論文
[1]Feedforward Control of a 3-D Physiological Articulatory Model for Vowel Production[J]. 方強(qiáng),Akikazu Nishikido. Tsinghua Science and Technology. 2009(05)
本文編號(hào):3314137
本文鏈接:http://sikaile.net/yixuelunwen/shiyanyixue/3314137.html
最近更新
教材專著