準(zhǔn)書面語(yǔ)朝鮮語(yǔ)語(yǔ)音語(yǔ)料自動(dòng)標(biāo)注系統(tǒng)的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2020-10-08 20:53
隨著人工智能時(shí)代的到來(lái),其相關(guān)技術(shù)呈現(xiàn)了快速發(fā)展的趨勢(shì)。在這樣的時(shí)代背景下,語(yǔ)音識(shí)別技術(shù)也越來(lái)越廣泛地融入人們的生活和生產(chǎn)中,出現(xiàn)了語(yǔ)音輸入、語(yǔ)音助手、口語(yǔ)翻譯、智能客服、智能硬件等應(yīng)用性產(chǎn)品。在語(yǔ)音識(shí)別技術(shù)發(fā)展的歷程中,每一次識(shí)別方法的突破始終離不開高質(zhì)量、大規(guī)模的語(yǔ)音語(yǔ)料庫(kù)的支撐,所以語(yǔ)音語(yǔ)料庫(kù)的建設(shè)是語(yǔ)音識(shí)別技術(shù)賴以實(shí)現(xiàn)的重要基礎(chǔ)。過(guò)去的幾十年間,我國(guó)很多少數(shù)民族語(yǔ)言如維吾爾語(yǔ)、藏語(yǔ)、蒙古語(yǔ)的語(yǔ)音語(yǔ)料庫(kù)建設(shè)已初具規(guī)模,但國(guó)內(nèi)的朝鮮語(yǔ)語(yǔ)音語(yǔ)料庫(kù)建設(shè)狀況卻是嚴(yán)重滯后的。針對(duì)這一狀況,本文結(jié)合朝鮮語(yǔ)的發(fā)音特點(diǎn)提出了準(zhǔn)書面語(yǔ)朝鮮語(yǔ)語(yǔ)音語(yǔ)料的自動(dòng)標(biāo)注方法,并設(shè)計(jì)實(shí)現(xiàn)了自動(dòng)標(biāo)注系統(tǒng)。首先,基于Seneff聽覺模型提出朝鮮語(yǔ)語(yǔ)音音節(jié)自動(dòng)分割方法。該方法依據(jù)Seneff聽覺模型輸出的ALSD和ED等參數(shù)確定正負(fù)突變點(diǎn),進(jìn)而確定語(yǔ)音音節(jié)的起止位置。在此基礎(chǔ)上進(jìn)一步分析錯(cuò)誤分割主要原因后,提出了改進(jìn)的朝鮮語(yǔ)語(yǔ)音音節(jié)分割算法。其次,提出了準(zhǔn)書面語(yǔ)朝鮮語(yǔ)文語(yǔ)語(yǔ)料的文語(yǔ)對(duì)齊方法。為了減少語(yǔ)音音節(jié)分割錯(cuò)誤在文語(yǔ)對(duì)齊階段的累計(jì)影響,本方法在文語(yǔ)對(duì)齊預(yù)處理階段采用提出的語(yǔ)音句子切分算法和語(yǔ)音片段細(xì)切分算法將文語(yǔ)語(yǔ)料劃分為一系列更小的語(yǔ)音片段序列,然后在引入提出的朝鮮語(yǔ)連讀規(guī)則和音節(jié)真?zhèn)涡耘袆e算法基礎(chǔ)上實(shí)現(xiàn)了文語(yǔ)對(duì)齊。最后,設(shè)計(jì)和實(shí)現(xiàn)了準(zhǔn)書面語(yǔ)朝鮮語(yǔ)語(yǔ)音語(yǔ)料的自動(dòng)標(biāo)注系統(tǒng)。該系統(tǒng)以語(yǔ)音語(yǔ)料自動(dòng)標(biāo)注文件作為最終的處理結(jié)果,以語(yǔ)音音節(jié)自動(dòng)分割算法和文語(yǔ)對(duì)齊方法為核心技術(shù),采用Python編碼實(shí)現(xiàn)。設(shè)計(jì)和實(shí)現(xiàn)過(guò)程中遵循軟件工程方法進(jìn)行了需求分析、總體方案設(shè)計(jì)、功能模塊劃分以及測(cè)試。實(shí)驗(yàn)和測(cè)試結(jié)果表明,本文提出的音節(jié)自動(dòng)分割改進(jìn)算法準(zhǔn)確率達(dá)到86.76%,文語(yǔ)對(duì)齊算法準(zhǔn)確率達(dá)到70.26%,系統(tǒng)的功能模塊測(cè)試均滿足設(shè)計(jì)目標(biāo),未發(fā)現(xiàn)缺陷。本文提出的語(yǔ)音語(yǔ)料自動(dòng)標(biāo)注方法與人工標(biāo)注和基于語(yǔ)音識(shí)別標(biāo)注方法不同,主要通過(guò)語(yǔ)音音節(jié)自動(dòng)分割和文語(yǔ)對(duì)齊方法實(shí)現(xiàn)了準(zhǔn)書面語(yǔ)朝鮮語(yǔ)文語(yǔ)語(yǔ)料的自動(dòng)對(duì)齊和標(biāo)注,方法具有簡(jiǎn)單高效、易實(shí)現(xiàn)等優(yōu)點(diǎn),同時(shí)對(duì)促進(jìn)朝鮮語(yǔ)語(yǔ)音語(yǔ)料庫(kù)研究與建設(shè)具有一定的理論和應(yīng)用價(jià)值。
【學(xué)位單位】:延邊大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:H219;TN912.3
【部分圖文】:
識(shí)別、語(yǔ)音識(shí)別、語(yǔ)音信號(hào)處理等領(lǐng)域。逡逑Seneff聽覺模型的原理是對(duì)于耳蝸模型,采用一組線性時(shí)不變臨界頻帶逡逑濾波器進(jìn)行描述。人的外周聽覺系統(tǒng)由外耳、中耳、內(nèi)耳組成,如圖2-2所逡逑示。耳蝸內(nèi)含基底膜和賴斯納膜,其中基底膜可對(duì)輸入信號(hào)進(jìn)行頻率分析。逡逑Seneff聽覺模型主要由臨界頻帶濾波器組、毛細(xì)胞模型和輸出響應(yīng)組成[311。逡逑圖2-2人類聽覺周邊的示意圖逡逑Fig.2-2邋Schematic邋diagram邋of邋human邋hearing逡逑聽覺神經(jīng)纖維沿著耳蝸基底膜的反應(yīng)特性可近似由臨界頻帶濾波器組成逡逑的序列表示,不同的方法產(chǎn)生的濾波器響應(yīng)形狀不同,如通過(guò)Mossbauer技逡逑術(shù)[321或激光干涉法【331測(cè)量基底膜的振動(dòng)得到“神經(jīng)生理調(diào)節(jié)曲線”,或通過(guò)心逡逑—12邋—逡逑
2.邋4.邋2基于Seneff聽覺模型的特征表示逡逑聽覺模型是基于人耳的構(gòu)造模擬實(shí)際耳蝸,所以具備良好的語(yǔ)音處理性逡逑能。Seneff聽覺模型框架參見圖2-3[34]。逡逑預(yù)處理濾波J逡逑臨界頻帶濾波器組逡逑半波整流逡逑邐邋I逡逑「:邐i邋h邋「…:邐i邋 ̄ ̄ ̄i逡逑短時(shí)自適應(yīng)調(diào)整+STA邋:邐低通濾波(LPF)逡逑平|邐邐。哼婂澹檫姡慑暹姡捱婂澹逋义希椋殄澹焖僮詣(dòng)增益控制邐:|快速自動(dòng)增益控制丨g逡逑象邐(AGC)邐|邐!邐(AGC)邐ig邐I逡逑7邐:邐:邐I邋..邐!逡逑包絡(luò)檢測(cè)器邐同步檢測(cè)器逡逑I邋1邋^邋I邋丨邋r°s’邋I逡逑圖2-3邋Seneff聽覺模型框架逡逑Fig.2-3邋Seneff邋auditory邋model邋framework逡逑—13邋—逡逑
LSD、全頻帶和中高頻帶ED以及ED譜重心。相關(guān)的參數(shù)的計(jì)算方法參見逡逑2.4.2邐中公式(2-20) ̄(2-23)。逡逑圖3-3是朝鮮語(yǔ)語(yǔ)音“夸吩封可嘹舍兮MTL”的頻譜參數(shù)分布曲線示意逡逑圖。圖3-3中標(biāo)注符號(hào)“▲”表示波峰,“%肌北硎靜ü齲埃北硎菊槐淶悖礤義鮮靖和槐淶。辶x賢跡常持懈髑咄枷允境瞿芰亢凸艙穹宓忍卣骶桑櫻澹睿澹媯嫣蹌P捅硎懼義銑晌牛暮停粒蹋櫻腦詬髕刀蔚牟煌榭觶渲校ǎ幔ǎ猓ǎ洌ǎ瑁┪蕩粒蹋櫻、禐沉x掀蕩粒蹋櫻摹ⅲ粒蹋櫻鈉字匭暮停牛鬧械透咂蕩齲捎糜誶窒煲艉妥樅簦誨義希ǎ猓ǎ澹ǎ媯兀紓┪懈咂蕩粒蹋櫻、全剖庿簷E懈咂蕩耍囊約埃牛鈉字匭,震~膩義險(xiǎn)咭約叭蕩粒蹋櫻目啥韻煲艚徊郊觳獬鱸、鼻音和边音。由特征曲线辶x锨魘票浠汕蟮謎和槐淶悖詿嘶∩峽墑迪忠艚詒囈緄愕幕幀e義稀玻跺濉義
本文編號(hào):2832743
【學(xué)位單位】:延邊大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:H219;TN912.3
【部分圖文】:
識(shí)別、語(yǔ)音識(shí)別、語(yǔ)音信號(hào)處理等領(lǐng)域。逡逑Seneff聽覺模型的原理是對(duì)于耳蝸模型,采用一組線性時(shí)不變臨界頻帶逡逑濾波器進(jìn)行描述。人的外周聽覺系統(tǒng)由外耳、中耳、內(nèi)耳組成,如圖2-2所逡逑示。耳蝸內(nèi)含基底膜和賴斯納膜,其中基底膜可對(duì)輸入信號(hào)進(jìn)行頻率分析。逡逑Seneff聽覺模型主要由臨界頻帶濾波器組、毛細(xì)胞模型和輸出響應(yīng)組成[311。逡逑圖2-2人類聽覺周邊的示意圖逡逑Fig.2-2邋Schematic邋diagram邋of邋human邋hearing逡逑聽覺神經(jīng)纖維沿著耳蝸基底膜的反應(yīng)特性可近似由臨界頻帶濾波器組成逡逑的序列表示,不同的方法產(chǎn)生的濾波器響應(yīng)形狀不同,如通過(guò)Mossbauer技逡逑術(shù)[321或激光干涉法【331測(cè)量基底膜的振動(dòng)得到“神經(jīng)生理調(diào)節(jié)曲線”,或通過(guò)心逡逑—12邋—逡逑
2.邋4.邋2基于Seneff聽覺模型的特征表示逡逑聽覺模型是基于人耳的構(gòu)造模擬實(shí)際耳蝸,所以具備良好的語(yǔ)音處理性逡逑能。Seneff聽覺模型框架參見圖2-3[34]。逡逑預(yù)處理濾波J逡逑臨界頻帶濾波器組逡逑半波整流逡逑邐邋I逡逑「:邐i邋h邋「…:邐i邋 ̄ ̄ ̄i逡逑短時(shí)自適應(yīng)調(diào)整+STA邋:邐低通濾波(LPF)逡逑平|邐邐。哼婂澹檫姡慑暹姡捱婂澹逋义希椋殄澹焖僮詣(dòng)增益控制邐:|快速自動(dòng)增益控制丨g逡逑象邐(AGC)邐|邐!邐(AGC)邐ig邐I逡逑7邐:邐:邐I邋..邐!逡逑包絡(luò)檢測(cè)器邐同步檢測(cè)器逡逑I邋1邋^邋I邋丨邋r°s’邋I逡逑圖2-3邋Seneff聽覺模型框架逡逑Fig.2-3邋Seneff邋auditory邋model邋framework逡逑—13邋—逡逑
LSD、全頻帶和中高頻帶ED以及ED譜重心。相關(guān)的參數(shù)的計(jì)算方法參見逡逑2.4.2邐中公式(2-20) ̄(2-23)。逡逑圖3-3是朝鮮語(yǔ)語(yǔ)音“夸吩封可嘹舍兮MTL”的頻譜參數(shù)分布曲線示意逡逑圖。圖3-3中標(biāo)注符號(hào)“▲”表示波峰,“%肌北硎靜ü齲埃北硎菊槐淶悖礤義鮮靖和槐淶。辶x賢跡常持懈髑咄枷允境瞿芰亢凸艙穹宓忍卣骶桑櫻澹睿澹媯嫣蹌P捅硎懼義銑晌牛暮停粒蹋櫻腦詬髕刀蔚牟煌榭觶渲校ǎ幔ǎ猓ǎ洌ǎ瑁┪蕩粒蹋櫻、禐沉x掀蕩粒蹋櫻摹ⅲ粒蹋櫻鈉字匭暮停牛鬧械透咂蕩齲捎糜誶窒煲艉妥樅簦誨義希ǎ猓ǎ澹ǎ媯兀紓┪懈咂蕩粒蹋櫻、全剖庿簷E懈咂蕩耍囊約埃牛鈉字匭,震~膩義險(xiǎn)咭約叭蕩粒蹋櫻目啥韻煲艚徊郊觳獬鱸、鼻音和边音。由特征曲线辶x锨魘票浠汕蟮謎和槐淶悖詿嘶∩峽墑迪忠艚詒囈緄愕幕幀e義稀玻跺濉義
本文編號(hào):2832743
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2832743.html
最近更新
教材專著