天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

基于語(yǔ)音識(shí)別的手語(yǔ)翻譯算法研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2021-01-29 22:04
  在我國(guó)有2000多萬(wàn)的聽(tīng)力語(yǔ)言殘障人士,他們無(wú)法像健全人一樣通過(guò)說(shuō)話和聆聽(tīng)與外界進(jìn)行溝通,只能通過(guò)無(wú)聲的手語(yǔ)與旁人交流。為了讓聾啞人士更好地融入社會(huì),有效地與社會(huì)進(jìn)行交流,手語(yǔ)翻譯扮演著至關(guān)重要的角色。隨著人工智能的不斷發(fā)展,各種深度學(xué)習(xí)技術(shù)不斷涌現(xiàn),鑒于我國(guó)聾啞人數(shù)龐大而且關(guān)于語(yǔ)音至手語(yǔ)翻譯方面的研究較少,如何將人工智能融入到手語(yǔ)翻譯中,讓聾啞人可以便捷地“聽(tīng)懂”健全人的說(shuō)話內(nèi)容這一方向具有廣泛及實(shí)用的研究和應(yīng)用價(jià)值。本文以基于語(yǔ)音識(shí)別的手語(yǔ)翻譯算法為研究目標(biāo),主要展開(kāi)了以下工作內(nèi)容:(1)語(yǔ)音識(shí)別是語(yǔ)音到手語(yǔ)的基礎(chǔ)工作,其又可分為兩大任務(wù):聲學(xué)模型和語(yǔ)言模型。本文首先對(duì)語(yǔ)音識(shí)別的聲學(xué)模型展開(kāi)研究,對(duì)DFCNN(Deep Fully Convolutional Neural Network)框架進(jìn)行了改進(jìn),提出了CNN+CTC(Convolutional Neural Network+Connectionist Temporal Classification)算法,實(shí)現(xiàn)了端到端的聲學(xué)模型。該算法可以有效地將語(yǔ)音數(shù)據(jù)識(shí)別為中文拼音序列,在測(cè)試集上的詞錯(cuò)誤率和句錯(cuò)誤率分別為9.20%和2... 

【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:76 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于語(yǔ)音識(shí)別的手語(yǔ)翻譯算法研究與實(shí)現(xiàn)


語(yǔ)音信號(hào)時(shí)頻圖

變化曲線,變化曲線,迭代,聲學(xué)模型


第三章語(yǔ)音識(shí)別聲學(xué)模型研究3314為不包括Batch_normalization層網(wǎng)絡(luò)的訓(xùn)練loss值變化,圖3-15為包括Batch_normalization層的網(wǎng)絡(luò)訓(xùn)練loss值的曲線。從兩個(gè)圖中可以看出,不加Batch_normalization層的網(wǎng)絡(luò)會(huì)從一個(gè)很高的loss值開(kāi)始下降,而且收斂速度非常慢,同為迭代100次,不加Batch_normalization層的網(wǎng)絡(luò)的loss值變化非常平緩,需要較多次迭代來(lái)達(dá)到收斂。而加入包括Batch_normalization層的網(wǎng)絡(luò)的loss變化曲線則不會(huì)出現(xiàn)這些問(wèn)題,較快達(dá)到了收斂。圖3-14不包括BN層網(wǎng)絡(luò)loss變化曲線圖3-15包括BN層網(wǎng)絡(luò)loss變化曲線

變化曲線,變化曲線,迭代,聲學(xué)模型


第三章語(yǔ)音識(shí)別聲學(xué)模型研究3314為不包括Batch_normalization層網(wǎng)絡(luò)的訓(xùn)練loss值變化,圖3-15為包括Batch_normalization層的網(wǎng)絡(luò)訓(xùn)練loss值的曲線。從兩個(gè)圖中可以看出,不加Batch_normalization層的網(wǎng)絡(luò)會(huì)從一個(gè)很高的loss值開(kāi)始下降,而且收斂速度非常慢,同為迭代100次,不加Batch_normalization層的網(wǎng)絡(luò)的loss值變化非常平緩,需要較多次迭代來(lái)達(dá)到收斂。而加入包括Batch_normalization層的網(wǎng)絡(luò)的loss變化曲線則不會(huì)出現(xiàn)這些問(wèn)題,較快達(dá)到了收斂。圖3-14不包括BN層網(wǎng)絡(luò)loss變化曲線圖3-15包括BN層網(wǎng)絡(luò)loss變化曲線

【參考文獻(xiàn)】:
期刊論文
[1]基于注意力LSTM和多任務(wù)學(xué)習(xí)的遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別[J]. 張宇,張鵬遠(yuǎn),顏永紅.  清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(03)
[2]語(yǔ)音識(shí)別技術(shù)的研究進(jìn)展與展望[J]. 王海坤,潘嘉,劉聰.  電信科學(xué). 2018(02)
[3]手語(yǔ)翻譯設(shè)備的發(fā)展現(xiàn)狀及未來(lái)趨勢(shì)[J]. 王丹蕾,聶桂平.  設(shè)計(jì). 2016(19)
[4]智能語(yǔ)音交互技術(shù)及其標(biāo)準(zhǔn)化[J]. 胡郁,嚴(yán)峻.  信息技術(shù)與標(biāo)準(zhǔn)化. 2015(04)
[5]自然手語(yǔ)與文法手語(yǔ)的區(qū)別[J]. 由婧涵.  樂(lè)山師范學(xué)院學(xué)報(bào). 2014(01)
[6]基于Direct3D逼真中國(guó)手語(yǔ)合成技術(shù)研究及應(yīng)用實(shí)現(xiàn)[J]. 顏慶聰,陳益強(qiáng),劉軍發(fā).  系統(tǒng)仿真學(xué)報(bào). 2009(22)
[7]漢語(yǔ)自動(dòng)分詞研究進(jìn)展[J]. 文庭孝.  圖書與情報(bào). 2005(05)
[8]基于層疊隱馬模型的漢語(yǔ)詞法分析[J]. 劉群,張華平,俞鴻魁,程學(xué)旗.  計(jì)算機(jī)研究與發(fā)展. 2004(08)
[9]書面漢語(yǔ)的自動(dòng)分詞與一個(gè)自動(dòng)分詞系統(tǒng)—CDWS[J]. 梁南元.  北京航空學(xué)院學(xué)報(bào). 1984(04)

碩士論文
[1]語(yǔ)音識(shí)別關(guān)鍵技術(shù)研究[D]. 王一蒙.電子科技大學(xué) 2015



本文編號(hào):3007685

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3007685.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8b7bc***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com