天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

基于深度神經(jīng)網(wǎng)絡(luò)的語音驅(qū)動(dòng)發(fā)音器官的運(yùn)動(dòng)合成

發(fā)布時(shí)間:2017-11-16 20:22

  本文關(guān)鍵詞:基于深度神經(jīng)網(wǎng)絡(luò)的語音驅(qū)動(dòng)發(fā)音器官的運(yùn)動(dòng)合成


  更多相關(guān)文章: 深度神經(jīng)網(wǎng)絡(luò) 語音驅(qū)動(dòng) 運(yùn)動(dòng)合成 虛擬說話人


【摘要】:實(shí)現(xiàn)一種基于深度神經(jīng)網(wǎng)絡(luò)的語音驅(qū)動(dòng)發(fā)音器官運(yùn)動(dòng)合成的方法,并應(yīng)用于語音驅(qū)動(dòng)虛擬說話人動(dòng)畫合成.通過深度神經(jīng)網(wǎng)絡(luò)(Deep neural networks,DNN)學(xué)習(xí)聲學(xué)特征與發(fā)音器官位置信息之間的映射關(guān)系,系統(tǒng)根據(jù)輸入的語音數(shù)據(jù)估計(jì)發(fā)音器官的運(yùn)動(dòng)軌跡,并將其體現(xiàn)在一個(gè)三維虛擬人上面.首先,在一系列參數(shù)下對(duì)比人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network,ANN)和DNN的實(shí)驗(yàn)結(jié)果,得到最優(yōu)網(wǎng)絡(luò);其次,設(shè)置不同上下文聲學(xué)特征長(zhǎng)度并調(diào)整隱層單元數(shù),獲取最佳長(zhǎng)度;最后,選取最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu),由DNN輸出的發(fā)音器官運(yùn)動(dòng)軌跡信息控制發(fā)音器官運(yùn)動(dòng)合成,實(shí)現(xiàn)虛擬人動(dòng)畫.實(shí)驗(yàn)證明,本文所實(shí)現(xiàn)的動(dòng)畫合成方法高效逼真.
【作者單位】: 西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院;
【基金】:成都市科技項(xiàng)目(科技惠民技術(shù)研發(fā)項(xiàng)目)(2015-HM01-00050-SF) 四川省動(dòng)漫研究中心2015年度科研項(xiàng)目(DM201504) 西南交通大學(xué)2015年研究生創(chuàng)新實(shí)驗(yàn)實(shí)踐項(xiàng)目(YC201504109)資助~~
【分類號(hào)】:TN912.3;TP183
【正文快照】: 由于視覺與聽覺是人類最主要、最便捷的兩種溝通方式,因此虛擬人動(dòng)畫結(jié)合聽視覺雙模態(tài)溝通方式的特點(diǎn),將虛擬人的視覺信息作為其聲音的一種補(bǔ)充.例如,額外的舌頭和唇部等發(fā)音器官的運(yùn)動(dòng),眉毛和眼瞼等面部特征,甚至是頭部和肢體的動(dòng)作等,這些附加信息可以極大提高虛擬人動(dòng)畫的

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條

1 ;好聲音,從何而來?[J];科技傳播;2012年19期

2 傅懷平,張學(xué)國(guó),楊紅;多路合成全息語音發(fā)音器官圖譜的研究[J];光電子·激光;2002年12期

3 ;[J];;年期

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前7條

1 王若愚;惜言如金能護(hù)嗓[N];保健時(shí)報(bào);2006年

2 齊建榮;兒童口吃與心理有關(guān)[N];大眾衛(wèi)生報(bào);2007年

3 衣曉峰 本報(bào)記者 姚艷春;別讓嗓子“超負(fù)荷”[N];黑龍江日?qǐng)?bào);2004年

4 紅 火;人到年老應(yīng)護(hù)嗓[N];中國(guó)中醫(yī)藥報(bào);2006年

5 記者 謝苗楓 通訊員 盧健民 彭梅蕾;暨大明年新增播音專業(yè)[N];南方日?qǐng)?bào);2008年

6 柳軍;幫助孩子正確發(fā)音[N];大眾衛(wèi)生報(bào);2000年

7 本報(bào)記者 聶翠蓉;我是機(jī)器,我像人[N];科技日?qǐng)?bào);2006年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條

1 宋嬋;人體發(fā)音過程中的三維聲道幾何建模[D];天津大學(xué);2014年



本文編號(hào):1193595

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1193595.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶39586***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com