基于深度神經(jīng)網(wǎng)絡(luò)的語音驅(qū)動(dòng)發(fā)音器官的運(yùn)動(dòng)合成

發(fā)布時(shí)間：2017-11-16 20:22

本文關(guān)鍵詞：基于深度神經(jīng)網(wǎng)絡(luò)的語音驅(qū)動(dòng)發(fā)音器官的運(yùn)動(dòng)合成

【摘要】：實(shí)現(xiàn)一種基于深度神經(jīng)網(wǎng)絡(luò)的語音驅(qū)動(dòng)發(fā)音器官運(yùn)動(dòng)合成的方法,并應(yīng)用于語音驅(qū)動(dòng)虛擬說話人動(dòng)畫合成.通過深度神經(jīng)網(wǎng)絡(luò)(Deep neural networks,DNN)學(xué)習(xí)聲學(xué)特征與發(fā)音器官位置信息之間的映射關(guān)系,系統(tǒng)根據(jù)輸入的語音數(shù)據(jù)估計(jì)發(fā)音器官的運(yùn)動(dòng)軌跡,并將其體現(xiàn)在一個(gè)三維虛擬人上面.首先,在一系列參數(shù)下對(duì)比人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network,ANN)和DNN的實(shí)驗(yàn)結(jié)果,得到最優(yōu)網(wǎng)絡(luò);其次,設(shè)置不同上下文聲學(xué)特征長(zhǎng)度并調(diào)整隱層單元數(shù),獲取最佳長(zhǎng)度;最后,選取最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu),由DNN輸出的發(fā)音器官運(yùn)動(dòng)軌跡信息控制發(fā)音器官運(yùn)動(dòng)合成,實(shí)現(xiàn)虛擬人動(dòng)畫.實(shí)驗(yàn)證明,本文所實(shí)現(xiàn)的動(dòng)畫合成方法高效逼真.
【作者單位】：西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院;
【基金】：成都市科技項(xiàng)目(科技惠民技術(shù)研發(fā)項(xiàng)目)(2015-HM01-00050-SF) 四川省動(dòng)漫研究中心2015年度科研項(xiàng)目(DM201504) 西南交通大學(xué)2015年研究生創(chuàng)新實(shí)驗(yàn)實(shí)踐項(xiàng)目(YC201504109)資助~~
【分類號(hào)】：TN912.3;TP183
【正文快照】： 由于視覺與聽覺是人類最主要、最便捷的兩種溝通方式,因此虛擬人動(dòng)畫結(jié)合聽視覺雙模態(tài)溝通方式的特點(diǎn),將虛擬人的視覺信息作為其聲音的一種補(bǔ)充.例如,額外的舌頭和唇部等發(fā)音器官的運(yùn)動(dòng),眉毛和眼瞼等面部特征,甚至是頭部和肢體的動(dòng)作等,這些附加信息可以極大提高虛擬人動(dòng)畫的

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條

1 ;好聲音,從何而來?[J];科技傳播;2012年19期

2 傅懷平,張學(xué)國(guó),楊紅;多路合成全息語音發(fā)音器官圖譜的研究[J];光電子·激光;2002年12期

3 ;[J];;年期

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前7條

1 王若愚;惜言如金能護(hù)嗓[N];保健時(shí)報(bào);2006年

2 齊建榮;兒童口吃與心理有關(guān)[N];大眾衛(wèi)生報(bào);2007年

3 衣曉峰本報(bào)記者姚艷春;別讓嗓子“超負(fù)荷”[N];黑龍江日?qǐng)?bào);2004年

4 紅火;人到年老應(yīng)護(hù)嗓[N];中國(guó)中醫(yī)藥報(bào);2006年

5 記者謝苗楓　通訊員盧健民彭梅蕾;暨大明年新增播音專業(yè)[N];南方日?qǐng)?bào);2008年

6 柳軍;幫助孩子正確發(fā)音[N];大眾衛(wèi)生報(bào);2000年

7 本報(bào)記者　聶翠蓉;我是機(jī)器,我像人[N];科技日?qǐng)?bào);2006年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條

1 宋嬋;人體發(fā)音過程中的三維聲道幾何建模[D];天津大學(xué);2014年

，

本文編號(hào)：1193595

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/xinxigongchenglunwen/1193595.html

上一篇：高增益高隔離度毫米波MIMO天線
下一篇：泰安電信光網(wǎng)絡(luò)演進(jìn)的研究與實(shí)施

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度神經(jīng)網(wǎng)絡(luò)的語音驅(qū)動(dòng)發(fā)音器官的運(yùn)動(dòng)合成