利用AdaBoost-SVM集成算法和語塊信息的韻律短語識別
本文關(guān)鍵詞:利用AdaBoost-SVM集成算法和語塊信息的韻律短語識別
更多相關(guān)文章: 漢語語塊 AdaBoost-SVM 韻律短語 識別
【摘要】:提出一種基于漢語語塊結(jié)構(gòu)并利用AdaBoost-SVM集成學(xué)習(xí)算法的漢語韻律短語識別方法。首先,對語料進(jìn)行自動分詞、詞性標(biāo)注和初語塊標(biāo)注,然后基于結(jié)合緊密度獲取語塊歸并規(guī)則并利用規(guī)則對初語塊進(jìn)行歸并,得到最終的語塊結(jié)構(gòu)。其次,基于語塊結(jié)構(gòu)并利用AdaBoost-SVM集成算法,構(gòu)建漢語韻律短語識別模型。同時,該文利用多種算法分別構(gòu)建了利用語塊信息和不利用語塊的多個模型,對比實(shí)驗(yàn)結(jié)果表明,表示淺層句法信息的語塊能夠在韻律短語識別中做出積極有效的貢獻(xiàn);利用AdaBoos-SVM集成算法實(shí)現(xiàn)的模型性能更佳。
【作者單位】: 山西大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院;山西大學(xué)計(jì)算智能與中文信息處理教育部重點(diǎn)實(shí)驗(yàn)室;
【關(guān)鍵詞】: 漢語語塊 AdaBoost-SVM 韻律短語 識別
【基金】:國家自然科學(xué)基金資助項(xiàng)目(61175067) 國家自然科學(xué)青年基金資助項(xiàng)目(61005053,61100138) 山西省科技基礎(chǔ)條件平臺建設(shè)項(xiàng)目(2015091001-0102) 山西省青年科技研究基金資助項(xiàng)目(2012021012-1) 山西省回國留學(xué)人員科研資助項(xiàng)目(2013-022)
【分類號】:TN912.34
【正文快照】: 1引言語音合成是制造語音的技術(shù)。它涉及聲學(xué)、語言學(xué)、數(shù)字信號處理、計(jì)算機(jī)科學(xué)等多個學(xué)科技術(shù),是中文信息處理領(lǐng)域的一項(xiàng)前沿技術(shù)。目前機(jī)器合成的語音與人講的話之間還有明顯的差距,其自然度還有待進(jìn)一步的提高。韻律的差距是影響語音自然度的重要因素之一,合成的語音單調(diào)
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 周強(qiáng);李玉梅;;漢語塊分析評測任務(wù)設(shè)計(jì)[J];中文信息學(xué)報(bào);2010年01期
2 錢揖麗;馮志茹;;基于語塊和條件隨機(jī)場(CRFs)的韻律短語識別[J];中文信息學(xué)報(bào);2014年05期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前7條
1 李勝梅;;“語篇言語塊”的理論位置及研究路徑[J];阜陽師范學(xué)院學(xué)報(bào)(社會科學(xué)版);2012年03期
2 孫廣路;郎非;薛一波;;基于條件隨機(jī)域和語義類的中文組塊分析方法[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2011年07期
3 劉海霞;黃德根;;語義信息與CRF結(jié)合的漢語功能塊自動識別[J];中文信息學(xué)報(bào);2011年05期
4 李業(yè)剛;黃河燕;;漢語組塊分析研究綜述[J];中文信息學(xué)報(bào);2013年03期
5 李琳;龍從軍;江荻;;藏語句法功能組塊的邊界識別[J];中文信息學(xué)報(bào);2013年06期
6 錢揖麗;馮志茹;;基于語塊和條件隨機(jī)場(CRFs)的韻律短語識別[J];中文信息學(xué)報(bào);2014年05期
7 楊靜;徐蔚然;譚松波;;COAE2014情感關(guān)鍵句評測任務(wù)和評測數(shù)據(jù)設(shè)計(jì)[J];山西大學(xué)學(xué)報(bào)(自然科學(xué)版);2015年01期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 劉海霞;漢語功能塊的自動識別研究[D];大連理工大學(xué);2011年
2 李福民;基于語料庫的短語結(jié)構(gòu)分析研究[D];山西大學(xué);2012年
3 常若愚;漢語語義組塊識別研究[D];杭州電子科技大學(xué);2015年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張昱琪,周強(qiáng);漢語基本短語的自動識別[J];中文信息學(xué)報(bào);2002年06期
2 曹劍芬;基于語法信息的漢語韻律結(jié)構(gòu)預(yù)測[J];中文信息學(xué)報(bào);2003年03期
3 周強(qiáng);漢語句法樹庫標(biāo)注體系[J];中文信息學(xué)報(bào);2004年04期
4 李劍鋒,胡國平,王仁華;基于最大熵模型的韻律短語邊界預(yù)測[J];中文信息學(xué)報(bào);2004年05期
5 荀恩東;錢揖麗;郭慶;宋柔;;應(yīng)用二叉樹剪枝識別韻律短語邊界[J];中文信息學(xué)報(bào);2006年03期
6 周強(qiáng);;漢語基本塊描述體系[J];中文信息學(xué)報(bào);2007年03期
7 周強(qiáng);趙穎澤;;漢語功能塊自動分析[J];中文信息學(xué)報(bào);2007年05期
8 陳億;周強(qiáng);宇航;;分層次的漢語功能塊描述庫構(gòu)建分析[J];中文信息學(xué)報(bào);2008年03期
9 王永鑫;蔡蓮紅;;語法信息與韻律結(jié)構(gòu)的分析與預(yù)測[J];中文信息學(xué)報(bào);2010年01期
10 周強(qiáng);李玉梅;;漢語塊分析評測任務(wù)設(shè)計(jì)[J];中文信息學(xué)報(bào);2010年01期
【相似文獻(xiàn)】
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 常成成;基于AdaBoost-SVM的軟件缺陷優(yōu)先級預(yù)測模型的研究[D];南京郵電大學(xué);2013年
,本文編號:1050108
本文鏈接:http://sikaile.net/kejilunwen/wltx/1050108.html