低資源語言的無監(jiān)督語音關(guān)鍵詞檢測技術(shù)綜述
本文選題:檢測 切入點:低資源 出處:《中國圖象圖形學(xué)報》2015年02期 論文類型:期刊論文
【摘要】:目的低資源(low-resource)語言的無監(jiān)督的關(guān)鍵詞檢測技術(shù)近年來引起了廣泛的研究興趣。低資源語言由于缺乏足夠的標注數(shù)據(jù)及相關(guān)的專家知識,使得傳統(tǒng)的基于大詞匯量語音識別系統(tǒng)的關(guān)鍵詞檢測技術(shù)無法使用。近年來,研究者試圖尋找一種無監(jiān)督的技術(shù)來完成針對低資源語言的語音關(guān)鍵詞檢測。方法首先闡述了該技術(shù)目前面臨的問題與挑戰(zhàn),然后介紹了該技術(shù)使用的主流的基于動態(tài)時間規(guī)整的算法框架,并從特征表示、模板匹配方法、效率提升等幾個重要方面介紹了近幾年來主要的研究成果,最后介紹了該任務(wù)常用的系統(tǒng)評價標準及目前所能達到的水平,討論了未來可能的研究方向。結(jié)果該任務(wù)的研究目前取得了很多成果,但仍處于實驗室階段,多系統(tǒng)融合策略導(dǎo)致系統(tǒng)龐大,而且目前還沒有好的進行索引的方法,導(dǎo)致檢測時間過長,對于低資源語音的關(guān)鍵詞檢測技術(shù),還有很多研究工作要做。結(jié)論期望通過對目前低資源語言的無監(jiān)督的關(guān)鍵詞檢測技術(shù)做出一個全面的綜述,從而給研究者的工作帶來便利。
[Abstract]:Objective in recent years, the unsupervised keyword detection technique in low-resource resource language has attracted wide research interest. Due to the lack of sufficient tagging data and related expert knowledge, low-resource language has attracted more and more attention in recent years. In recent years, the traditional keyword detection technology based on large vocabulary speech recognition system can not be used. Researchers are trying to find an unsupervised technique to detect speech keywords in low-resource languages. Then it introduces the mainstream algorithm framework based on dynamic time warping used in this technology, and introduces the main research results in recent years from several important aspects, such as feature representation, template matching method, efficiency improvement and so on. At last, it introduces the system evaluation standard and the level that can be achieved at present, and discusses the possible research direction in the future. Results the research on this task has made a lot of achievements at present, but it is still in the laboratory stage. The multi-system fusion strategy leads to the huge system, and there is no good indexing method, which leads to the detection time is too long, for low-resource voice keyword detection technology, Conclusion A comprehensive review of unsupervised keyword detection techniques in low-resource languages is expected to facilitate the work of researchers.
【作者單位】: 西北工業(yè)大學(xué)計算機學(xué)院陜西省語音與圖像信息處理重點實驗室;
【基金】:國家自然科學(xué)基金項目(61175018) 霍英東青年教師基礎(chǔ)研究基金項目(131059)
【分類號】:TN912.3
【參考文獻】
相關(guān)期刊論文 前1條
1 楊鵬;謝磊;陳虹潔;;基于分段動態(tài)時間規(guī)整和后驗特征的中文語音模式發(fā)現(xiàn)[J];清華大學(xué)學(xué)報(自然科學(xué)版);2013年06期
【共引文獻】
相關(guān)期刊論文 前2條
1 柯登峰;徐波;;互聯(lián)網(wǎng)時代語音識別基本問題[J];中國科學(xué):信息科學(xué);2013年12期
2 夏菽蘭;趙力;;基于狀態(tài)映射的跨語種自適應(yīng)研究[J];微電子學(xué)與計算機;2015年04期
相關(guān)博士學(xué)位論文 前3條
1 陳凌輝;說話人轉(zhuǎn)換建模方法研究[D];中國科學(xué)技術(shù)大學(xué);2013年
2 包葉波;基于深層神經(jīng)網(wǎng)絡(luò)的聲學(xué)特征提取及其在LVCSR系統(tǒng)中的應(yīng)用[D];中國科學(xué)技術(shù)大學(xué);2014年
3 齊耀輝;自然口語語音識別中的聲學(xué)建模研究[D];北京理工大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 李陽;基于自適應(yīng)算法與多項式回歸的抗噪語音識別技術(shù)[D];中國科學(xué)院深圳先進技術(shù)研究院;2013年
2 張羽;基于無關(guān)變量標準化的大詞匯量語音識別技術(shù)研究[D];上海交通大學(xué);2012年
3 夏咸軍;融合主觀評價與反饋的語音合成方法研究[D];中國科學(xué)技術(shù)大學(xué);2014年
4 孔德威;基于旅游領(lǐng)域的問句語音識別方法研究[D];昆明理工大學(xué);2014年
5 張旭;基于深度神經(jīng)網(wǎng)絡(luò)的語音識別研究[D];新疆大學(xué);2014年
6 和興敏;基于HMM算法的仿人機器人語音識別技術(shù)的研究[D];哈爾濱工業(yè)大學(xué);2013年
7 王慧勇;基于神經(jīng)網(wǎng)絡(luò)的多方言口音漢語語音識別系統(tǒng)研究[D];中國科學(xué)院深圳先進技術(shù)研究院;2014年
8 李睿;異常音頻事件檢測研究[D];北京郵電大學(xué);2014年
9 劉興永;基于隱馬爾科夫模型的鋼琴音符識別算法研究[D];天津大學(xué);2014年
10 鄭巖;一種聾人語音教學(xué)軟件設(shè)計[D];天津大學(xué);2014年
,本文編號:1639586
本文鏈接:http://sikaile.net/kejilunwen/wltx/1639586.html