基于web的普通話新聞檢索技術(shù)研究
發(fā)布時間:2018-03-26 18:25
本文選題:廣播電視新聞 切入點(diǎn):音頻樣例檢索 出處:《電子科技大學(xué)》2014年碩士論文
【摘要】:大數(shù)據(jù)時代背景下,如何快速準(zhǔn)確地從海量音頻庫中檢索感興趣的內(nèi)容已經(jīng)成為當(dāng)前亟待解決的問題。傳統(tǒng)的基于文本的音頻檢索并不能很好地解決這一問題,因而面向內(nèi)容的音頻信息檢索便受到了研究者們的廣泛關(guān)注。本研究針對普通話廣播電視新聞音頻數(shù)據(jù),探索了音頻信息檢索中的兩項(xiàng)技術(shù):基于樣例的普通話新聞檢索和基于大詞匯量連續(xù)語音識別(Large Vocabulary Continuous Speech Recognition,LVCSR)的普通話新聞檢索。這兩項(xiàng)技術(shù)雖然都是在新聞音頻庫中搜索與查詢請求相關(guān)的音頻片段,但前者的查詢請求是音頻樣例,而后者的則是關(guān)鍵詞或短語,它們分別對應(yīng)音頻樣例檢索和語音文檔檢索兩個研究方法。本研究的主要創(chuàng)新和貢獻(xiàn)包括以下幾個方面:1.基于樣例的普通話新聞檢索算法音頻樣例檢索中,高維特征向量的提取過程復(fù)雜且相似度計算量大,針對該問題,本研究探索并實(shí)現(xiàn)了基于語譜圖的音頻指紋提取算法。結(jié)合音頻指紋特征,提出了基于倒排索引的檢索算法,克服了順序索引方法在檢索時需要遍歷數(shù)據(jù)庫的難題,顯著地加快了檢索速度。同時,提出了基于語音活動檢測的改進(jìn)檢索算法,有效避免了查詢音頻過長給檢索速度帶來的負(fù)面影響。2.基于大詞匯量連續(xù)語音識別的普通話新聞檢索算法本研究首先提出了一種文本無關(guān)的新聞故事分割算法,與絕大多數(shù)在語音識別結(jié)果上實(shí)現(xiàn)新聞分割的算法不同,它直接在音頻流上進(jìn)行故事分割,并能取得較好的分割效果。其次,LVCSR系統(tǒng)將新聞故事音頻轉(zhuǎn)換為文本前,需要對音頻預(yù)處理,本文研究了LVCSR系統(tǒng)的前端處理算法。同時,為了充分利用說話人分割聚類中的話者信息,以此提高音頻分割的準(zhǔn)確度,引入了兩步新聞音頻分割算法。在音頻預(yù)處理的基礎(chǔ)上,搭建了一個面向普通話新聞音頻的LVCSR系統(tǒng)。最后,在檢索算法方面,實(shí)現(xiàn)了基于Lucene的全文檢索算法,并提出了基于詞向量的相關(guān)檢索詞推薦算法,利用該算法可以返回查詢關(guān)鍵詞或短語的相關(guān)搜索。3.普通話檢索系統(tǒng)的設(shè)計與實(shí)現(xiàn)基于上述算法的研究與改進(jìn),本文最終采用web界面設(shè)計并實(shí)現(xiàn)了一套普通話新聞檢索系統(tǒng)。該系統(tǒng)不僅可以高效地完成基于樣例和基于LVCSR的普通話新聞檢索,而且提供了友好的用戶交互,達(dá)到了實(shí)用化的程度。
[Abstract]:This paper proposes an improved retrieval algorithm based on speech activity detection .
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP393.09;TN912.34
【參考文獻(xiàn)】
相關(guān)博士學(xué)位論文 前1條
1 黃湘松;基于混淆網(wǎng)絡(luò)的漢語語音檢索技術(shù)研究[D];哈爾濱工程大學(xué);2010年
,本文編號:1669035
本文鏈接:http://sikaile.net/kejilunwen/wltx/1669035.html
最近更新
教材專著