天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

基于多示例學(xué)習(xí)的漢語(yǔ)口語(yǔ)語(yǔ)音中不流利事件檢測(cè)研究

發(fā)布時(shí)間:2021-02-24 18:17
  隨著互聯(lián)網(wǎng)的發(fā)展,人工智能越來(lái)越融入人們的工作生活中,人與機(jī)器的智能語(yǔ)音交互應(yīng)用更加廣泛,機(jī)器需要更好的理解人們各種情境環(huán)境下的語(yǔ)音,現(xiàn)階段主要包括流利的朗讀式語(yǔ)音、較短的命令式語(yǔ)音等,而在較長(zhǎng)的自然口語(yǔ)語(yǔ)音方面,智能語(yǔ)音識(shí)別還面臨很大的挑戰(zhàn)。本文主要是對(duì)漢語(yǔ)自然口語(yǔ)語(yǔ)音數(shù)據(jù)中不流利事件的檢測(cè)研究,可以看作語(yǔ)音識(shí)別任務(wù)的一個(gè)前端工作。不流利事件即自然口語(yǔ)中猶豫、填充停頓、重復(fù)等現(xiàn)象。它是語(yǔ)音中非正常語(yǔ)義的行為,對(duì)不流利事件的檢測(cè)研究屬于語(yǔ)音副語(yǔ)言研究范疇。在本文中,提取了能夠很好地表征不流利語(yǔ)音的特點(diǎn)的韻律學(xué)特征和譜相關(guān)特征,并且提出了多示例學(xué)習(xí)的模型以解決在不流利語(yǔ)音中,不流利事件持續(xù)時(shí)間短而噪聲信息過(guò)多的問(wèn)題,通過(guò)訓(xùn)練多示例學(xué)習(xí)模型對(duì)不流利事件進(jìn)行識(shí)別。論文的主要內(nèi)容有:(1)漢語(yǔ)自然口語(yǔ)不流利事件語(yǔ)料庫(kù)的構(gòu)建。本文從已有標(biāo)注的哈工大流媒體數(shù)據(jù)語(yǔ)料庫(kù)中提取我們需要的流利語(yǔ)音和不流利語(yǔ)音。本文依據(jù)該原始語(yǔ)料庫(kù)中的標(biāo)注文件,分析了不流利事件的標(biāo)注特點(diǎn),找到不流利事件的標(biāo)注規(guī)則,然后依據(jù)此規(guī)則找到了自動(dòng)檢測(cè)不流利事件的有效方法,自動(dòng)切割不流利語(yǔ)音,然后通過(guò)人工復(fù)檢自動(dòng)切割的語(yǔ)料,完成了漢... 

【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁(yè)數(shù)】:64 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于多示例學(xué)習(xí)的漢語(yǔ)口語(yǔ)語(yǔ)音中不流利事件檢測(cè)研究


圖1-1分子形狀的射線表示

波形,方框,語(yǔ)料,波形圖


哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文整的一句話,不含有話與話之間的靜音片段。這樣的切割雖然在訓(xùn)練分類時(shí)高了處理難度,但是會(huì)提高語(yǔ)料的精確度,提高識(shí)別結(jié)果的準(zhǔn)確度。對(duì)于不同類型的語(yǔ)音具體的標(biāo)注特點(diǎn)如下:1、填充停頓類型的語(yǔ)料:對(duì)于大多數(shù)含有猶豫現(xiàn)象的不流利語(yǔ)料都有填充詞的存在,填充詞指的“嗯”“呃”等語(yǔ)氣詞。我們需要從原有語(yǔ)料的標(biāo)注中找到這樣的句子,然找到對(duì)應(yīng)的音頻進(jìn)行切割。

波形,語(yǔ)料,波形圖,方框


哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文(4) 判斷句子是否符合長(zhǎng)度(在 4s-15s 之間,一般為 10s 左右);(5) 若符合上述規(guī)則,找到音頻文件進(jìn)行切割。2、對(duì)于重復(fù)的語(yǔ)料的切割:重復(fù)類型,顧名思義就是在語(yǔ)音中出現(xiàn)一些字或詞語(yǔ)的多余的重復(fù),他與正常語(yǔ)句中的疊詞類型是不一樣的,需要區(qū)分開。重復(fù)類型語(yǔ)料波形圖如圖 22 所示。

【參考文獻(xiàn)】:
期刊論文
[1]多示例學(xué)習(xí)問(wèn)題研究進(jìn)展綜述[J]. 田英杰,胥棟寬,張春華.  運(yùn)籌學(xué)學(xué)報(bào). 2018(02)
[2]大規(guī)模語(yǔ)音語(yǔ)料庫(kù)的采集、處理和研究[J]. 袁家宏.  語(yǔ)言學(xué)研究. 2017(01)
[3]圖像語(yǔ)義分析的多示例學(xué)習(xí)算法綜述[J]. 李大湘,趙小強(qiáng),李娜.  控制與決策. 2013(04)
[4]基于免疫RBF神經(jīng)網(wǎng)絡(luò)的語(yǔ)音情感識(shí)別[J]. 鄧廣慧,荊東星,葉吉祥.  計(jì)算機(jī)工程與科學(xué). 2009(09)
[5]一種基于脈沖耦合神經(jīng)網(wǎng)絡(luò)的語(yǔ)音情感識(shí)別新方法[J]. 梁澤,馬義德,張恩溯,朱望飛,湯書森.  計(jì)算機(jī)應(yīng)用. 2008(03)
[6]基于神經(jīng)網(wǎng)絡(luò)的多示例回歸算法[J]. 張敏靈,周志華.  軟件學(xué)報(bào). 2003(07)
[7]自然口語(yǔ)語(yǔ)音識(shí)別研究概況[J]. 馮俊蘭,杜利民.  電子科技導(dǎo)報(bào). 1999(09)
[8]漢語(yǔ)口語(yǔ)語(yǔ)料庫(kù)研究的若干問(wèn)題[J]. 王顯芳,杜利民.  電子科技導(dǎo)報(bào). 1999(09)

碩士論文
[1]基于多示例學(xué)習(xí)的異常行為檢測(cè)方法研究[D]. 崔永艷.南京大學(xué) 2011



本文編號(hào):3049764

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3049764.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cdfcc***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com