基于條件隨機(jī)場的口語理解研究
本文關(guān)鍵詞:基于條件隨機(jī)場的口語理解研究
更多相關(guān)文章: 人機(jī)對話系統(tǒng) 條件隨機(jī)場 口語理解 詞嵌入
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,用戶對人機(jī)交互質(zhì)量和人機(jī)對話系統(tǒng)的性能需求隨之增加。在人機(jī)對話系統(tǒng)中需要利用到口語理解技術(shù),該技術(shù)的發(fā)展水平對人機(jī)對話系統(tǒng)的性能起著至關(guān)重要的作用,因而需要尋找到合適的口語理解方式,以便促進(jìn)人機(jī)對話系統(tǒng)的發(fā)展?谡Z理解過程涉及到自動(dòng)語音識別技術(shù),該技術(shù)在神經(jīng)網(wǎng)絡(luò)聲學(xué)模型的發(fā)展帶動(dòng)下取得了很大進(jìn)展。由于系統(tǒng)因素的影響,在自動(dòng)語音識別時(shí)也可能出現(xiàn)一些識別錯(cuò)誤問題,這些錯(cuò)誤可能會(huì)因?yàn)椴灰?guī)則口語的存在而更明顯。本文主要是對目前的口語理解問題進(jìn)行了研究,通過對這些問題的分析提出了基于條件隨機(jī)場模型的穩(wěn)健性口語理解方法。本文的主要工作及創(chuàng)新點(diǎn)如下:1.語音識別性能的不理想造成的識別錯(cuò)誤以及不符合文法的口語輸入往往造成口語理解性能下降。針對此問題,本文提出一種改進(jìn)口語理解穩(wěn)健性的方法。該方法通過在訓(xùn)練數(shù)據(jù)集中人工加入錯(cuò)誤文本噪聲進(jìn)行語料擴(kuò)充,送入條件隨機(jī)場口語理解模型進(jìn)行訓(xùn)練,用得到的模型對具有噪聲的未知數(shù)據(jù)集進(jìn)行口語理解。2.針對口語理解語句中詞與詞向量之間的關(guān)系對口語理解的性能所產(chǎn)生的影響,提出了一種基于詞嵌入的改進(jìn)口語理解方法。首先用word2vec對口語理解語句進(jìn)行詞嵌入處理,得到語句中所有詞的向量。通過計(jì)算詞向量之間的相似度,從而得到每個(gè)詞之間的相似度,再經(jīng)過聚類,得到一個(gè)初始模糊分類。然后將這個(gè)初始模糊分類作為一個(gè)特征,與其他的特征一起送入條件隨機(jī)場進(jìn)行口語理解訓(xùn)練,得到最終的分類結(jié)果。最后對所建立的模型在漢語交通查詢領(lǐng)域進(jìn)行實(shí)證。實(shí)驗(yàn)結(jié)果表明,本文建立的這種方法顯著優(yōu)于先前的基于規(guī)則的方法,此外相比數(shù)據(jù)驅(qū)動(dòng)算法而言,可以顯著降低開發(fā)成本,性能卻沒有受到影響。
【關(guān)鍵詞】:人機(jī)對話系統(tǒng) 條件隨機(jī)場 口語理解 詞嵌入
【學(xué)位授予單位】:新疆大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TN912.34
【目錄】:
- 摘要2-3
- Abstract3-7
- 第1章 緒論7-20
- 1.1 人機(jī)口語對話7-8
- 1.2 國內(nèi)外人機(jī)對話研究現(xiàn)狀8-9
- 1.3 口語理解9-18
- 1.3.1 口語理解方法10-18
- 1.4 論文的主要工作18-19
- 1.5 論文的組織結(jié)構(gòu)19-20
- 第2章 條件隨機(jī)場20-35
- 2.1 概率無向圖模型20-23
- 2.1.1 模型定義20-22
- 2.1.2 概率無向圖模型的因子分解22-23
- 2.2 條件隨機(jī)場的定義與形式23-26
- 2.2.1 條件隨機(jī)場的定義23-24
- 2.2.2 條件隨機(jī)場的參數(shù)化形式24-25
- 2.2.3 條件隨機(jī)場的簡化形式25-26
- 2.3 條件隨機(jī)場的概率計(jì)算問題26-28
- 2.3.1 前向-后向算法26-27
- 2.3.2 概率計(jì)算27
- 2.3.3 期望值的計(jì)算27-28
- 2.4 條件隨機(jī)場的學(xué)習(xí)算法28-32
- 2.4.1 改進(jìn)的迭代尺度法29-32
- 2.5 條件隨機(jī)場的預(yù)測算法32-34
- 2.6 本章小結(jié)34-35
- 第3章 基于條件隨機(jī)場的口語理解35-45
- 3.1 特征項(xiàng)選擇35-36
- 3.2 實(shí)驗(yàn)準(zhǔn)備36-41
- 3.2.1 實(shí)驗(yàn)所用的軟件工具36-37
- 3.2.2 實(shí)驗(yàn)語料庫37
- 3.2.3 文本預(yù)處理37
- 3.2.4 語料標(biāo)注37-38
- 3.2.5 特征模板選擇38-41
- 3.3 評估指標(biāo)41
- 3.4 穩(wěn)健性口語理解實(shí)驗(yàn)過程與結(jié)果分析41-44
- 3.4.1 無噪聲條件下的口語理解41-42
- 3.4.2 噪聲條件下的口語理解42-43
- 3.4.3 實(shí)驗(yàn)結(jié)果及分析43-44
- 3.5 本章小結(jié)44-45
- 第4章 基于詞嵌入的改進(jìn)口語理解45-52
- 4.1 基于詞嵌入的改進(jìn)口語理解系統(tǒng)框架45
- 4.2 詞嵌入45-47
- 4.3 K -means聚類算法47
- 4.4 實(shí)驗(yàn)結(jié)果及分析47-50
- 4.5 與其他統(tǒng)計(jì)方法的比較50
- 4.6 本章小結(jié)50-52
- 第5章 總結(jié)與展望52-53
- 5.1 論文總結(jié)52
- 5.2 展望52-53
- 參考文獻(xiàn)53-58
- 致謝58-59
- 攻讀碩士期間已發(fā)表或錄用的論文59-60
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 宗萍;施水才;王濤;呂學(xué)強(qiáng);;基于條件隨機(jī)場的英文地理行政實(shí)體識別[J];現(xiàn)代圖書情報(bào)技術(shù);2009年02期
2 張開旭;夏云慶;宇航;;基于條件隨機(jī)場的古漢語自動(dòng)斷句與標(biāo)點(diǎn)方法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年10期
3 成姣;蔡東風(fēng);季鐸;;基于條件隨機(jī)場的日語依存分析[J];沈陽航空工業(yè)學(xué)院學(xué)報(bào);2010年05期
4 李玲玲;金泰松;李翠華;;基于局部特征和隱條件隨機(jī)場的場景分類方法[J];北京理工大學(xué)學(xué)報(bào);2012年07期
5 寧偉;蔡東風(fēng);張桂平;季鐸;苗雪雷;;基于條件隨機(jī)場的冠詞選擇研究[J];中文信息學(xué)報(bào);2008年06期
6 張玉芳;莫凌琳;熊忠陽;耿曉斐;;基于條件隨機(jī)場的科研論文信息分層抽取[J];計(jì)算機(jī)應(yīng)用研究;2009年10期
7 王昌厚;;基于條件隨機(jī)場的中文命名體識別[J];福建電腦;2012年02期
8 施水才;王鍇;韓艷鏵;呂學(xué)強(qiáng);;基于條件隨機(jī)場的領(lǐng)域術(shù)語識別研究[J];計(jì)算機(jī)工程與應(yīng)用;2013年10期
9 王東波;陳小荷;年洪東;;基于條件隨機(jī)場的有標(biāo)記聯(lián)合結(jié)構(gòu)自動(dòng)識別[J];中文信息學(xué)報(bào);2008年06期
10 方瑩;;基于條件隨機(jī)場的英文農(nóng)產(chǎn)品名識別[J];河南科學(xué);2011年03期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前5條
1 王東波;陳小荷;年洪東;;基于條件隨機(jī)場的有標(biāo)記聯(lián)合結(jié)構(gòu)自動(dòng)識別[A];第四屆全國學(xué)生計(jì)算語言學(xué)研討會(huì)會(huì)議論文集[C];2008年
2 張奇;翁富良;黃萱菁;吳立德;;英文口語中非流利區(qū)域的檢測[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
3 魏瑋;杜金華;徐波;;基于分層語塊分析的統(tǒng)計(jì)翻譯研究[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
4 王根;趙軍;;基于多重冗余標(biāo)記CRF的句子情感分析研究[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
5 寧偉;蔡東風(fēng);季鐸;;基于條件隨機(jī)場的冠詞選擇研究[A];第四屆全國學(xué)生計(jì)算語言學(xué)研討會(huì)會(huì)議論文集[C];2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 熊英;中文自然語言理解中基于條件隨機(jī)場理論的詞法分析研究[D];上海交通大學(xué);2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 趙九洋;圖像中行人檢測關(guān)鍵技術(shù)研究[D];南京大學(xué);2015年
2 寧振;基于層疊條件隨機(jī)場的情感分析[D];南昌大學(xué);2015年
3 楊獻(xiàn)祥;面向中文微博的產(chǎn)品名實(shí)體識別與規(guī)范化算法設(shè)計(jì)與實(shí)現(xiàn)[D];北京理工大學(xué);2015年
4 肖s,
本文編號:1102191
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/1102191.html