GIS圖形系統(tǒng)中語音交互核心問題的研究
本文關(guān)鍵詞:GIS圖形系統(tǒng)中語音交互核心問題的研究
更多相關(guān)文章: 語音交互 語音識別 語言理解 GIS圖形系統(tǒng) 交互語義推理
【摘要】:人機交互是研究人與硬件環(huán)境及二者相互影響的領(lǐng)域,交互過程是人與硬件系統(tǒng)之間各種符號與動作的雙向信息交換。本質(zhì)上,是人類的操作行為,借助交互環(huán)境的硬件設(shè)施作用于系統(tǒng)數(shù)據(jù),完成目標(biāo)信息的輸入、轉(zhuǎn)換、加工和輸出,并獲得硬件系統(tǒng)的操作反饋的過程。隨著交互設(shè)計、人工智能的不斷發(fā)展,人機交互由傳統(tǒng)的鍵盤鼠標(biāo)交互模式發(fā)展到智能的、多通道、多媒體的交互方式。語音交互是智能交互的一種,即利用人類語言表達交互語義,系統(tǒng)識別操作者的聲音信息,完成音頻提取并翻譯,映射到相應(yīng)的功能響應(yīng)。語音交互是目前最接近于自然交互的方式之一。 GIS系統(tǒng)的現(xiàn)狀是功能強大但交互方式單一,造成了在某些環(huán)境下的交互不便利。擴展GIS交互方式不能生搬硬套其它系統(tǒng),應(yīng)充分研究分析GIS的交互特征,因地制宜。GIS的交互對象是空間數(shù)據(jù),交互操作是對空間數(shù)據(jù)的增、刪、改等加工處理和對GIS系統(tǒng)環(huán)境的控制,其交互語言語義明確,語法規(guī)則具有規(guī)律。本文圍繞著將語音交互引入到GIS圖形系統(tǒng)領(lǐng)域這一目的,開展以下研究工作: 1.語音交互模式 對語音交互領(lǐng)域的相對成熟的技術(shù)體系展開研究,探索交互模式,分析交互流程。重點剖析語音識別、語義理解和語音交互設(shè)計三項核心技術(shù)。 2.語音識別 研究語音識別理論,提取音頻識別模型,總結(jié)音頻處理的難點和解決方法。根據(jù)現(xiàn)有的語音識別技術(shù),確定一個有限詞匯量、特定人、孤立詞的語音識別方案;利用現(xiàn)有的技術(shù)實現(xiàn)語音識別的原型系統(tǒng)。 3.GIS圖形系統(tǒng)交互語言理解 將語言理解限定在GIS圖形系統(tǒng)領(lǐng)域內(nèi),,從典型的GIS圖形系統(tǒng)的功能反向分析交互語義,總結(jié)交互命令語言特征,并由交互語義制定GIS圖形系統(tǒng)的領(lǐng)域詞匯表。將領(lǐng)域詞匯分為名詞類型和動詞類型,分別利用概念從屬結(jié)構(gòu)和網(wǎng)絡(luò)結(jié)構(gòu)完成名詞知識與動詞知識的建模;由交互語言特征,總結(jié)出一個GIS圖形系統(tǒng)交互的基本語法——“名-動-名/形/副”,以此語法為基準(zhǔn),結(jié)合概念從屬理論,制定了語義推理的方法。采用鏈接文法,以文件的方式為系統(tǒng)的名詞概念知識和動詞概念知識建模,將推理出的語義映射系統(tǒng)的功能函數(shù),實現(xiàn)交互的系統(tǒng)響應(yīng)。最后,設(shè)計了一個原型系統(tǒng),測試GIS圖形系統(tǒng)的語音交互可行性。 論文的主要成果為:語音交互技術(shù)滿足GIS圖形系統(tǒng)交互的基本需求;論文提出的交互語言的概念知識能夠表達操作行為的概念語義和人的觀念;建立的語法與推理規(guī)則能正確推理交互語義,映射系統(tǒng)的功能。語音交互也將成為在不便于使用鍵盤鼠標(biāo)的交互環(huán)境(如外業(yè)調(diào)繪、野外數(shù)據(jù)采集)下的重要交互方式。
【關(guān)鍵詞】:語音交互 語音識別 語言理解 GIS圖形系統(tǒng) 交互語義推理
【學(xué)位授予單位】:長安大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:P208
【目錄】:
- 摘要4-6
- Abstract6-11
- 第一章 緒論11-21
- 1.1 研究背景和意義11-12
- 1.1.1 研究背景11-12
- 1.1.2 研究意義12
- 1.2 國內(nèi)外研究現(xiàn)狀綜述12-17
- 1.2.1 語音識別技術(shù)12-14
- 1.2.2 自然語言理解14-16
- 1.2.3 GIS 功能與操作16
- 1.2.4 綜述總結(jié)與分析16-17
- 1.3 研究目標(biāo)和研究內(nèi)容17-18
- 1.3.1 研究目標(biāo)17
- 1.3.2 研究內(nèi)容17-18
- 1.4 研究方法與技術(shù)路線18-19
- 1.4.1 研究方法18
- 1.4.2 技術(shù)路線18-19
- 1.5 論文結(jié)構(gòu)19-21
- 第二章 語音交互模式21-25
- 2.1 Siri 的交互模式21-22
- 2.2 Siri 的技術(shù)原理22-23
- 2.3 Siri 的交互設(shè)計23-24
- 2.4 本章小結(jié)24-25
- 第三章 語音識別理論與技術(shù)實現(xiàn)25-37
- 3.1 語音識別理論25-29
- 3.1.1 人類的語音識別模型25
- 3.1.2 計算機的語音識別模型25-27
- 3.1.3 語音識別的難點問題27-28
- 3.1.4 語音識別模式的選擇28-29
- 3.2 語音識別的技術(shù)實現(xiàn)29-36
- 3.2.1 基于 InterReco 的語音識別實現(xiàn)29-33
- 3.2.2 基于 SAPI 的語音識別實現(xiàn)33-35
- 3.2.3 兩種語音識別實現(xiàn)方式的比較35-36
- 3.3 本章小結(jié)36-37
- 第四章 語言理解37-43
- 4.1 自然語言理解的基本理論研究37-40
- 4.1.1 語法為主的分析37
- 4.1.2 語義為主的分析37-39
- 4.1.3 基于知識的分析39-40
- 4.2 漢語自然語言理解研究40-42
- 4.3 領(lǐng)域漢語言研究42
- 4.4 本章小結(jié)42-43
- 第五章 GIS 圖形系統(tǒng)交互語義理解43-63
- 5.1 GIS 圖形系統(tǒng)交互語言研究43-56
- 5.1.1 GIS 圖形系統(tǒng)的功能總結(jié)44-50
- 5.1.2 GIS 領(lǐng)域功能命令語言及特征總結(jié)50-53
- 5.1.3 GIS 圖形系統(tǒng)交互語言的基本語法與概念知識53-56
- 5.2 GIS 圖形系統(tǒng)交互語義推理56-62
- 5.2.1 推理方案的制定56-58
- 5.2.2 名詞知識建模與推理58-61
- 5.2.3 動詞知識建模與推理61-62
- 5.3 本章小結(jié)62-63
- 第六章 GIS 圖形系統(tǒng)的語音交互模塊實現(xiàn)63-70
- 6.1 GIS 圖形系統(tǒng)語音交互模塊總體設(shè)計63-64
- 6.2 語音交互知識庫64-66
- 6.3 重要的算法設(shè)計與實現(xiàn)66-69
- 6.3.1 系統(tǒng)的核心算法流程66-67
- 6.3.2 語音交互的 GIS 圖形原型系統(tǒng)67-69
- 6.4 本章小結(jié)69-70
- 結(jié)論與展望70-72
- 結(jié)論70
- 展望70-72
- 參考文獻72-75
- 致謝75
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 孫光民,董笑盈;基于神經(jīng)網(wǎng)絡(luò)的漢語孤立詞語音識別[J];北京工業(yè)大學(xué)學(xué)報;2002年03期
2 劉彬;董金明;;語音識別系統(tǒng)[J];電子測量技術(shù);2005年06期
3 袁保宗,阮秋琦,王延江,劉汝杰,唐曉芳;新一代(第四代)人機交互的概念框架特征及關(guān)鍵技術(shù)[J];電子學(xué)報;2003年S1期
4 魏世強,黃河燕,陳肇雄;文法理論評述[J];計算機工程與應(yīng)用;2003年01期
5 李禹材,左友東,鄭秀清,王玲;基于Speech SDK的語音控制應(yīng)用程序的設(shè)計與實現(xiàn)[J];計算機應(yīng)用;2004年06期
6 李曉霞,王東木,李雪耀;語音識別技術(shù)評述[J];計算機應(yīng)用研究;1999年10期
7 於家;吳健平;干嘉元;;基于GIS應(yīng)用軟件的交互設(shè)計方法研究[J];計算機應(yīng)用與軟件;2010年01期
8 李冠宇;;隱馬爾可夫模型及其在語音識別中的應(yīng)用[J];科技風(fēng);2011年23期
9 蔡蓮紅;崔丹丹;蔡銳;;漢語普通話語音合成語料庫TH-CoSS的建設(shè)和分析[J];中文信息學(xué)報;2007年02期
10 黃曾陽;HNC理論概要[J];中文信息學(xué)報;1997年04期
本文編號:515502
本文鏈接:http://sikaile.net/kejilunwen/dizhicehuilunwen/515502.html