面向語(yǔ)義網(wǎng)的自然語(yǔ)言查詢接口研究
本文關(guān)鍵詞:面向語(yǔ)義網(wǎng)的自然語(yǔ)言查詢接口研究,由筆耕文化傳播整理發(fā)布。
【摘要】:目前,互聯(lián)網(wǎng)上的數(shù)據(jù)呈爆炸式增長(zhǎng)態(tài)勢(shì),海量的數(shù)據(jù)對(duì)數(shù)據(jù)存儲(chǔ)和信息獲取帶來(lái)了前所未有的挑戰(zhàn)。語(yǔ)義網(wǎng)被認(rèn)為是下一代互聯(lián)網(wǎng)的存儲(chǔ)方式。以語(yǔ)義網(wǎng)形式描述的數(shù)據(jù)不僅可以被人們理解,而且可以被計(jì)算機(jī)所理解。數(shù)據(jù)在語(yǔ)義網(wǎng)中是互相鏈接的,彼此之間被語(yǔ)義標(biāo)簽鏈接起來(lái),形成一個(gè)巨大的語(yǔ)義網(wǎng)絡(luò),F(xiàn)在,越來(lái)越多的數(shù)據(jù)以語(yǔ)義網(wǎng)的形式發(fā)布出來(lái),但是對(duì)于普通用戶而言,從語(yǔ)義網(wǎng)中獲取信息的難度遠(yuǎn)超過(guò)目前的搜索引擎。語(yǔ)義網(wǎng)目前僅支持形式化查詢,,而且只有對(duì)語(yǔ)義網(wǎng)本體熟悉的專業(yè)人員才能夠編寫正確的形式化查詢。對(duì)于普通用戶而言,自然語(yǔ)言形式的查詢是最便捷、最易接受的查詢方式。自然語(yǔ)言查詢接口作為一個(gè)連接自然語(yǔ)言查詢和語(yǔ)義網(wǎng)形式化查詢之間的橋梁,具有重要的研究?jī)r(jià)值和實(shí)用價(jià)值。 如何有效的將用戶的自然查詢問(wèn)句轉(zhuǎn)化為能夠查詢語(yǔ)義網(wǎng)的形式化查詢語(yǔ)言是本文的主要研究?jī)?nèi)容。本文針對(duì)這一問(wèn)題研究了英文和中文兩種語(yǔ)言上的自然語(yǔ)言查詢接口任務(wù)。本文主要貢獻(xiàn)如下: 首先,在對(duì)查詢的形式進(jìn)行充分分析之后,發(fā)現(xiàn)問(wèn)題的形式具有鏈?zhǔn)揭?guī)則,即查詢中匹配的資源只與其前后資源存在聯(lián)系,因此,本文根據(jù)這一假設(shè),提出了一種基于資源補(bǔ)全搜索的自然語(yǔ)言查詢接口方法。該方法在形式固定、語(yǔ)法簡(jiǎn)單的問(wèn)題上取得了較好的實(shí)驗(yàn)結(jié)果。 其次,在對(duì)資源補(bǔ)全搜索方法的實(shí)驗(yàn)結(jié)果分析之后,我們發(fā)現(xiàn)資源補(bǔ)全搜索算法不能處理語(yǔ)法復(fù)雜的問(wèn)題,且沒有考慮查詢中的語(yǔ)義信息。因此,我們提出了一種基于依存圖的自然語(yǔ)言查詢接口算法,旨在充分利用查詢中的語(yǔ)義信息來(lái)指導(dǎo)形式化查詢的生成。該方法的性能在美國(guó)地理數(shù)據(jù)集上較資源補(bǔ)全搜索方法有較大的提升。為了測(cè)試基于依存圖的自然語(yǔ)言查詢接口算法對(duì)不同語(yǔ)言環(huán)境的適應(yīng)能力,我們?cè)谥形臄?shù)據(jù)集上又進(jìn)行了實(shí)驗(yàn)。分析結(jié)果得出,基于依存圖的算法在英文上的效果要優(yōu)于中文上的效果。 實(shí)驗(yàn)表明,基于依存圖的方法在自然語(yǔ)言查詢到語(yǔ)義網(wǎng)形式化查詢的轉(zhuǎn)換的任務(wù)上取得了很好的效果,同時(shí),證明了自然語(yǔ)言查詢接口能夠有效的完成搜索語(yǔ)義網(wǎng)信息的任務(wù)。
【關(guān)鍵詞】:語(yǔ)義網(wǎng) 自然語(yǔ)言查詢接口 資源補(bǔ)全 路徑搜索 依存圖
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP391.1
【目錄】:
- 摘要4-6
- Abstract6-8
- 目錄8-11
- 第1章 緒論11-22
- 1.1 課題背景及研究目的和意義11-13
- 1.1.1 課題背景11-12
- 1.1.2 課題研究的目的及意義12-13
- 1.2 語(yǔ)義網(wǎng)簡(jiǎn)介13-17
- 1.2.1 語(yǔ)義網(wǎng)的定義13-14
- 1.2.2 語(yǔ)義網(wǎng)的現(xiàn)狀14
- 1.2.3 語(yǔ)義網(wǎng)的相關(guān)概念14-17
- 1.3 國(guó)內(nèi)外研究現(xiàn)狀17-20
- 1.4 本文的研究?jī)?nèi)容及章節(jié)安排20-22
- 第2章 基于資源補(bǔ)全搜索算法的自然語(yǔ)言查詢接口22-45
- 2.1 引言22
- 2.2 語(yǔ)義網(wǎng)的構(gòu)建22-26
- 2.2.1 語(yǔ)義網(wǎng)構(gòu)建原則23
- 2.2.2 語(yǔ)義網(wǎng)的數(shù)據(jù)來(lái)源23-24
- 2.2.3 語(yǔ)義網(wǎng)的構(gòu)建方法24-26
- 2.3 基本假設(shè)26
- 2.4 基于資源補(bǔ)全搜索算法26-41
- 2.4.1 系統(tǒng)架構(gòu)26-27
- 2.4.2 領(lǐng)域知識(shí)自動(dòng)抽取27-30
- 2.4.3 問(wèn)題分析器30-31
- 2.4.4 核心處理流程31-38
- 2.4.5 SPARQL查詢生成38-41
- 2.4.6 SPARQL執(zhí)行41
- 2.5 實(shí)驗(yàn)與分析41-44
- 2.5.1 實(shí)驗(yàn)數(shù)據(jù)41-42
- 2.5.2 評(píng)價(jià)方法42-43
- 2.5.3 實(shí)驗(yàn)結(jié)果43
- 2.5.4 實(shí)驗(yàn)結(jié)果分析43-44
- 2.6 本章小結(jié)44-45
- 第3章 基于依存圖的自然語(yǔ)言查詢接口45-57
- 3.1 引言45
- 3.2 系統(tǒng)架構(gòu)45-46
- 3.3 問(wèn)題預(yù)處理46
- 3.4 核心處理模塊46-51
- 3.4.1 依存句法分析47
- 3.4.2 構(gòu)建依存圖47-48
- 3.4.3 查詢與語(yǔ)義網(wǎng)本體匹配48-49
- 3.4.4 構(gòu)建語(yǔ)義查詢圖49-50
- 3.4.5 語(yǔ)義查詢圖路徑搜索50-51
- 3.5 SPARQL生成51-54
- 3.5.1 COUNT語(yǔ)句生成52
- 3.5.2 MAX和MIN語(yǔ)句生成52-53
- 3.5.3 NEGATIVE語(yǔ)句生成53-54
- 3.6 實(shí)驗(yàn)與分析54-56
- 3.6.1 實(shí)驗(yàn)數(shù)據(jù)54
- 3.6.2 評(píng)價(jià)指標(biāo)54-55
- 3.6.3 實(shí)驗(yàn)結(jié)果55
- 3.6.4 實(shí)驗(yàn)結(jié)果分析55-56
- 3.7 本章小結(jié)56-57
- 第4章 面向八維音樂(lè)論壇的自然語(yǔ)言查詢接口應(yīng)用57-66
- 4.1 引言57
- 4.2 八維音樂(lè)語(yǔ)義網(wǎng)本體構(gòu)建57-59
- 4.3 系統(tǒng)架構(gòu)59
- 4.4 基于依存圖方法的查詢處理流程59-62
- 4.4.1 問(wèn)題預(yù)處理59-60
- 4.4.2 本體詞典提取60
- 4.4.3 正向最大匹配60-61
- 4.4.4 分詞模塊61-62
- 4.5 實(shí)驗(yàn)與分析62-63
- 4.5.1 實(shí)驗(yàn)數(shù)據(jù)62
- 4.5.2 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)62
- 4.5.3 實(shí)驗(yàn)結(jié)果62-63
- 4.5.4 實(shí)驗(yàn)結(jié)果分析63
- 4.6 語(yǔ)義網(wǎng)本體問(wèn)答系統(tǒng)63-65
- 4.6.1 SemOntoQA系統(tǒng)架構(gòu)64
- 4.6.2 SemOntoQA系統(tǒng)演示64-65
- 4.7 本章小結(jié)65-66
- 結(jié)論66-68
- 參考文獻(xiàn)68-72
- 致謝72
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 王亞章;語(yǔ)義網(wǎng),下一代互聯(lián)網(wǎng)的神經(jīng)[J];中國(guó)計(jì)算機(jī)用戶;2003年07期
2 韋華;;語(yǔ)義網(wǎng)絡(luò)助推互聯(lián)網(wǎng)[J];微電腦世界;2006年08期
3 陳衛(wèi)紅;朱佳鳴;;語(yǔ)義網(wǎng)的研究及其在生物醫(yī)學(xué)中的應(yīng)用[J];醫(yī)學(xué)信息;2007年07期
4 張東偉;趙津津;李鵬;;基于語(yǔ)義網(wǎng)的知識(shí)管理研究[J];計(jì)算機(jī)與信息技術(shù);2008年03期
5 趙宏偉;張海龍;臧雪柏;;表象式語(yǔ)義網(wǎng)絡(luò)研究[J];北京工業(yè)大學(xué)學(xué)報(bào);2009年08期
6 朱成兵;;語(yǔ)義網(wǎng)理論研究[J];赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版);2010年04期
7 陳曉鵬;仝允桓;;基于語(yǔ)義網(wǎng)的技術(shù)監(jiān)測(cè)方法研究[J];科學(xué)學(xué)研究;2010年06期
8 張同玲;多杰卓瑪;;藻飾詞語(yǔ)義網(wǎng)絡(luò)的構(gòu)建研究[J];電腦開發(fā)與應(yīng)用;2011年07期
9 任會(huì)啟;;語(yǔ)義網(wǎng)絡(luò)的建構(gòu)[J];北方文學(xué)(下半月);2011年04期
10 楊卓群;王以松;;語(yǔ)義網(wǎng)及其應(yīng)用[J];貴州大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年05期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前3條
1 唐璐;張永光;付雪;;語(yǔ)義網(wǎng)絡(luò)的結(jié)構(gòu):我們?cè)鯓訉W(xué)習(xí)語(yǔ)義知識(shí)(英文)[A];全國(guó)語(yǔ)域web與本體能研討會(huì)論文集[C];2006年
2 張旭潔;夏幼明;劉冠曉;宋亞林;;基于規(guī)則方法的漢語(yǔ)到語(yǔ)義網(wǎng)絡(luò)語(yǔ)言的轉(zhuǎn)換研究[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
3 李家治;;記憶、思維和語(yǔ)言—機(jī)器理解漢語(yǔ)中的問(wèn)題[A];中國(guó)心理學(xué)會(huì)第三次會(huì)員代表大會(huì)及建會(huì)60周年學(xué)術(shù)會(huì)議(全國(guó)第四屆心理學(xué)學(xué)術(shù)會(huì)議)文摘選集(下)[C];1981年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前2條
1 北京 高守;互聯(lián)網(wǎng)之父鐘情語(yǔ)義網(wǎng)[N];電腦報(bào);2002年
2 華新;你要的是哪個(gè)蘋果?語(yǔ)義智能搜索時(shí)代來(lái)臨[N];經(jīng)理日?qǐng)?bào);2007年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 代印唐;基于語(yǔ)義網(wǎng)絡(luò)的知識(shí)協(xié)作關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2009年
2 史斌;面向語(yǔ)義網(wǎng)的語(yǔ)義搜索引擎關(guān)鍵技術(shù)研究[D];北京工業(yè)大學(xué);2010年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 任彬;一種特定領(lǐng)域的語(yǔ)義網(wǎng)模型[D];吉林大學(xué);2004年
2 康樹鵬;面向語(yǔ)義網(wǎng)的自然語(yǔ)言查詢接口研究[D];哈爾濱工業(yè)大學(xué);2014年
3 張敏;基于語(yǔ)義網(wǎng)的學(xué)術(shù)論文檢索的研究與實(shí)現(xiàn)[D];沈陽(yáng)工業(yè)大學(xué);2011年
4 杜鵑;面向長(zhǎng)春市地理信息系統(tǒng)的語(yǔ)義網(wǎng)模型研究[D];吉林大學(xué);2005年
5 馬曉峰;基于語(yǔ)義網(wǎng)絡(luò)的病理診斷案例表示及不確定性研究[D];合肥工業(yè)大學(xué);2006年
6 張海龍;表象式語(yǔ)義網(wǎng)絡(luò)研究[D];吉林大學(xué);2007年
7 張紅;語(yǔ)義網(wǎng)中的本體推理及其應(yīng)用研究[D];吉林大學(xué);2004年
8 徐淑麗;基于語(yǔ)義網(wǎng)的移動(dòng)學(xué)習(xí)系統(tǒng)建模與查詢方法的研究[D];河南大學(xué);2013年
9 林斐斐;基于語(yǔ)義網(wǎng)的信息分析平臺(tái)[D];汕頭大學(xué);2008年
10 周凱濤;語(yǔ)義網(wǎng)中航運(yùn)信息的存儲(chǔ)與查詢系統(tǒng)研究[D];大連海事大學(xué);2011年
本文關(guān)鍵詞:面向語(yǔ)義網(wǎng)的自然語(yǔ)言查詢接口研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):376438
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/376438.html