天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

關(guān)系數(shù)據(jù)庫關(guān)鍵字語義近似查詢方法研究

發(fā)布時間:2017-09-15 15:10

  本文關(guān)鍵詞:關(guān)系數(shù)據(jù)庫關(guān)鍵字語義近似查詢方法研究


  更多相關(guān)文章: 檢索 耦合關(guān)系分析 Top-k推薦 查詢重構(gòu) 近似查詢


【摘要】:隨著互聯(lián)網(wǎng)的普遍應(yīng)用和網(wǎng)絡(luò)數(shù)據(jù)的急劇膨脹,數(shù)據(jù)庫在線關(guān)鍵字檢索方式已經(jīng)成為人們網(wǎng)上查閱和搜索信息的主要手段。然而面臨當(dāng)今數(shù)據(jù)組織形式和結(jié)構(gòu)的各異性,研究者已經(jīng)指出了需要采取不同的數(shù)據(jù)建模形式(如關(guān)系、層次、面向?qū)ο蟮、網(wǎng)狀、半結(jié)構(gòu)化模型等),進而也引起了大量新穎的數(shù)據(jù)管理技術(shù)的不斷發(fā)展(如對于XML數(shù)據(jù)、數(shù)據(jù)流的處理、網(wǎng)絡(luò)數(shù)據(jù)的集成、數(shù)據(jù)分析及挖掘等)。關(guān)系型數(shù)據(jù)庫因其數(shù)據(jù)結(jié)構(gòu)簡單、清晰,且具有較高的獨立性和安全保密性,已成為應(yīng)用最廣泛的通用型數(shù)據(jù)庫,且作為Deep Web的重要組成部分,因此關(guān)系數(shù)據(jù)庫檢索技術(shù)應(yīng)具有更高的用戶友好性和通用性。數(shù)據(jù)庫管理系統(tǒng)提供復(fù)雜的工具,可使專業(yè)用戶使用SQL語言進行結(jié)構(gòu)化查詢,但對于大多數(shù)普通用戶來講,像谷歌、雅虎等搜索引擎那樣通過提交幾個關(guān)鍵字就能檢索到相關(guān)信息的關(guān)鍵字查詢方式,更容易被其接受和使用。然而由于非專業(yè)用戶的表達查詢意圖的方式和檢索時所關(guān)注的差異、以及對相關(guān)數(shù)據(jù)庫存儲內(nèi)容了解的有限,導(dǎo)致許多數(shù)據(jù)庫信息無法被獲取,用戶的滿意程度下降,且進行試探性檢索的次數(shù)會隨之增加。因此針對檢索的方式、手段和技術(shù)需要不斷完善,使其能夠?qū)εc查詢關(guān)鍵字語義相關(guān)(但不是明確給出的關(guān)鍵字)的內(nèi)容給出查詢結(jié)果,提高查詢的準(zhǔn)確性,以便更好地向人們提供簡單、可依賴的信息獲取服務(wù)。本文首先提出一種評估數(shù)據(jù)庫中所有存儲的數(shù)據(jù)與用戶給定查詢條件的關(guān)鍵字之間的語義相關(guān)性,即分析詞條之間耦合關(guān)系的方法TCR(Term Coupling Relationships)。根據(jù)TCR評估用戶初始條件中的關(guān)鍵字與數(shù)據(jù)庫中全部數(shù)據(jù)的耦合關(guān)系(包括內(nèi)耦合與外耦合兩部分),并生成相關(guān)性大小的順序列。然后利用排名機制將數(shù)據(jù)庫中Top-k排名結(jié)果作為候選關(guān)鍵字推薦給用戶,最后通過用戶重構(gòu)最貼近自己意圖的條件提供給檢索系統(tǒng)進行再查詢。其中查詢重構(gòu)系統(tǒng)選取基于候選網(wǎng)的DISCOVER系統(tǒng)進行再查詢處理,即將TCR方法集成到傳統(tǒng)的精確查詢系統(tǒng)中。嵌入TCR方法的檢索系統(tǒng),能夠使缺乏相關(guān)經(jīng)驗的用戶根據(jù)系統(tǒng)分析初始條件并推薦出相關(guān)性高的關(guān)鍵字,使用戶能夠重構(gòu)符合自己需求的查詢條件,在某種意義上實現(xiàn)了對初始目的的近似查詢。并且讓用戶自己主觀的重新構(gòu)建和選擇關(guān)鍵字,使檢索更加人性化,更能滿足用戶的真實想法。同時結(jié)合了精確匹配的優(yōu)勢,使檢索效率及用戶滿意程度達到較高的要求。實驗采用DBLP、Movie Lens和IMDB數(shù)據(jù)集,應(yīng)用TCR算法在關(guān)鍵字與數(shù)據(jù)庫中的信息進行耦合關(guān)系分析,證明了參數(shù)α對不同數(shù)據(jù)庫的不同影響。并用Top-k推薦算法返回推薦關(guān)鍵字。近而在DISCOVER系統(tǒng)上實現(xiàn)關(guān)鍵字的最終查詢。
【關(guān)鍵詞】:檢索 耦合關(guān)系分析 Top-k推薦 查詢重構(gòu) 近似查詢
【學(xué)位授予單位】:遼寧工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1;TP311.13
【目錄】:
  • 摘要5-6
  • Abstract6-10
  • 1 緒論10-16
  • 1.1 研究背景及發(fā)展現(xiàn)狀10-12
  • 1.2 課題研究目的及意義12-13
  • 1.3 主要研究內(nèi)容13-15
  • 1.4 論文的組織結(jié)構(gòu)15-16
  • 2 關(guān)鍵字查詢相關(guān)理論基礎(chǔ)16-24
  • 2.1 查詢模式16-21
  • 2.1.1 基于模式圖的關(guān)鍵字查詢18-20
  • 2.1.2 基于數(shù)據(jù)圖的查詢方法20-21
  • 2.2 近似查詢21-23
  • 2.2.1 建模形式的擴展22
  • 2.2.2 模糊查詢22
  • 2.2.3 語義分析及應(yīng)用22-23
  • 2.3 本章小結(jié)23-24
  • 3 耦合關(guān)系分析及Top-k推薦策略24-33
  • 3.1 問題定義24
  • 3.2 數(shù)據(jù)預(yù)處理24-26
  • 3.2.1 詞條關(guān)系圖25-26
  • 3.2.2 數(shù)據(jù)視圖26
  • 3.3 耦合關(guān)系分析26-30
  • 3.3.1 節(jié)點權(quán)重及計算26-28
  • 3.3.2 內(nèi)耦合關(guān)系28-29
  • 3.3.3 間耦合關(guān)系29-30
  • 3.4 Top-k推薦策略30-32
  • 3.4.1 Top-k的實現(xiàn)30-31
  • 3.4.2 TA閾值算法31-32
  • 3.5 本章小結(jié)32-33
  • 4 近似查詢系統(tǒng)的實現(xiàn)33-48
  • 4.1 引言33
  • 4.2 傳統(tǒng)DISCOVER系統(tǒng)簡介33-36
  • 4.2.1 數(shù)據(jù)模型及相關(guān)定義34-35
  • 4.2.2 DISCOVER系統(tǒng)的實現(xiàn)35-36
  • 4.3 近似查詢系統(tǒng)的體系結(jié)構(gòu)36-39
  • 4.3.1 DISCOVER的改進36-37
  • 4.3.2 近似查詢系統(tǒng)的實現(xiàn)37-39
  • 4.4 近似查詢系統(tǒng)的查詢處理39-47
  • 4.4.1 候選網(wǎng)的生成39-44
  • 4.4.2 候選網(wǎng)的評估44-47
  • 4.5 本章小結(jié)47-48
  • 5 實驗設(shè)計及對比分析48-58
  • 5.1 耦合關(guān)系分析下Top-k推薦性能測試48-51
  • 5.1.1 實驗設(shè)置48
  • 5.1.2 評估TCR算法的精確度48-50
  • 5.1.3 TCR算法性能50-51
  • 5.2 基于候選網(wǎng)的DISCOVER性能測評51-55
  • 5.2.1 實驗設(shè)置51
  • 5.2.2 候選網(wǎng)生成器的評估51-52
  • 5.2.3 貪婪算法的性能52-53
  • 5.2.4 對計劃生成器的評估53-54
  • 5.2.5 執(zhí)行時間54-55
  • 5.3 近似查詢系統(tǒng)的性能測評55-57
  • 5.3.1 實驗環(huán)境及參數(shù)設(shè)置55
  • 5.3.2 查詢重構(gòu)對結(jié)果滿意度的提升55-56
  • 5.3.3 系統(tǒng)執(zhí)行時間56-57
  • 5.4 本章小結(jié)57-58
  • 6 結(jié)論和未來工作58-59
  • 參考文獻59-62
  • 攻讀碩士期間發(fā)表學(xué)術(shù)論文情況62-63
  • 致謝63

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 趙雪;;試論信息數(shù)據(jù)庫的管理對策[J];計算機光盤軟件與應(yīng)用;2013年08期

2 周亦妹;;企業(yè)數(shù)據(jù)庫管理問題淺析[J];計算機光盤軟件與應(yīng)用;2013年17期

3 朱和男;“修路,,還要養(yǎng)路”──注重數(shù)據(jù)庫的更新與維護[J];工商行政管理;1996年13期

4 陳云卿;關(guān)于數(shù)據(jù)庫管理的優(yōu)化[J];管理科學(xué)文摘;1998年08期

5 ;用PLATINUM ProVision增強9種系統(tǒng)與數(shù)據(jù)庫管理工具[J];信息系統(tǒng)工程;1998年01期

6 林瓊英;;走進魅力數(shù)據(jù)庫[J];中國信息技術(shù)教育;2008年06期

7 袁知貴,林焰,紀(jì)卓尚;船體零部件數(shù)據(jù)庫管理[J];大連理工大學(xué)學(xué)報;2000年06期

8 ;2000年全國數(shù)據(jù)庫學(xué)術(shù)會議征文通知[J];軟件學(xué)報;2000年01期

9 ;2000年全國數(shù)據(jù)庫學(xué)術(shù)會議征文通知[J];軟件學(xué)報;2000年02期

10 ;2001年第18屆全國數(shù)據(jù)庫學(xué)術(shù)會議征文通知[J];計算機研究與發(fā)展;2001年05期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 邱大年;閻承沛;左演聲;;第八章 熱處理數(shù)據(jù)庫[A];中國電子學(xué)會生產(chǎn)技術(shù)學(xué)會第四屆金屬材料及熱處理年會論文集(增)[C];1991年

2 陸洪毅;王志英;趙龍;;高性能數(shù)據(jù)庫的應(yīng)用支持[A];第十六屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1999年

3 ;前言[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2000年

4 ;前言[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2001年

5 ;前言[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2001年

6 韓英;馬玉紅;;基于數(shù)據(jù)庫的檔案資料管理軟件[A];2010全國非金屬礦產(chǎn)資源與勘察技術(shù)交流會論文專輯[C];2010年

7 顧少偉;成旭東;唐志軍;徐學(xué)良;;板坯質(zhì)量數(shù)據(jù)庫的建立與應(yīng)用[A];河北省2010年煉鋼—連鑄—軋鋼生產(chǎn)技術(shù)與學(xué)術(shù)交流會論文集(上)[C];2010年

8 顧少偉;成旭東;唐志軍;徐學(xué)良;;板坯質(zhì)量數(shù)據(jù)庫的建立與應(yīng)用[A];第十六屆全國煉鋼學(xué)術(shù)會議論文集[C];2010年

9 周俊菊;李艷梅;;中國北方干旱化數(shù)據(jù)庫的建立及其基本問題探討[A];地理教育與學(xué)科發(fā)展——中國地理學(xué)會2002年學(xué)術(shù)年會論文摘要集[C];2002年

10 張學(xué)軍;房生凱;;新型數(shù)據(jù)庫管理預(yù)測系統(tǒng)[A];新世紀(jì) 新機遇 新挑戰(zhàn)——知識創(chuàng)新和高新技術(shù)產(chǎn)業(yè)發(fā)展(上冊)[C];2001年

中國重要報紙全文數(shù)據(jù)庫 前10條

1 韓敏;我市部署人事人才數(shù)據(jù)庫管理工作[N];鄂爾多斯日報;2008年

2 金振蓉;應(yīng)本著求真務(wù)實精神發(fā)展國產(chǎn)數(shù)據(jù)庫[N];光明日報;2004年

3 ;下一代數(shù)據(jù)庫六大特點[N];中國計算機報;2005年

4 周健邋芯語;中小型組織的數(shù)據(jù)庫[N];計算機世界;2007年

5 ;數(shù)據(jù)庫歸檔浮出水面[N];網(wǎng)絡(luò)世界;2006年

6 本報記者 黃嶸;中期協(xié)行業(yè)信息數(shù)據(jù)庫管理有新規(guī)[N];上海證券報;2007年

7 謝春穎;數(shù)據(jù)庫“經(jīng)理人”的職能[N];網(wǎng)絡(luò)世界;2002年

8 本報記者 許泳;數(shù)據(jù)庫更換為哪般?[N];計算機世界;2011年

9 本報記者 那罡;數(shù)據(jù)庫遭受“夾板氣”[N];中國計算機報;2010年

10 本報見習(xí)記者 王勤;數(shù)字印刷方式下的數(shù)據(jù)庫管理[N];中國新聞出版報;2011年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 張宇賓;脊椎動物進化分支共調(diào)控基因數(shù)據(jù)庫LCGbase研究與實現(xiàn)[D];中國科學(xué)院北京基因組研究所;2013年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 方明;在PostgreSQL數(shù)據(jù)庫單表上實現(xiàn)多級安全等級控制[D];復(fù)旦大學(xué);2013年

2 李俊煒;基于Oracle數(shù)據(jù)庫低效語句監(jiān)控方法的研究與應(yīng)用[D];上海交通大學(xué);2014年

3 黃曉嫦;基于移動設(shè)備的網(wǎng)絡(luò)教學(xué)系統(tǒng)設(shè)計與實現(xiàn)[D];電子科技大學(xué);2014年

4 王蒙蒙;基于SQL Server數(shù)據(jù)庫持續(xù)數(shù)據(jù)保護系統(tǒng)的研究與設(shè)計[D];華北電力大學(xué);2015年

5 劉穎;基于SDN的數(shù)據(jù)庫型防火墻研究與實現(xiàn)[D];華東理工大學(xué);2015年

6 崔婉秋;關(guān)系數(shù)據(jù)庫關(guān)鍵字語義近似查詢方法研究[D];遼寧工業(yè)大學(xué);2016年

7 王鵬;論數(shù)據(jù)庫權(quán)利的法律保護[D];河南大學(xué);2009年

8 許斌;數(shù)據(jù)庫通知服務(wù)的研究與實現(xiàn)[D];山東科技大學(xué);2010年

9 年青;我國大學(xué)生籃球運動員信息數(shù)據(jù)庫的構(gòu)建研究[D];東北師范大學(xué);2014年

10 楊素寶;超(超)臨界火電機組用鋼數(shù)據(jù)庫的開發(fā)及其應(yīng)用[D];昆明理工大學(xué);2009年



本文編號:857264

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/857264.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶197ad***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com