天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于查詢?nèi)罩镜臄?shù)據(jù)庫關(guān)鍵字查詢研究

發(fā)布時間:2019-04-24 21:30
【摘要】:數(shù)據(jù)庫系統(tǒng)是用來組織、存儲和管理數(shù)據(jù)的倉庫,它在企業(yè)、部門乃至個人的日常生產(chǎn)生活等諸多領(lǐng)域都得到了廣泛的應(yīng)用。隨著現(xiàn)代互聯(lián)網(wǎng)的迅速發(fā)展,信息呈現(xiàn)爆炸式增長,數(shù)據(jù)庫系統(tǒng)存儲的信息不斷增多,用戶搜索這些信息的需求也日益激增。傳統(tǒng)的數(shù)據(jù)庫訪問方式需要用戶掌握結(jié)構(gòu)化的查詢語言,了解并且.熟悉底層的數(shù)據(jù)模式,而這對于大多數(shù)的普通用戶來說是非常復(fù)雜的。受到關(guān)鍵字查詢在Web搜索引擎上獲得巨大成功的影響,近些年來在數(shù)據(jù)庫支持關(guān)鍵字查詢得到了來自數(shù)據(jù)庫領(lǐng)域和信息檢索領(lǐng)域研究人員的廣泛關(guān)注并且成為新興的研究熱點。不同于傳統(tǒng)的數(shù)據(jù)庫查詢方式,數(shù)據(jù)庫上的關(guān)鍵字查詢簡單易用,查詢沒有固定的格式限制,極大地減輕了用戶學(xué)習(xí)和記憶的壓力。但是這也給如何開發(fā)一個高效健壯的關(guān)鍵字查詢系統(tǒng)帶來了巨大挑戰(zhàn)。傳統(tǒng)的數(shù)據(jù)庫查詢的結(jié)果是一組孤立的元組,而關(guān)鍵字杏詢則需要從數(shù)據(jù)庫的不同表中組合與關(guān)鍵字匹配的元組來形成最終結(jié)果,這會導(dǎo)致查詢的搜索空間急劇膨脹。一般來講,關(guān)鍵字查詢的搜索空間與查詢中的關(guān)鍵字?jǐn)?shù)目成指數(shù)型關(guān)系。還有關(guān)鍵字查詢經(jīng)常是臟的,用戶的查詢中經(jīng)常包含一些不相關(guān)或者不正確的詞,而通常這些臟查詢會對隨后的查詢處理的效率和準(zhǔn)確性產(chǎn)生負(fù)面的影響。 為了解決查詢的搜索空間指數(shù)性爆炸這一問題,一個被稱作查詢清理的預(yù)處理步驟被引入進(jìn)來,它被用來清理用戶提交的原始查詢并抽取出高質(zhì)量的查詢項。這個新增的預(yù)處理步驟不僅改進(jìn)后續(xù)查詢結(jié)果的質(zhì)量,而且還大大地降低了后續(xù)的查詢搜索算法的搜索空間。但是它仍然存在一些問題,即引入的查詢清理算法并沒有考慮到用戶偏好,而這樣的偏好可以用來進(jìn)一步改進(jìn)查詢清理的質(zhì)量。 基于模式圖的關(guān)鍵字查詢方法在它的執(zhí)行過程中會生成大量的候選網(wǎng)絡(luò),其中有些候選網(wǎng)絡(luò)所表示的關(guān)系沒有實際意義的或者極少被用戶訪問,而有些候選網(wǎng)絡(luò)所表示的關(guān)系則史為用戶所偏好,即用戶經(jīng)常訪問這類關(guān)系。而傳統(tǒng)的基于模式圖的方法通常按照候選網(wǎng)絡(luò)大小遞增的順序依次求解候選網(wǎng)絡(luò),而不是按照用戶對候選網(wǎng)絡(luò)的偏好程度對候選網(wǎng)絡(luò)求解,這樣做也會影響到整個查詢執(zhí)行的效率和查詢結(jié)果的質(zhì)量。 本文主要針對數(shù)據(jù)庫關(guān)鍵字查詢中存在的上述問題,借助于記錄用戶行為的查詢?nèi)罩?提出兩種基于查詢?nèi)罩痉椒〝U(kuò)展原有的查詢清理方法以進(jìn)一步改進(jìn)查詢清理的質(zhì)量。我們還使用樹數(shù)據(jù)挖掘算法來對用戶的查詢?nèi)罩具M(jìn)行挖掘來獲取用戶偏好,并通過它來改進(jìn)基于模式圖的關(guān)鍵字查詢方法。本文的主要工作及成果如下: (1)針對提出的查詢清理算法中的原始得分函數(shù),在它的基礎(chǔ)上提出了兩種利用查詢?nèi)罩具M(jìn)行擴(kuò)展的方法。原始的得分函數(shù)僅僅根據(jù)數(shù)據(jù)庫來對產(chǎn)生的項進(jìn)行評分,沒有考慮到該項在日志中的使用行為。我們基于查詢?nèi)罩臼褂脙煞N不同方式來對產(chǎn)生的項進(jìn)行評分,從而獲得一個項的日志評分。最后再將得到的日志評分和原始的評分按照某種方式結(jié)合起來形成項的最終評分。我們給出的實驗證明提出的兩種改進(jìn)方法都在一定程度上改進(jìn)查詢清理的質(zhì)量,獲得了小錯的效果。 (2)通過使用查詢?nèi)罩緛磉M(jìn)一步改進(jìn)傳統(tǒng)的基于模式圖的查詢方法。一般地,基于模式圖的查詢算法通常按兩個步驟處理查詢:候選網(wǎng)絡(luò)生成和候選網(wǎng)絡(luò)求解。我們引入查詢?nèi)罩緛碛涗浻脩籼峤坏牟樵兒退麄冞x擇的候選網(wǎng)絡(luò)。然后將數(shù)據(jù)挖掘算法引入到關(guān)鍵字查詢中來,使用已有的樹挖掘算法來對用戶的查詢?nèi)罩具M(jìn)行挖掘,以獲取用戶偏好的頻繁模式樹。然后又引入樹編輯距離來定義生成的候選網(wǎng)絡(luò)與挖掘得到的頻繁模式樹的相似度,基于此對生成的候選網(wǎng)絡(luò)進(jìn)行排序并優(yōu)先求解排位靠前的候選網(wǎng)絡(luò),以此來改進(jìn)查詢的質(zhì)量和效率。
[Abstract]:......
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2012
【分類號】:TP311.13

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 黃曉藝;;黨員信息管理系統(tǒng)的設(shè)計與實現(xiàn)[J];科技信息;2011年20期

2 王金城;李桔;;快堆換料監(jiān)控系統(tǒng)數(shù)據(jù)庫功能的分析及實現(xiàn)[J];核動力工程;2007年03期

3 王翔;;Amazon進(jìn)一步開拓云數(shù)據(jù)服務(wù)市場 微軟將結(jié)束兩版本SQL Server支持[J];程序員;2009年12期

4 胡邦喜;;標(biāo)準(zhǔn)體系數(shù)據(jù)庫建設(shè)是設(shè)備管理信息化的基礎(chǔ)工作[J];中國設(shè)備工程;2006年12期

5 孫永光;;真正安全的數(shù)據(jù)庫[J];程序員;2006年08期

6 悠虎;;淺談DB2數(shù)據(jù)庫所支持的外部文件格式[J];網(wǎng)絡(luò)與信息;2011年03期

7 曲劍;馮紅巖;;PB中的數(shù)據(jù)庫事務(wù)管理[J];林業(yè)科技情報;2007年03期

8 Christopher M.Stone;David Hentchel;朱揚勇;;數(shù)據(jù)庫論戰(zhàn)卷土重來[J];計算機科學(xué);1991年05期

9 ;復(fù)制功能賦Oracle 8新特性[J];每周電腦報;1997年15期

10 彭群頤;謝桂華;;數(shù)據(jù)庫技術(shù)在高校固定資產(chǎn)設(shè)備檔案管理中的應(yīng)用[J];湘潭師范學(xué)院學(xué)報(自然科學(xué)版);2006年01期

相關(guān)會議論文 前10條

1 周英飚;馮玉才;;數(shù)據(jù)庫支持的工作流管理系統(tǒng)[A];第十五屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1998年

2 趙振基;;數(shù)據(jù)庫支持下的結(jié)構(gòu)專業(yè)CAD系統(tǒng)[A];中國土木工程學(xué)會計算機應(yīng)用學(xué)會第六屆年會土木工程計算機應(yīng)用文集[C];1995年

3 奚東敏;谷波;甄偉;;基于數(shù)據(jù)庫的房間空調(diào)器季節(jié)能效比計算[A];上海市制冷學(xué)會2005年學(xué)術(shù)年會論文集[C];2005年

4 于水東;梁軍;鮑立威;蔡穎;黃文偉;;基于關(guān)系數(shù)據(jù)庫的空運快件業(yè)務(wù)處理系統(tǒng)[A];1999中國控制與決策學(xué)術(shù)年會論文集[C];1999年

5 倪晟宇;;在流數(shù)據(jù)模式下計算最長遞增子序列長度[A];2005年全國理論計算機科學(xué)學(xué)術(shù)年會論文集[C];2005年

6 蔡德恩;;制圖技術(shù)的改革與HPD的實現(xiàn)[A];中國航海學(xué)會航標(biāo)專業(yè)委員會測繪學(xué)組學(xué)術(shù)研討會學(xué)術(shù)交流論文集[C];2009年

7 陳自安;陸蓓;;“連接陷阱”的診斷和消除[A];第九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(下)[C];1990年

8 李志剛;張直明;;油葉型軸瓦性能數(shù)據(jù)庫研究[A];第五屆全國摩擦學(xué)學(xué)術(shù)會議論文集(下冊)[C];1992年

9 李海斌;胡紅青;;企業(yè)的談判活動管理初探[A];中國市場學(xué)會2006年年會暨第四次全國會員代表大會論文集[C];2006年

10 李悅;劉廣榮;林錫龍;;一種便攜式自動指紋識別系統(tǒng)的設(shè)計與實現(xiàn)[A];2004全國光學(xué)與光電子學(xué)學(xué)術(shù)研討會、2005全國光學(xué)與光電子學(xué)學(xué)術(shù)研討會、廣西光學(xué)學(xué)會成立20周年年會論文集[C];2005年

相關(guān)重要報紙文章 前10條

1 ;Caché數(shù)據(jù)庫支持Mac OS[N];計算機世界;2002年

2 張策;偶連接數(shù)據(jù)庫同步方案的選擇[N];計算機世界;2007年

3 顧領(lǐng);投稿管理與稿件狀態(tài)查詢系統(tǒng)的開發(fā)及應(yīng)用[N];中國社會科學(xué)院院報;2008年

4 ;開源:是開始做正事的時候了[N];網(wǎng)絡(luò)世界;2008年

5 楊霞清;甲骨文過招新老對手[N];計算機世界;2007年

6 記者 謝苗楓 林亞茗 李靜睿 通訊員 沈提安;“公共工作銀行”破解求職難[N];南方日報;2006年

7 主持人 雷厲風(fēng);2.0時代,數(shù)據(jù)為王[N];中華讀書報;2008年

8 余東明;成都警方開通“尋親網(wǎng)站”[N];法制日報;2008年

9 ;RoR:簡化Web開發(fā)[N];計算機世界;2007年

10 江濤;收藏網(wǎng)絡(luò):走過風(fēng)雨八年路[N];中國藝術(shù)報;2006年

相關(guān)博士學(xué)位論文 前2條

1 韓道;基于人體和小動物數(shù)據(jù)庫的生理組M3L平臺構(gòu)建[D];華中科技大學(xué);2010年

2 呂艷輝;數(shù)據(jù)庫支持的模糊OWL本體構(gòu)建與存儲的研究[D];東北大學(xué);2010年

相關(guān)碩士學(xué)位論文 前10條

1 蘇國君;人事檔案管理系統(tǒng)的設(shè)計與實現(xiàn)[D];華南理工大學(xué);2012年

2 姚翠薇;基于C/S架構(gòu)的高校信息管理系統(tǒng)設(shè)計與實現(xiàn)[D];電子科技大學(xué);2012年

3 翁楚橋;基于MDSplus數(shù)據(jù)庫分段技術(shù)的Web數(shù)據(jù)采集及顯示系統(tǒng)[D];華中科技大學(xué);2013年

4 張佩琪;湖南建工商品房銷售系統(tǒng)的設(shè)計與實現(xiàn)[D];電子科技大學(xué);2012年

5 高磊;基于查詢?nèi)罩镜臄?shù)據(jù)庫關(guān)鍵字查詢研究[D];山東大學(xué);2012年

6 喬穎新;醫(yī)院績效管理系統(tǒng)的設(shè)計與實現(xiàn)[D];北京郵電大學(xué);2011年

7 金云;昆山市某高級中學(xué)成績在線管理平臺的設(shè)計與實現(xiàn)[D];電子科技大學(xué);2013年

8 趙振江;人民公安報社OA系統(tǒng)的設(shè)計與開發(fā)[D];北京工業(yè)大學(xué);2012年

9 王玉宏;教學(xué)信息資源的高效搜索[D];電子科技大學(xué);2008年

10 孫偉平;面向轉(zhuǎn)化醫(yī)學(xué)的生物信息學(xué)數(shù)據(jù)融合與搜索算法研究及應(yīng)用[D];中南大學(xué);2012年



本文編號:2464802

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2464802.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9b76d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com