關(guān)系數(shù)據(jù)庫關(guān)鍵詞的糾錯性查詢及優(yōu)化研究
本文關(guān)鍵詞: 關(guān)系數(shù)據(jù)庫關(guān)鍵詞查詢 模式圖 候選連接樹 連接樹 出處:《廣西大學》2013年碩士論文 論文類型:學位論文
【摘要】:傳統(tǒng)的關(guān)系數(shù)據(jù)庫查詢須指出將要查詢的屬性名,不能像搜索引擎那樣自由地進行關(guān)鍵詞查詢。關(guān)系數(shù)據(jù)庫關(guān)鍵詞查詢(KSORD)可以在不了解關(guān)系數(shù)據(jù)庫結(jié)構(gòu)的前提下,實現(xiàn)對關(guān)系數(shù)據(jù)庫的自由態(tài)查詢。本文對KSORD進行了分析和研究,針對以往KSORD的不足,提出了一個解決方案。 本文針對以往KSORD缺乏關(guān)鍵詞近似查詢的問題,提出一個關(guān)系數(shù)據(jù)庫關(guān)鍵詞糾錯性查詢的解決方案。本方案給出一個高頻詞生成算法,利用該算法找出關(guān)系表中文本屬性和字符串屬性值的高頻度詞匯,并存儲在hotkeys表中;給出一個關(guān)鍵詞糾錯算法,該算法依據(jù)hotkeys表中的熱詞,對待糾錯的關(guān)鍵詞進行糾錯,得到糾錯后的關(guān)鍵詞。糾錯后的關(guān)鍵詞組通過KSORD進行查詢,最終得到理想的查詢結(jié)果。 另外,本文針對以往KSORD查詢效率低耗時長的問題,提出一個基于連接樹表的解決方案,以縮短查詢時間。在關(guān)系數(shù)據(jù)庫模式圖中,給圖中各節(jié)點增加PageRank值,給出一個計算公式,為圖中各邊增加權(quán)重值;給出一個節(jié)點數(shù)不大于Maxsize的子圖生成算法和一個子圖中最小生成樹對應的select模板生成算法。利用這兩個算法從關(guān)系數(shù)據(jù)庫模式圖中生成連接樹對應的select模板,并依據(jù)這些select模板建立連接樹表joinTree。在查詢過程中,從joinTree表中找到候選連接樹對應的select模板,替代以往KSORD利用廣度優(yōu)先遍歷算法(BFS)從模式圖中找到候選連接樹的低效方法。 本文設(shè)計了關(guān)系數(shù)據(jù)庫關(guān)鍵詞糾錯性查詢的實驗,以查詢時間、查準率及查全率作為性能指標,驗證了本文提出的關(guān)系數(shù)據(jù)庫關(guān)鍵詞糾錯性查詢解決方案的可行性與有效性;本文設(shè)計了基于連接樹表的KSORD的實驗,與以往的基于BFS策略的KSORD進行比較,在不降低查準率及查全率的情況下,縮短了查詢時間,并且優(yōu)化效果隨關(guān)系數(shù)據(jù)庫規(guī)模增大而更加明顯。
[Abstract]:Traditional relational database query must point out the attribute name to be queried, and can not carry out keyword query as freely as search engine. The key word query of relational database / KSORD) can be done without knowing the structure of relational database. In this paper, KSORD is analyzed and studied, and a solution to the shortcomings of KSORD in the past is put forward. In order to solve the problem of lack of keyword approximate query in KSORD in the past, this paper proposes a solution for keyword correction query in relational database. The algorithm is used to find out the high frequency words of the text attribute and the string attribute value of the relational table and to store them in the hotkeys table. A key word correction algorithm is presented, which corrects the error correction keyword according to the hot words in the hotkeys table. The key phrase after error correction is queried by KSORD, and the ideal query result is obtained. In addition, aiming at the problem of low efficiency and long time consuming of KSORD query in the past, this paper proposes a solution based on join tree table to shorten the query time. In the schema diagram of relational database, we add PageRank value to each node in the graph. A calculation formula is given to increase the weight value for each side of the graph. A subgraph generation algorithm with no more nodes than Maxsize and a select template generation algorithm corresponding to the minimum spanning tree in a subgraph are presented. Using these two algorithms, the select template corresponding to the connection tree is generated from the relational database schema graph. The join tree table is established according to these select templates. In the process of query, the select template corresponding to the candidate join tree is found from the joinTree table, instead of the previous KSORD using the breadth-first traversal algorithm (BFS) to find the candidate join tree from the schema diagram. This paper designs the experiment of key word error correction query in relational database, taking query time, recall rate and recall rate as performance index, and validates the feasibility and effectiveness of the proposed query solution of key word correction in relational database. The experiment of KSORD based on join tree table is designed in this paper. Compared with the previous KSORD based on BFS strategy, the query time is shortened without reducing the recall rate and recall rate. And the optimization effect is more obvious with the increase of the scale of relational database.
【學位授予單位】:廣西大學
【學位級別】:碩士
【學位授予年份】:2013
【分類號】:TP311.13
【相似文獻】
相關(guān)期刊論文 前10條
1 文繼軍,王珊;SEEKER:基于關(guān)鍵詞的關(guān)系數(shù)據(jù)庫信息檢索[J];軟件學報;2005年07期
2 張宇;金順福;劉國華;苑迎;李麗樂;;基于最小Steiner樹的關(guān)鍵詞查詢方法[J];小型微型計算機系統(tǒng);2010年01期
3 楊路明;王佳宜;謝東;;關(guān)系數(shù)據(jù)庫上基于非數(shù)值屬性關(guān)鍵詞的模糊查詢[J];計算機科學;2008年06期
4 王珊;張俊;彭朝暉;戰(zhàn)疆;杜小勇;;基于本體的關(guān)系數(shù)據(jù)庫語義檢索[J];計算機科學與探索;2007年01期
5 郗君甫;劉國華;李金才;唐軍軍;祁瑞麗;;面向top-K分級的數(shù)據(jù)庫關(guān)鍵詞查詢系統(tǒng)體系結(jié)構(gòu)[J];燕山大學學報;2010年01期
6 呂漢興;孫德保;程良銓;;用關(guān)系數(shù)據(jù)庫系統(tǒng)實現(xiàn)中醫(yī)的辨證論治[J];微型機與應用;1989年02期
7 馬宗民,,嚴麗;關(guān)系數(shù)據(jù)庫中一種混合類不完全信息的引入[J];計算機研究與發(fā)展;1996年11期
8 唐潛,楊德華;用JAVA類封裝RDB庫表──在關(guān)系數(shù)據(jù)庫上運用OO技術(shù)探討[J];計算機應用研究;1999年11期
9 宋小安,李志華;基于關(guān)系數(shù)據(jù)庫的故障診斷專家系統(tǒng)在雷達電源中的應用[J];河海大學常州分校學報;2004年03期
10 陳麗冰;淺談XML與HTML和關(guān)系數(shù)據(jù)庫的比較[J];中國科技信息;2005年18期
相關(guān)會議論文 前10條
1 何義劍;姚青;洪曉光;;基于關(guān)系數(shù)據(jù)庫的業(yè)務流程本體存儲模式研究[A];第二十四屆中國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2007年
2 吳紅偉;王慶;蕭建昌;周傲英;;XML鍵約束在關(guān)系數(shù)據(jù)庫中的實現(xiàn)[A];第十九屆全國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2002年
3 陳欣;金遠平;呂揚;;基于本體的關(guān)系數(shù)據(jù)庫的語義設(shè)計模式[A];第二十一屆中國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2004年
4 顧平;周力;;基于MDA的關(guān)系數(shù)據(jù)庫的設(shè)計與實現(xiàn)[A];第二十三屆中國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2006年
5 汪t熺
本文編號:1550874
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1550874.html