關(guān)系數(shù)據(jù)庫數(shù)據(jù)社區(qū)的檢索方法研究
本文選題:關(guān)系數(shù)據(jù)庫 + 數(shù)據(jù)圖 ; 參考:《大連海事大學》2013年碩士論文
【摘要】:如今互聯(lián)網(wǎng)快速發(fā)展,關(guān)鍵字搜索技術(shù)為網(wǎng)頁搜索等方面提供了關(guān)鍵技術(shù)支持,這是如今網(wǎng)頁搜索獲得巨大成功的關(guān)鍵,使得用戶可以用簡單的自己熟知的關(guān)鍵字在網(wǎng)上尋找自己需要的信息。在眾多的數(shù)據(jù)庫中,關(guān)系數(shù)據(jù)庫是當前最為流行的、使用最多的一種,只要用戶掌握一定的結(jié)構(gòu)化查詢語言和數(shù)據(jù)庫的基本模式知識就能夠進行操作。但是,如今絕大多數(shù)網(wǎng)民并不具備這些專業(yè)化知識,如何讓關(guān)系數(shù)據(jù)庫能夠支持高效的關(guān)鍵字檢索成為近來的研究熱點,因為關(guān)系數(shù)據(jù)庫的關(guān)鍵字檢索可以使用戶擺脫結(jié)構(gòu)化查詢語句(如SQL等)的束縛。 關(guān)系數(shù)據(jù)庫關(guān)鍵字搜索與網(wǎng)絡(luò)搜索引擎工作相比又有其不同特點,比如:數(shù)據(jù)庫由元組組成,元組間有鍵值或語意關(guān)系等。關(guān)鍵字檢索作用于關(guān)系數(shù)據(jù)庫上使檢索得到的結(jié)果再進行一定程度的信息整合,得到用戶真正需要的信息。 本文提出的關(guān)系數(shù)據(jù)庫數(shù)據(jù)社區(qū)檢索方法是以中心節(jié)點為驅(qū)動及其所能夠到達各關(guān)鍵字節(jié)點的組合來確定一個社區(qū)的方法。本篇社區(qū)由節(jié)點和邊組成,節(jié)點又分三類:關(guān)鍵字節(jié)點、中心節(jié)點和路徑節(jié)點;邊可以是無向邊也可以是有向邊。把各關(guān)鍵字向外擴展一定的距離所能夠到達的公共節(jié)點設(shè)立為中心節(jié)點,中心節(jié)點結(jié)構(gòu)中有它所能夠到達的各關(guān)鍵字節(jié)點的信息,以此來判斷能否滿足社區(qū)的形成條件,也就是用戶想得到的信息。對于排序問題,利用中心節(jié)點到達各關(guān)鍵字節(jié)點的開銷為依據(jù)進行相應(yīng)的規(guī)范調(diào)整,以便得到最優(yōu)結(jié)果。 本文設(shè)計了數(shù)據(jù)社區(qū)檢索方法框架,并實現(xiàn)了相關(guān)算法。以DBLP數(shù)據(jù)集對該算法進行了驗證,其結(jié)果證實了算法思想的可行性和具體算法的高效性。本文檢索方法的思想也可以擴展到其他的領(lǐng)域。與傳統(tǒng)的關(guān)系數(shù)據(jù)庫關(guān)鍵字檢索結(jié)果相比,本算法有效地改善了單個結(jié)果包含信息量少、各結(jié)果間缺少相應(yīng)的依賴聯(lián)系等問題,通過本文的算法實現(xiàn)使得單個結(jié)果包含了較為豐富的信息也使得用戶更清晰、明了的理解檢索結(jié)果間的關(guān)系。
[Abstract]:Now the rapid development of the Internet, the keyword search technology provides key technical support for web search, which is now the key of web search to achieve great success, so that users can use their own familiar simple keyword search for the information they need on the Internet. In many databases, relational database is the most popular use. One of the most, as long as the users master some knowledge of basic mode of structured query language and database to operate. But now, the vast majority of users do not have these specialized knowledge, how to make the relational database can support efficient keyword search has become the focus of research recently, because relational database keyword search allows the user to get rid of structured the query (such as SQL) bound.
Relational database keyword search compared with network search engines has different characteristics, such as: the database consists of tuples, key or semantic relations between tuples. Such as keyword search in relational database on the retrieval results and information integration to a certain extent, get the needed information for users.
In this paper the relational database community retrieval method is based on the center node as the combination of drive and can reach each keyword nodes to determine a community. The community composed of nodes and edges, nodes are divided into three categories: keyword node, the central node and the path node; the edge can be undirected edges can be directed edges. The key expansion common node distance can reach the set for the central node, with each keyword nodes it can reach the information center node structure, in order to determine whether it can meet the condition of the formation of a community, also is the information the user wants. For the sorting problem, use the central node to each keyword node overhead as the basis for the corresponding standard adjustment, in order to get the optimal results.
This paper introduces the design of data retrieval community framework, and implement the relevant algorithm. Based on DBLP data set to validate the algorithm, and the result confirms that the efficiency of the algorithm feasibility and specific algorithm. The retrieval method thought in this paper can also be extended to other areas. And the relational database keyword search results compared to traditional. This algorithm can effectively improve the individual results contain less information, the lack of corresponding relationship between the results and other issues, through this algorithm makes the single result contain abundant information makes users more clear, the relationship between the clear understanding of the retrieval results.
【學位授予單位】:大連海事大學
【學位級別】:碩士
【學位授予年份】:2013
【分類號】:TP311.132.3
【共引文獻】
相關(guān)期刊論文 前10條
1 蔡茂蓉;;基于VRML和Java的遠程虛擬教學系統(tǒng)[J];兵工自動化;2005年06期
2 王圓;孫鐵利;李楊;;Web文本挖掘中的特征表示和特征提取[J];電腦知識與技術(shù);2006年14期
3 張輝,隋佳;網(wǎng)絡(luò)信息資源組織管理的模式、問題與對策[J];東岳論叢;2005年03期
4 俞桂杰;彭語冰;褚衍昌;;復雜網(wǎng)絡(luò)理論及其在航空網(wǎng)絡(luò)中的應(yīng)用[J];復雜系統(tǒng)與復雜性科學;2006年01期
5 蘇云;搜索引擎Google檢索技巧研究[J];甘肅科技;2005年02期
6 宋春暉;網(wǎng)頁設(shè)計中的美學應(yīng)用分析[J];海南師范學院學報(自然科學版);2005年01期
7 宋春暉,雷景生,陳煥東;基于Web模式可移植性訓練系統(tǒng)的設(shè)計與實現(xiàn)[J];海南師范學院學報(自然科學版);2005年02期
8 張輝,吳輝;用戶協(xié)作式智能搜索模型的研究[J];計算機工程與應(yīng)用;2005年11期
9 宋峻峰,張維明,肖衛(wèi)東,李國輝;基于元數(shù)據(jù)的同領(lǐng)域異構(gòu)數(shù)據(jù)管理研究[J];計算機工程與應(yīng)用;2005年14期
10 郭巖;白碩;于滿泉;;Web使用信息挖掘綜述[J];計算機科學;2005年01期
相關(guān)會議論文 前2條
1 來旭;李國輝;徐蕊;;基于云圖和雨量的關(guān)聯(lián)規(guī)則挖掘[A];第一屆建立和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2005)論文集[C];2005年
2 維尼拉·木沙江;吳俊森;吐爾根·依布拉音;;維吾爾文搜索引擎的倒排索引設(shè)計與實現(xiàn)[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學術(shù)研討會論文集[C];2007年
相關(guān)博士學位論文 前10條
1 常春;Ontology在農(nóng)業(yè)信息管理中的構(gòu)建和轉(zhuǎn)化[D];中國農(nóng)業(yè)科學院;2004年
2 劉云峰;基于潛在語義分析的中文概念檢索研究[D];華中科技大學;2005年
3 柳偉;易錯信道下基于內(nèi)容的差錯控制方法研究[D];國防科學技術(shù)大學;2005年
4 趙鵬;復雜網(wǎng)絡(luò)與互聯(lián)網(wǎng)個性化信息服務(wù)的研究[D];中國科學技術(shù)大學;2006年
5 馬明全;大規(guī)模交通網(wǎng)絡(luò)的模擬與優(yōu)化[D];西北大學;2007年
6 宋峻峰;面向語義Web的領(lǐng)域本體表示、推理、集成及其應(yīng)用研究[D];國防科學技術(shù)大學;2006年
7 覃森;無標度網(wǎng)絡(luò)及其應(yīng)用研究[D];西北工業(yè)大學;2007年
8 劉夫云;基于復雜網(wǎng)絡(luò)的機械產(chǎn)品零部件分析與配置技術(shù)研究[D];浙江大學;2006年
9 胡熠;面向信息檢索的文本內(nèi)容分析[D];上海交通大學;2007年
10 楊波;復雜社會網(wǎng)絡(luò)的結(jié)構(gòu)測度與模型研究[D];上海交通大學;2007年
相關(guān)碩士學位論文 前10條
1 王曉慶;基于RBF網(wǎng)絡(luò)的文本自動分類的研究[D];江西師范大學;2003年
2 周祥東;視頻特征提取和視頻鏡頭分析[D];中國人民解放軍國防科學技術(shù)大學;2002年
3 湯義;基于MPEG-7標準的視頻描述與檢索[D];中國人民解放軍國防科學技術(shù)大學;2002年
4 董志勇;Web信息檢索中基于超鏈接的網(wǎng)頁評估算法的研究[D];河海大學;2004年
5 吳福英;面向用戶的信息過濾研究與實現(xiàn)[D];江西師范大學;2004年
6 王君;基于結(jié)構(gòu)化文本的SARS應(yīng)急知識管理系統(tǒng)的設(shè)計與實現(xiàn)[D];大連理工大學;2005年
7 曾雪強;潛在語義分類模型的研究[D];江西師范大學;2005年
8 付雪峰;基于模糊—粗糙集的文本分類模型[D];江西師范大學;2005年
9 梁海燕;圖像搜索引擎案例評價及檢索模式研究[D];東北師范大學;2005年
10 趙景彥;基于Internet的視頻服務(wù)器支持系統(tǒng)的研究與設(shè)計[D];東華大學;2005年
,本文編號:1731443
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1731443.html