天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于用戶反饋的數(shù)據(jù)庫關(guān)鍵字檢索技術(shù)研究

發(fā)布時(shí)間:2017-05-10 18:06

  本文關(guān)鍵詞:基于用戶反饋的數(shù)據(jù)庫關(guān)鍵字檢索技術(shù)研究,由筆耕文化傳播整理發(fā)布。


【摘要】:在Web和企業(yè)中大量存在著半結(jié)構(gòu)化和結(jié)構(gòu)化的數(shù)據(jù),而且這些數(shù)據(jù)隨著時(shí)間的推移急劇增長,隨之而來的就是用戶對這些數(shù)據(jù)的查詢需求的增長。傳統(tǒng)來說,用戶訪問結(jié)構(gòu)化數(shù)據(jù),就需要學(xué)習(xí)結(jié)構(gòu)化查詢語言的基礎(chǔ)語法規(guī)則和數(shù)據(jù)庫的基礎(chǔ)知識(shí),并需要對數(shù)據(jù)的模式有一個(gè)清晰的認(rèn)知;對于每次的查詢,用戶都需要重新設(shè)定查詢條件,并重寫查詢語句。即使傳統(tǒng)的結(jié)構(gòu)化查詢方式能夠給出較為精確的查詢結(jié)果,對于普通用戶來說,這種方式是難以掌握的,因此為普通用戶查詢信息帶來了很大的不便。 Internet的發(fā)展導(dǎo)致越來越多的普通用戶在線訪問數(shù)據(jù)庫,傳統(tǒng)的數(shù)據(jù)庫查詢方法已經(jīng)不能滿足用戶需求,數(shù)據(jù)庫關(guān)鍵字查詢順勢而生。數(shù)據(jù)庫關(guān)鍵字查詢將數(shù)據(jù)庫技術(shù)和關(guān)鍵字查詢技術(shù)結(jié)合起來,使得用戶可以就像使用Web搜索引擎-樣,輸入一組關(guān)鍵字描述查詢需求,系統(tǒng)根據(jù)關(guān)鍵字按照一定的方法查詢數(shù)據(jù)庫中與關(guān)鍵字相關(guān)的信息,并將查詢結(jié)果按照一定規(guī)則排序后返回給用戶。數(shù)據(jù)庫關(guān)鍵字查詢使得用戶不必理解數(shù)據(jù)庫的模式,也無需學(xué)習(xí)查詢語言,只需關(guān)心如何使用關(guān)鍵字表達(dá)所需信息。 在數(shù)據(jù)庫關(guān)鍵字查詢的研究中,主要有兩種建模方法:基于數(shù)據(jù)圖的查詢方法和基于模式圖的查詢方法。在基于模式圖的查詢方法的研究中,很多工作都是通過設(shè)計(jì)更好的打分函數(shù)對查詢結(jié)果進(jìn)行排序,從而提高查詢結(jié)果的質(zhì)量。但是,很少有人在排序時(shí)考慮用戶反饋。在Web信息檢索的研究中,已經(jīng)有大量的工作研究如何使用用戶反饋提高用戶體驗(yàn)。我們的工作是引入用戶反饋,在對查詢結(jié)果進(jìn)行排序時(shí),使用反饋信息提高查詢結(jié)果的質(zhì)量。具體來說,我們的工作是基于模式圖的查詢方法。在基于模式圖的查詢方法分兩個(gè)階段執(zhí)行關(guān)鍵字查詢:候選網(wǎng)絡(luò)生成和候選網(wǎng)絡(luò)求解。在傳統(tǒng)的方法中,按照候選網(wǎng)絡(luò)從小到大的順序進(jìn)行求解,并沒有考慮過用戶偏好。所以,為了能夠只返回給用戶較為偏好的結(jié)果,我們引入用戶反饋,擴(kuò)展原有的函數(shù),提出一個(gè)新的候選網(wǎng)絡(luò)排序策略。查詢?nèi)罩咀鳛橐环N用戶反饋,隱含用戶偏好的頻繁模式,使用樹挖掘算法,獲得頻繁模式,以此為基礎(chǔ)計(jì)算候選網(wǎng)絡(luò)的基于日志的分?jǐn)?shù),最后將日志分?jǐn)?shù)和基于大小的原有的分?jǐn)?shù)加權(quán)得到候選網(wǎng)絡(luò)的最終分?jǐn)?shù);在每個(gè)生成的候選網(wǎng)絡(luò)都打分完成后,就能根據(jù)分?jǐn)?shù),對候選網(wǎng)絡(luò)進(jìn)行排序,按照從大到小的順序。這樣就能夠首先求解用戶偏好的結(jié)構(gòu),從而改善查詢質(zhì)量。我們給出了兩個(gè)算法計(jì)算一個(gè)候選網(wǎng)絡(luò)的最大分?jǐn)?shù),即動(dòng)態(tài)規(guī)劃算法和貪心算法,并證明了計(jì)算最大分?jǐn)?shù)是NP-困難的。
【關(guān)鍵詞】:關(guān)鍵字查詢 模式圖 候選網(wǎng)絡(luò) 查詢?nèi)罩?/strong>
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP311.13
【目錄】:
  • TABLE OF CONTENTS6-8
  • 摘要8-10
  • ABSTRACT10-12
  • 第1章 緒論12-17
  • 1.1 研究背景12-13
  • 1.2 研究現(xiàn)狀13-15
  • 1.3 本文工作15-16
  • 1.4 文章組織結(jié)構(gòu)16-17
  • 第2章 基于模式圖的關(guān)鍵字查詢概述17-29
  • 2.1 基本框架17-19
  • 2.1.1 數(shù)據(jù)模型和關(guān)鍵字查詢17-18
  • 2.1.2 查詢系統(tǒng)基本架構(gòu)18-19
  • 2.2 查詢階段19-23
  • 2.2.1 候選網(wǎng)絡(luò)生成19-21
  • 2.2.2 候選網(wǎng)絡(luò)求解21-23
  • 2.3 其他關(guān)鍵字查詢語義23-24
  • 2.3.1 不同根語義23-24
  • 2.3.2 不同核心語義24
  • 2.4 基于數(shù)據(jù)圖的關(guān)鍵字查詢24-26
  • 2.4.1 基于樹語義的關(guān)鍵字查詢25-26
  • 2.4.2 基于子圖的關(guān)鍵字查詢26
  • 2.5 其他研究方向26-28
  • 2.6 本章小結(jié)28-29
  • 第3章 基于用戶日志的關(guān)鍵字查詢29-43
  • 3.1 引言29-31
  • 3.2 相關(guān)工作31-32
  • 3.3 基本概念32-35
  • 3.4 基于用戶日志的候選網(wǎng)絡(luò)排序35-38
  • 3.4.1 初始方法35-36
  • 3.4.2 排序策略36-38
  • 3.5 復(fù)雜性問題38-42
  • 3.5.1 動(dòng)態(tài)規(guī)劃算法40-41
  • 3.5.2 貪心算法41-42
  • 3.6 本章小結(jié)42-43
  • 第4章 實(shí)驗(yàn)及分析43-51
  • 4.1 數(shù)據(jù)集和實(shí)驗(yàn)設(shè)置43-44
  • 4.2 實(shí)驗(yàn)結(jié)果44-50
  • 4.2.1 效果分析44-48
  • 4.2.2 效率分析48-50
  • 4.3 本章小結(jié)50-51
  • 第5章 總結(jié)與展望51-53
  • 5.1 總結(jié)51-52
  • 5.2 未來的工作52-53
  • 參考文獻(xiàn)53-57
  • 致謝57-58
  • 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄58-59
  • 攻讀學(xué)位期間參與科研項(xiàng)目情況59-60
  • 學(xué)位論文評閱及答辯情況表60

  本文關(guān)鍵詞:基于用戶反饋的數(shù)據(jù)庫關(guān)鍵字檢索技術(shù)研究,,由筆耕文化傳播整理發(fā)布。



本文編號(hào):355273


本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/355273.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3c0ba***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com