基于用戶檢索意圖的元搜索引擎研究
本文關(guān)鍵詞:基于用戶檢索意圖的元搜索引擎研究,由筆耕文化傳播整理發(fā)布。
【摘要】:網(wǎng)絡(luò)數(shù)據(jù)每天都以人們所無法想象的速度衍生,網(wǎng)絡(luò)數(shù)據(jù)的海量生產(chǎn)與高速傳播,已使現(xiàn)有信息檢索技術(shù)顯得不盡人意。雖然信息檢索水平已得到了很大的提高,然而面對(duì)網(wǎng)絡(luò)數(shù)據(jù)的爆炸式增長(zhǎng),各檢索工具的覆蓋面、查準(zhǔn)率逐步下滑。海量數(shù)據(jù)背景下,現(xiàn)有的搜索引擎已經(jīng)完全不能滿足用戶對(duì)信息檢索系統(tǒng)“準(zhǔn)確性”、“高效性”的檢索需求。為了獲取準(zhǔn)確的信息,用戶只能通過花費(fèi)大量時(shí)間,多次調(diào)用不同的檢索工具。元搜索引擎的出現(xiàn)在一定程度上緩和了單個(gè)搜索引擎“查全率”低的矛盾,但以冗長(zhǎng)的結(jié)果列表形式為用戶呈現(xiàn)出各搜索引擎的檢索結(jié)果,使得用戶再次陷入“查詢結(jié)果過載”的困境。為有效地提高檢索系統(tǒng)的“查準(zhǔn)率”、“查全率”,將數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、人工智能技術(shù)應(yīng)用于信息檢索,實(shí)現(xiàn)檢索工具的人性化、智能化已成為解決信息獲取矛盾的新方案。構(gòu)建中文搜索引擎,其中一項(xiàng)重要的技術(shù)指標(biāo)就是:查詢語句的語義理解,通過對(duì)查詢語句進(jìn)行語義分析,明確用戶實(shí)際的信息需求;谟脩舨樵円鈭D提供信息查找服務(wù)可以極大程度地提高查詢結(jié)果的質(zhì)量。元搜索引擎的構(gòu)建必須明確信息檢索的工作過程和各機(jī)制的內(nèi)部實(shí)現(xiàn)原理,了解國(guó)內(nèi)外關(guān)于元搜索的研究和發(fā)展水平,同時(shí)還應(yīng)把握信息檢索工具今后的發(fā)展趨勢(shì)。本論文的主要研究工作為:首先,基于自然語言處理技術(shù)分析用戶檢索意圖,明確用戶查詢目的,提取用戶查詢關(guān)鍵詞;基于開放目錄樹,分析用戶檢索主題,然后依據(jù)主題相關(guān)性為用戶提供搜索引擎調(diào)度策略;其次,基于投票理論計(jì)算各記錄的全局相關(guān)性;然后,基于改進(jìn)的后綴樹算法對(duì)Web檢索結(jié)果進(jìn)行層次化聚類,利用特征詞的共現(xiàn)頻率和用戶查詢意圖關(guān)鍵詞提取類標(biāo)識(shí),依次遞歸生成層次化聚類結(jié)果。
【關(guān)鍵詞】:元搜索 用戶意圖識(shí)別 層次化聚類
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.41
【目錄】:
- 摘要4-5
- Abstract5-10
- 第1章 緒論10-17
- 1.1 研究背景與意義10-12
- 1.2 相關(guān)研究進(jìn)展和文獻(xiàn)綜述12-15
- 1.2.1 識(shí)別用戶檢索意圖12-13
- 1.2.2 成員搜索引擎調(diào)度策略13-14
- 1.2.3 檢索結(jié)果的合成顯示14-15
- 1.3 論文的主要研究?jī)?nèi)容15-16
- 1.4 論文結(jié)構(gòu)16-17
- 第2章 相關(guān)技術(shù)概述17-25
- 2.1 搜索引擎17-21
- 2.1.1 搜索引擎的結(jié)構(gòu)與原理17-18
- 2.1.2 搜索引擎的分類18-19
- 2.1.3 檢索結(jié)果的排序19-20
- 2.1.4 淺析第三代搜索引擎20-21
- 2.2 元搜索引擎21-22
- 2.2.1 元搜索引擎的結(jié)構(gòu)與原理21
- 2.2.2 元搜索引擎的分類21-22
- 2.2.3 元搜索引擎的發(fā)展趨勢(shì)22
- 2.3 聚類技術(shù)22-24
- 2.4 本章小結(jié)24-25
- 第3章 檢索意圖識(shí)別與調(diào)度策略25-38
- 3.1 檢索模型25-26
- 3.2 用戶檢索意圖的理解與識(shí)別26-32
- 3.2.1 語義復(fù)雜度分析27-29
- 3.2.2 多關(guān)鍵詞分析29-32
- 3.2.3 用戶檢索信息的融合32
- 3.3 成員搜索引擎調(diào)度策略32-37
- 3.3.1 成員搜索引擎選擇算法33-34
- 3.3.2 主題相關(guān)性調(diào)度34-37
- 3.4 本章小結(jié)37-38
- 第4章 結(jié)果的整合與層次顯示38-51
- 4.1 整合算法簡(jiǎn)述38-41
- 4.1.1 基于位置信息的整合方法38-39
- 4.1.2 基于相關(guān)度的整合方法39-40
- 4.1.3 基于內(nèi)容的整合方法40
- 4.1.4 檢索結(jié)果的去重40-41
- 4.2 元搜索引擎結(jié)果的整合41-44
- 4.2.1 檢測(cè)無效鏈接41
- 4.2.2 成員搜索引擎權(quán)值設(shè)置41-42
- 4.2.3 根據(jù)位置信息為文檔打分42
- 4.2.4 內(nèi)容相關(guān)性計(jì)算42-43
- 4.2.5 冗余結(jié)果消重43
- 4.2.6 檢索結(jié)果的相關(guān)性43-44
- 4.3 層次化顯示44-50
- 4.3.1 聚類算法簡(jiǎn)述45-47
- 4.3.2 層次聚類算法47-50
- 4.4 本章小結(jié)50-51
- 第5章 實(shí)驗(yàn)與總結(jié)51-58
- 5.1 實(shí)驗(yàn)51-56
- 5.2 總結(jié)與展望56-58
- 5.2.1 總結(jié)56-57
- 5.2.2 展望57-58
- 參考文獻(xiàn)58-61
- 致謝61
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 張衛(wèi)豐;徐寶文;周曉宇;李東;許蕾;;元搜索引擎研究[J];計(jì)算機(jī)科學(xué);2001年08期
2 張儉恭,陳定權(quán),吳振新;關(guān)于搜索引擎與元搜索引擎的討論[J];現(xiàn)代圖書情報(bào)技術(shù);2002年02期
3 張健奕;搜索引擎的新發(fā)展——元搜索引擎[J];河南圖書館學(xué)刊;2002年02期
4 劉麗,須文波;一種新型的互聯(lián)網(wǎng)智能元搜索引擎[J];江南大學(xué)學(xué)報(bào);2002年01期
5 朱茂盛,王斌,程學(xué)旗;元搜索引擎及其實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2002年11期
6 劉麗,孫燕唐;智能型元搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2003年06期
7 謝樹龍,張杰,劉洪,儀熊曉;元搜索引擎技術(shù)分析[J];天津通信技術(shù);2004年02期
8 何曉聰;元搜索引擎的理論與實(shí)踐[J];現(xiàn)代情報(bào);2004年08期
9 曾偉忠,徐昕;搜索引擎及元搜索引擎工作原理及存在的不足[J];圖書館學(xué)刊;2004年05期
10 屈長(zhǎng)青,李艷芳;元搜索引擎的關(guān)鍵技術(shù)[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2004年05期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前9條
1 周小平;梁一平;鄧左祥;;元搜索引擎研究[A];2009年中國(guó)高校通信類院系學(xué)術(shù)研討會(huì)論文集[C];2009年
2 陽(yáng)小華;劉振宇;譚敏生;劉杰;左貴啟;;元搜索引擎查詢結(jié)果的合成方法[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年
3 孟奇奎;;一種基于數(shù)據(jù)庫(kù)和用戶反饋信息的元搜索引擎數(shù)據(jù)庫(kù)選擇算法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
4 諸葛建偉;袁春陽(yáng);;基于元搜索引擎實(shí)現(xiàn)被篡改網(wǎng)站發(fā)現(xiàn)與攻擊者調(diào)查剖析[A];全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集(第二十四卷)[C];2009年
5 陳偉雄;馬少平;步建華;;基于元搜索引擎的多關(guān)鍵詞檢索技術(shù)[A];廣東省電機(jī)工程學(xué)會(huì)2003-2004年度優(yōu)秀論文集[C];2005年
6 丁山山;陳世平;;智能Agent技術(shù)在個(gè)性化WEB信息代理中的應(yīng)用研究[A];輝煌二十年——中國(guó)中文信息學(xué)會(huì)二十周年學(xué)術(shù)會(huì)議論文集[C];2001年
7 余晉;鄧志鴻;田敬;唐世渭;;PinkySearch:基于聚類的元搜索引擎[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2005年
8 吳冷冬;童云海;唐世渭;;面向在線音樂視頻的元搜索引擎VMS[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2007年
9 吳遠(yuǎn)紅;徐妙君;范銀琛;;元搜索引擎中基于OWA算子的查詢結(jié)果合成研究[A];2007年全國(guó)開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條
1 喻蕓;管理和科研:如何利用網(wǎng)絡(luò)資源[N];學(xué)習(xí)時(shí)報(bào);2007年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條
1 李紅梅;智能元搜索引擎關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2009年
2 李強(qiáng);基于本體論的個(gè)性化和社會(huì)化元搜索引擎的研究[D];浙江大學(xué);2006年
3 劉煒;智能元搜索引擎中個(gè)性化模式庫(kù)的研究[D];太原理工大學(xué);2007年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 蔡宇虹;基于主題的元搜索引擎關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2010年
2 王春艷;元搜索引擎的研究與實(shí)現(xiàn)[D];吉林大學(xué);2011年
3 郭琰;元搜索引擎的關(guān)鍵技術(shù)研究及系統(tǒng)實(shí)現(xiàn)[D];南京理工大學(xué);2002年
4 李炎茗;元搜索引擎的現(xiàn)狀研究與改進(jìn)設(shè)計(jì)[D];華中師范大學(xué);2002年
5 洪穎;面向化工領(lǐng)域的智能元搜索引擎系統(tǒng)的研究與設(shè)計(jì)[D];北京化工大學(xué);2004年
6 蔡春勇;元搜索引擎的智能化及其設(shè)計(jì)與實(shí)驗(yàn)[D];福州大學(xué);2006年
7 王小朋;基于代理的元搜索引擎的研究[D];遼寧工程技術(shù)大學(xué);2005年
8 魏振達(dá);基于服務(wù)的元搜索引擎研究[D];南華大學(xué);2006年
9 李信利;基于信息類別的元搜索引擎研究[D];山東大學(xué);2006年
10 謝江標(biāo);最優(yōu)搜索理論在元搜索引擎中的應(yīng)用研究[D];電子科技大學(xué);2007年
本文關(guān)鍵詞:基于用戶檢索意圖的元搜索引擎研究,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):397724
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/397724.html