基于遺傳算法的專(zhuān)業(yè)元搜索引擎技術(shù)研究
本文關(guān)鍵詞:基于遺傳算法的專(zhuān)業(yè)元搜索引擎技術(shù)研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:當(dāng)今互聯(lián)網(wǎng)技術(shù)蓬勃發(fā)展,網(wǎng)絡(luò)普及率直線上升,網(wǎng)民的數(shù)量以指數(shù)量級(jí)增長(zhǎng),由于網(wǎng)絡(luò)使用人數(shù)的增多,網(wǎng)絡(luò)信息量也是每天都在大量增加,目前網(wǎng)絡(luò)的信息量非常龐大,現(xiàn)在的網(wǎng)民使用網(wǎng)絡(luò)去查找信息的意識(shí)不斷增強(qiáng),但是由于不同的網(wǎng)民對(duì)專(zhuān)業(yè)信息需求面各不相同再加上現(xiàn)在網(wǎng)絡(luò)信息爆炸式的增長(zhǎng),單單依靠獨(dú)立的搜索引擎去查找真正自己需要的信息是非常困難的,那么怎么解決針對(duì)不同領(lǐng)域的用戶(hù)搜索引擎能夠返回用戶(hù)相關(guān)領(lǐng)域的結(jié)果,使搜索引擎返回的結(jié)果更能人性的接近用戶(hù)對(duì)某一專(zhuān)業(yè)領(lǐng)域的需求,成為各大搜索引擎運(yùn)營(yíng)商的首要任務(wù)。 本文深層次的分析和研究了各個(gè)獨(dú)立搜索引擎的相關(guān)理論信息和元搜索引擎的相關(guān)理論信息,結(jié)合各自的優(yōu)點(diǎn)改進(jìn)彼此的缺點(diǎn),建立起了一個(gè)面向培訓(xùn)領(lǐng)域的專(zhuān)業(yè)元搜索引擎。由于本文的搜索引擎是面向?qū)I(yè)領(lǐng)域的,所以就要分析網(wǎng)頁(yè)結(jié)果集的各個(gè)網(wǎng)頁(yè)的專(zhuān)業(yè)相關(guān)度,網(wǎng)頁(yè)相關(guān)度的計(jì)算就要建立一個(gè)網(wǎng)頁(yè)相關(guān)度模型,用模型來(lái)預(yù)測(cè)計(jì)算網(wǎng)頁(yè)的專(zhuān)業(yè)相關(guān)的值并且利用這個(gè)值對(duì)網(wǎng)頁(yè)進(jìn)行排序,把結(jié)果返回給查詢(xún)用戶(hù),本文就是利用改進(jìn)的遺傳算法在專(zhuān)業(yè)詞匯表里篩選出對(duì)專(zhuān)業(yè)網(wǎng)頁(yè)排序影響較高的關(guān)鍵詞然后建網(wǎng)頁(yè)相關(guān)度模型,最后對(duì)模型進(jìn)行檢測(cè)驗(yàn)證了模型的可靠性。 本文根據(jù)改進(jìn)的遺傳算法建立的網(wǎng)頁(yè)相關(guān)度模型作為網(wǎng)頁(yè)排序的結(jié)果優(yōu)化算法,并且建立起了面向教育培訓(xùn)領(lǐng)域的專(zhuān)業(yè)元搜索引擎,介紹了相關(guān)模塊的設(shè)計(jì)與實(shí)現(xiàn),最后對(duì)這個(gè)搜索引擎的搜索結(jié)果進(jìn)行了評(píng)價(jià)和分析。
【關(guān)鍵詞】:專(zhuān)業(yè)搜索引擎 元搜索引擎 遺傳算法 專(zhuān)業(yè)相關(guān)度
【學(xué)位授予單位】:大連交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類(lèi)號(hào)】:TP391.3
【目錄】:
- 摘要5-6
- Abstract6-7
- 目錄7-9
- 緒論9-11
- 一、課題研究背景9
- 二、論文的意義以及主要研究?jī)?nèi)容9-11
- 第一章 專(zhuān)業(yè)元搜索引擎相關(guān)理論技術(shù)研究11-26
- 1.1 引言11
- 1.2 搜索引擎概述11-17
- 1.2.1 搜索引擎的發(fā)展歷史11-12
- 1.2.2 搜索引擎的研究現(xiàn)狀12-13
- 1.2.3 搜索引擎發(fā)展趨勢(shì)13-14
- 1.2.4 搜索引擎的分類(lèi)14-15
- 1.2.5 搜索引擎的原理和結(jié)構(gòu)15-17
- 1.3 專(zhuān)業(yè)搜索引擎概述17-23
- 1.3.1 專(zhuān)業(yè)搜索引擎的研究現(xiàn)狀17-19
- 1.3.2 專(zhuān)業(yè)搜索引擎的研究意義19-21
- 1.3.3 專(zhuān)業(yè)搜索引擎特點(diǎn)及優(yōu)勢(shì)21-22
- 1.3.4 專(zhuān)業(yè)搜索引擎的結(jié)構(gòu)和原理22-23
- 1.4 元搜索引擎概述23-25
- 1.4.1 元搜索引擎的特點(diǎn)及優(yōu)勢(shì)23
- 1.4.2 元搜索引擎分類(lèi)23-24
- 1.4.3 元搜索引擎原理和結(jié)構(gòu)24-25
- 本章小結(jié)25-26
- 第二章 遺傳算法理論研究26-35
- 2.1 引言26
- 2.2 遺傳算法發(fā)展歷史及現(xiàn)狀26-29
- 2.2.1 發(fā)展歷史26-28
- 2.2.2 發(fā)展現(xiàn)狀28-29
- 2.3 遺傳算法基本思想及特點(diǎn)29-31
- 2.4 遺傳算法基本操作步驟31
- 2.5 遺傳算法流程31-34
- 本章小結(jié)34-35
- 第三章 遺傳算法改進(jìn)研究35-42
- 3.1 引言35
- 3.2 選擇算子的改進(jìn)35-38
- 3.3 交叉算子的改進(jìn)38-39
- 3.4 變異算子的改進(jìn)39-40
- 3.5 改進(jìn)遺傳算法的流程40-41
- 本章小結(jié)41-42
- 第四章 基于改進(jìn)的遺傳算法的網(wǎng)頁(yè)相關(guān)度模型建立42-52
- 4.1 引言42
- 4.2 最小二乘法研究42-43
- 4.2.1 多元線性回歸最小二乘解法42-43
- 4.2.2 求解正規(guī)方程組的算法43
- 4.3 網(wǎng)頁(yè)相關(guān)度模型建立43-51
- 4.3.1 編碼43-46
- 4.3.2 適應(yīng)度函數(shù)46-50
- 4.3.3 模型建立50-51
- 4.4 模型檢測(cè)51
- 本章小結(jié)51-52
- 第五章 面向培訓(xùn)領(lǐng)域的專(zhuān)業(yè)元搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)52-70
- 5.1 引言52
- 5.2 專(zhuān)業(yè)元搜索引擎系統(tǒng)的設(shè)計(jì)52-62
- 5.2.1 專(zhuān)業(yè)元搜索引擎系統(tǒng)結(jié)構(gòu)52-53
- 5.2.2 查詢(xún)代理模塊的設(shè)計(jì)與實(shí)現(xiàn)53-60
- 5.2.3 URL管理器60-61
- 5.2.4 分詞系統(tǒng)61-62
- 5.3 專(zhuān)業(yè)元搜索引擎的實(shí)現(xiàn)62-68
- 5.3.1 系統(tǒng)實(shí)現(xiàn)62-63
- 5.3.2 結(jié)果實(shí)驗(yàn)與分析63-68
- 本章小結(jié)68-70
- 第六章 總結(jié)70-71
- 參考文獻(xiàn)71-74
- 攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文74-75
- 致謝75
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 劉麗,孫燕唐;智能型元搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2003年06期
2 謝樹(shù)龍,張杰,劉洪,儀熊曉;元搜索引擎技術(shù)分析[J];天津通信技術(shù);2004年02期
3 何曉聰;元搜索引擎的理論與實(shí)踐[J];現(xiàn)代情報(bào);2004年08期
4 曾偉忠,徐昕;搜索引擎及元搜索引擎工作原理及存在的不足[J];圖書(shū)館學(xué)刊;2004年05期
5 屈長(zhǎng)青,李艷芳;元搜索引擎的關(guān)鍵技術(shù)[J];現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版);2004年05期
6 劉暢,林劍鋒,王雁杰;元搜索引擎的調(diào)查分析[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2004年09期
7 徐戈;一個(gè)文件元搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];情報(bào)探索;2004年04期
8 吳國(guó)文,樂(lè)嘉錦,陳國(guó)梁;源搜索可定制的元搜索引擎設(shè)計(jì)技術(shù)[J];計(jì)算機(jī)應(yīng)用與軟件;2004年12期
9 黃素珍,陳寧江,蘇德富;并發(fā)多元搜索引擎的研究與應(yīng)用[J];廣西大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年02期
10 原福永;梁順攀;;元搜索引擎的現(xiàn)狀與發(fā)展[J];計(jì)算機(jī)工程與設(shè)計(jì);2005年12期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前9條
1 周小平;梁一平;鄧左祥;;元搜索引擎研究[A];2009年中國(guó)高校通信類(lèi)院系學(xué)術(shù)研討會(huì)論文集[C];2009年
2 陽(yáng)小華;劉振宇;譚敏生;劉杰;左貴啟;;元搜索引擎查詢(xún)結(jié)果的合成方法[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年
3 孟奇奎;;一種基于數(shù)據(jù)庫(kù)和用戶(hù)反饋信息的元搜索引擎數(shù)據(jù)庫(kù)選擇算法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
4 諸葛建偉;袁春陽(yáng);;基于元搜索引擎實(shí)現(xiàn)被篡改網(wǎng)站發(fā)現(xiàn)與攻擊者調(diào)查剖析[A];全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集(第二十四卷)[C];2009年
5 陳偉雄;馬少平;步建華;;基于元搜索引擎的多關(guān)鍵詞檢索技術(shù)[A];廣東省電機(jī)工程學(xué)會(huì)2003-2004年度優(yōu)秀論文集[C];2005年
6 丁山山;陳世平;;智能Agent技術(shù)在個(gè)性化WEB信息代理中的應(yīng)用研究[A];輝煌二十年——中國(guó)中文信息學(xué)會(huì)二十周年學(xué)術(shù)會(huì)議論文集[C];2001年
7 余晉;鄧志鴻;田敬;唐世渭;;PinkySearch:基于聚類(lèi)的元搜索引擎[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2005年
8 吳冷冬;童云海;唐世渭;;面向在線音樂(lè)視頻的元搜索引擎VMS[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2007年
9 吳遠(yuǎn)紅;徐妙君;范銀琛;;元搜索引擎中基于OWA算子的查詢(xún)結(jié)果合成研究[A];2007年全國(guó)開(kāi)放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條
1 喻蕓;管理和科研:如何利用網(wǎng)絡(luò)資源[N];學(xué)習(xí)時(shí)報(bào);2007年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條
1 李紅梅;智能元搜索引擎關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2009年
2 李強(qiáng);基于本體論的個(gè)性化和社會(huì)化元搜索引擎的研究[D];浙江大學(xué);2006年
3 劉煒;智能元搜索引擎中個(gè)性化模式庫(kù)的研究[D];太原理工大學(xué);2007年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 蔡宇虹;基于主題的元搜索引擎關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2010年
2 王春艷;元搜索引擎的研究與實(shí)現(xiàn)[D];吉林大學(xué);2011年
3 郭琰;元搜索引擎的關(guān)鍵技術(shù)研究及系統(tǒng)實(shí)現(xiàn)[D];南京理工大學(xué);2002年
4 李炎茗;元搜索引擎的現(xiàn)狀研究與改進(jìn)設(shè)計(jì)[D];華中師范大學(xué);2002年
5 洪穎;面向化工領(lǐng)域的智能元搜索引擎系統(tǒng)的研究與設(shè)計(jì)[D];北京化工大學(xué);2004年
6 蔡春勇;元搜索引擎的智能化及其設(shè)計(jì)與實(shí)驗(yàn)[D];福州大學(xué);2006年
7 王小朋;基于代理的元搜索引擎的研究[D];遼寧工程技術(shù)大學(xué);2005年
8 魏振達(dá);基于服務(wù)的元搜索引擎研究[D];南華大學(xué);2006年
9 李信利;基于信息類(lèi)別的元搜索引擎研究[D];山東大學(xué);2006年
10 謝江標(biāo);最優(yōu)搜索理論在元搜索引擎中的應(yīng)用研究[D];電子科技大學(xué);2007年
本文關(guān)鍵詞:基于遺傳算法的專(zhuān)業(yè)元搜索引擎技術(shù)研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):263677
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/263677.html