什么是搜索引擎_《吉林大學(xué)》2010年碩士論文
本文關(guān)鍵詞:個(gè)性化網(wǎng)絡(luò)搜索引擎研究,由筆耕文化傳播整理發(fā)布。
《吉林大學(xué)》 2010年
個(gè)性化網(wǎng)絡(luò)搜索引擎研究
郭曉剛
【摘要】: 隨著信息技術(shù)的進(jìn)步與互聯(lián)網(wǎng)絡(luò)的飛速發(fā)展,Web已經(jīng)成為了人們獲取信息的一種重要途徑。為了滿足用戶的信息檢索需求,搜索引擎應(yīng)運(yùn)而生,但因?yàn)榧夹g(shù)的發(fā)展,現(xiàn)在的搜索引擎已經(jīng)越來(lái)越無(wú)法令用戶完全滿意。本文針對(duì)搜索引擎的不足,在已有研究工作的基礎(chǔ)上,對(duì)個(gè)性化網(wǎng)絡(luò)搜索引擎進(jìn)行了研究,并給出了相應(yīng)的解決方法。 論文首先對(duì)搜索引擎進(jìn)行了綜述包括搜索引擎的原理、現(xiàn)狀、存在的問(wèn)題、發(fā)展趨勢(shì)等。針對(duì)個(gè)性化的網(wǎng)絡(luò)搜索引擎的獨(dú)特之處,分析了個(gè)性化網(wǎng)絡(luò)搜索引擎所需要的一些關(guān)鍵技術(shù)。進(jìn)一步,針對(duì)其中的中文分詞技術(shù)和用戶興趣挖掘技術(shù)做了重點(diǎn)研究。分析了常用的自動(dòng)分詞算法,針對(duì)最大匹配法(MM算法)中存在的問(wèn)題,把其中的減字規(guī)則改為增字規(guī)則,提出了一種改進(jìn)的分詞算法。通過(guò)對(duì)標(biāo)準(zhǔn)PageRank算法的深入研究發(fā)現(xiàn),可以利用用戶先前訪問(wèn)過(guò)的導(dǎo)航路徑圖來(lái)修正標(biāo)準(zhǔn)PageRank算法,同時(shí),在考慮到不同用戶訪問(wèn)不同網(wǎng)頁(yè)的實(shí)際情況不同時(shí),將當(dāng)前網(wǎng)頁(yè)對(duì)不同鏈出網(wǎng)頁(yè)的推薦能力設(shè)定為非均衡的,由此得出一個(gè)優(yōu)化的PageRank算法——基于用戶訪問(wèn)日志的個(gè)性化PageRank算法。 最后在上述研究基礎(chǔ)上,使用PHP和MySQL實(shí)現(xiàn)了一個(gè)搜索原型系統(tǒng)MySearch。
【關(guān)鍵詞】:
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2010
【分類號(hào)】:TP391.3
【目錄】:
下載全文 更多同類文獻(xiàn)
CAJ全文下載
(如何獲取全文? 歡迎:購(gòu)買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【引證文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 張美珍;王治瑩;;基于用戶查詢意圖的搜索排序算法[J];天津理工大學(xué)學(xué)報(bào);2012年03期
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前6條
1 汪曉巖,胡慶生,李斌,莊鎮(zhèn)泉;面向Internet的個(gè)性化智能信息檢索[J];計(jì)算機(jī)研究與發(fā)展;1999年09期
2 楊文峰,李星;網(wǎng)絡(luò)搜索引擎的用戶查詢分析[J];計(jì)算機(jī)工程;2001年06期
3 金澎;劉毅;王樹(shù)梅;;漢語(yǔ)分詞對(duì)中文搜索引擎檢索性能的影響[J];情報(bào)學(xué)報(bào);2006年01期
4 李樹(shù)青;;結(jié)合網(wǎng)頁(yè)內(nèi)容分析的PageRank算法初探[J];情報(bào)雜志;2005年12期
5 俞立文 ,趙政;搜索引擎的工作機(jī)制[J];微型機(jī)與應(yīng)用;2002年09期
6 蔣萍,崔志明;智能搜索引擎中用戶興趣模型分析與研究[J];微電子學(xué)與計(jì)算機(jī);2004年11期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 董玉德,王志誠(chéng),王明保,李道倫;基于WEB課件中動(dòng)態(tài)題庫(kù)的設(shè)計(jì)與開(kāi)發(fā)[J];安徽紡織職業(yè)技術(shù)學(xué)院學(xué)報(bào);2003年01期
2 郭力軍;朱群雄;;基于RSS數(shù)據(jù)源的用戶興趣模型改進(jìn)及應(yīng)用[J];北京化工大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期
3 趙靜;個(gè)性化信息檢索及功能模型[J];圖書(shū)與情報(bào);2004年01期
4 宋偉,王舉成,馬根峰,趙濟(jì)林;Internet數(shù)據(jù)挖掘原理及實(shí)現(xiàn)[J];重慶郵電學(xué)院學(xué)報(bào)(自然科學(xué)版);2001年02期
5 胡國(guó)忠;;對(duì)信息檢索系統(tǒng)應(yīng)用技術(shù)的數(shù)學(xué)表示模型的分析[J];長(zhǎng)沙航空職業(yè)技術(shù)學(xué)院學(xué)報(bào);2005年04期
6 齊海英;戚國(guó)強(qiáng);王立舒;;鄉(xiāng)(鎮(zhèn))級(jí)農(nóng)業(yè)綜合信息服務(wù)平臺(tái)的研究與設(shè)計(jì)[J];東北農(nóng)業(yè)大學(xué)學(xué)報(bào);2006年01期
7 吳麗華;馮建平;羅云鋒;;面向網(wǎng)絡(luò)教育的個(gè)性化智能搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];中國(guó)遠(yuǎn)程教育;2007年07期
8 徐麟軍;吳飛;李伐;;學(xué)習(xí)資源個(gè)性化檢索系統(tǒng)中用戶興趣建模研究[J];電腦知識(shí)與技術(shù);2008年26期
9 林錦賢,鐘春芳;基于Agent的Web網(wǎng)頁(yè)自適應(yīng)檢索模型[J];福州大學(xué)學(xué)報(bào)(自然科學(xué)版);2000年03期
10 李燕;;多Agent技術(shù)在信息檢索中的應(yīng)用[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年02期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 胡健;開(kāi)放式分布協(xié)作信息技術(shù)[D];電子科技大學(xué);2000年
2 張玉芳;基于媒體素材庫(kù)的學(xué)習(xí)內(nèi)容構(gòu)建方法研究[D];重慶大學(xué);2001年
3 李廣建;個(gè)性化網(wǎng)絡(luò)信息檢索系統(tǒng)的研究與實(shí)現(xiàn)[D];中國(guó)科學(xué)院研究生院(文獻(xiàn)情報(bào)中心);2002年
4 李洪寧;萬(wàn)維網(wǎng)地理信息系統(tǒng)分布式理論體系研究與實(shí)現(xiàn)[D];中國(guó)地質(zhì)大學(xué)(北京);2003年
5 應(yīng)曉敏;面向Internet個(gè)性化服務(wù)的用戶建模技術(shù)研究[D];中國(guó)人民解放軍國(guó)防科學(xué)技術(shù)大學(xué);2003年
6 俞方樺;互聯(lián)網(wǎng)信息資源整合研究[D];東華大學(xué);2001年
7 朱征宇;Web資源組織與服務(wù)性能研究[D];重慶大學(xué);2003年
8 陳福集;電子政務(wù)系統(tǒng)中面向公眾的信息集成化管理與個(gè)性化服務(wù)研究[D];合肥工業(yè)大學(xué);2004年
9 歐潔;聯(lián)合數(shù)字圖書(shū)館信息服務(wù)的關(guān)鍵技術(shù)研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2002年
10 楊震;文本分類和聚類中若干問(wèn)題的研究[D];北京郵電大學(xué);2007年
【同被引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前6條
1 張磊;陳俊亮;孟祥武;沈筱彥;郭杰;;基于用戶偏好的垂直搜索算法[J];電子科技大學(xué)學(xué)報(bào);2010年01期
2 錢(qián)功偉;倪林;曹榮;;基于網(wǎng)頁(yè)鏈接和內(nèi)容分析的改進(jìn)PageRank算法[J];計(jì)算機(jī)工程與應(yīng)用;2007年21期
3 何國(guó)斌;趙晶璐;;Web頁(yè)面主題相關(guān)性排序算法的研究[J];計(jì)算機(jī)工程與應(yīng)用;2009年23期
4 王鐘斐;王彪;;基于錨文本相似度的PageRank改進(jìn)算法[J];計(jì)算機(jī)工程;2010年24期
5 唐曉玲;何天云;;基于主題偏好的個(gè)性化檢索模型研究[J];情報(bào)雜志;2011年04期
6 段淮川;胡平;;基于主題特征和時(shí)間因子的改進(jìn)PageRank算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2010年04期
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 宋建康,張禮平;Web結(jié)構(gòu)挖掘算法探討[J];華東理工大學(xué)學(xué)報(bào);2003年05期
2 李永平,文坤梅;集成搜索引擎中結(jié)果排序的優(yōu)化分析[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年11期
3 汪曉巖,胡慶生,李斌,莊鎮(zhèn)泉;面向Internet的個(gè)性化智能信息檢索[J];計(jì)算機(jī)研究與發(fā)展;1999年09期
4 蔡登;盧增祥;李衍達(dá);;信息協(xié)同過(guò)濾[J];計(jì)算機(jī)科學(xué);2002年06期
5 陸麗娜,楊怡玲,管旭東,魏恒義;Web日志挖掘中的數(shù)據(jù)預(yù)處理的研究[J];計(jì)算機(jī)工程;2000年04期
6 鐘清流;Web數(shù)據(jù)挖掘的BN實(shí)現(xiàn)方案[J];計(jì)算機(jī)工程;2001年06期
7 黃于藍(lán),王洪,徐端頤,賈惠波;搜索引擎技術(shù)的新發(fā)展—多元搜索引擎系統(tǒng)[J];計(jì)算機(jī)工程;2002年01期
8 陳寶樹(shù),黨齊民;Web數(shù)據(jù)挖掘中的數(shù)據(jù)預(yù)處理[J];計(jì)算機(jī)工程;2002年07期
9 肖立英,李建華,譚立球;Web日志挖掘技術(shù)的研究與應(yīng)用[J];計(jì)算機(jī)工程;2002年07期
10 郭景峰,米浦波,劉國(guó)華;決策樹(shù)算法的并行性研究[J];計(jì)算機(jī)工程;2002年08期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 宋立軍;;淺論網(wǎng)絡(luò)數(shù)學(xué)搜索中的數(shù)學(xué)查詢語(yǔ)言與索引的研究[J];科技創(chuàng)新導(dǎo)報(bào);2011年21期
2 郭紹華;;網(wǎng)絡(luò)信息檢索技術(shù)的現(xiàn)狀及發(fā)展趨勢(shì)[J];黑龍江教育學(xué)院學(xué)報(bào);2011年06期
3 郭菲;;網(wǎng)絡(luò)引擎搜索對(duì)熱點(diǎn)問(wèn)題的追蹤分析[J];科技促進(jìn)發(fā)展(應(yīng)用版);2010年10期
4 ;微軟撿便宜[J];上海微型計(jì)算機(jī);1998年33期
5 ;視野[J];新聞實(shí)踐;2011年09期
6 黃夢(mèng)縈;;國(guó)內(nèi)高校圖書(shū)館ALEPH500系統(tǒng)Web OPAC功能及使用情況比較[J];新聞傳播;2011年07期
7 ;新軟物語(yǔ)[J];電腦愛(ài)好者;2011年01期
8 周博;劉奕群;張敏;金奕江;馬少平;;錨文本檢索有效性分析[J];軟件學(xué)報(bào);2011年08期
9 紅客王子;;裝個(gè)文件監(jiān)控器 保護(hù)網(wǎng)站安全[J];電腦愛(ài)好者;2011年09期
10 梁永演;;淺析搜索引擎的超鏈接分析排序算法[J];晉圖學(xué)刊;2011年04期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 吳穎;;對(duì)網(wǎng)絡(luò)搜索引擎輔助翻譯的反思[A];全國(guó)首屆翻譯碩士(MTI)教育與翻譯產(chǎn)業(yè)研討會(huì)論文集[C];2009年
2 張星星;穗志方;;基于網(wǎng)頁(yè)中深度并列結(jié)構(gòu)的實(shí)例提取算法[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
3 岑榮偉;劉奕群;茹立云;張敏;馬少平;;基于虛擬主題的網(wǎng)絡(luò)關(guān)鍵資源頁(yè)面定位技術(shù)研究[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
4 藺繼國(guó);徐錫山;;一種基于用戶點(diǎn)擊數(shù)據(jù)的個(gè)性化PageRank算法[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
5 陳小飛;王軼彤;馮小軍;;一種基于網(wǎng)頁(yè)質(zhì)量的PageRank算法改進(jìn)[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
6 李文;李淼;張建;朱海;陳雷;;基于混淆網(wǎng)絡(luò)和PageRank的Nbest重排序[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
7 葛正榮;李婷玉;姚天昉;;漢語(yǔ)情感問(wèn)題類型分類研究[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年
8 劉建毅;王菁華;王樅;;基于語(yǔ)言網(wǎng)絡(luò)的關(guān)鍵詞抽取[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
9 陸勇;侯漢清;;基于詞典注釋的漢語(yǔ)同義詞自動(dòng)識(shí)別[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
10 劉菁菁;林鴻飛;楊志豪;;基于PageRank和錨文本的網(wǎng)頁(yè)排序研究[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 陸影;[N];中國(guó)信息報(bào);2001年
2 康樂(lè);[N];中國(guó)化工報(bào);2002年
3 本報(bào)記者 施嘉奇;[N];文匯報(bào);2010年
4 本報(bào)記者 劉麗麗;[N];計(jì)算機(jī)世界;2011年
5 康樂(lè);[N];計(jì)算機(jī)世界;2002年
6 記者 柴麗;[N];中國(guó)檔案報(bào);2009年
7 京 勇;[N];中國(guó)企業(yè)報(bào);2004年
8 魏 薇;[N];中國(guó)信息報(bào);2004年
9 靖紅;[N];國(guó)際經(jīng)貿(mào)消息;2001年
10 王軍賢;[N];西部時(shí)報(bào);2005年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 王菁華;文本中知識(shí)的獲取[D];北京郵電大學(xué);2008年
2 黃華軍;網(wǎng)頁(yè)信息隱藏與隱秘信息檢測(cè)研究[D];湖南大學(xué);2007年
3 涂錕;基于自然語(yǔ)言與記憶再重構(gòu)的常識(shí)推理模型[D];華南理工大學(xué);2010年
4 吳永輝;面向?qū)I(yè)領(lǐng)域的網(wǎng)絡(luò)信息采集及主題檢測(cè)技術(shù)研究與應(yīng)用[D];哈爾濱工業(yè)大學(xué);2010年
5 梁浩;Deep Web信息集成架構(gòu)及相關(guān)問(wèn)題研究[D];吉林大學(xué);2010年
6 陳德品;基于遷移學(xué)習(xí)的跨領(lǐng)域排序?qū)W習(xí)算法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
7 余俊豐;Web程序與數(shù)據(jù)安全研究[D];華中科技大學(xué);2011年
8 沈慧鋒;遠(yuǎn)程富媒體的呈現(xiàn)[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
9 趙潔;基于粒計(jì)算的Web使用挖掘研究[D];華南理工大學(xué);2010年
10 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 郭曉剛;個(gè)性化網(wǎng)絡(luò)搜索引擎研究[D];吉林大學(xué);2010年
2 張婷;分布式網(wǎng)絡(luò)搜索引擎的研究與實(shí)現(xiàn)[D];解放軍信息工程大學(xué);2011年
3 陳瑜芳;主題爬蟲(chóng)系統(tǒng)的研究[D];武漢理工大學(xué);2010年
4 屠輝;中文重復(fù)網(wǎng)頁(yè)的檢測(cè)算法研究[D];北京郵電大學(xué);2010年
5 文敬斌;基于網(wǎng)絡(luò)設(shè)備的網(wǎng)頁(yè)過(guò)濾設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2011年
6 黃偉光;網(wǎng)頁(yè)木馬的防御與檢測(cè)技術(shù)研究[D];北京交通大學(xué);2011年
7 易方昶;基于網(wǎng)頁(yè)后門(mén)木馬監(jiān)測(cè)系統(tǒng)的研究和設(shè)計(jì)[D];北京化工大學(xué);2010年
8 盧承山;基于領(lǐng)域的主題信息采集技術(shù)研究[D];武漢理工大學(xué);2011年
9 尹力;網(wǎng)頁(yè)防篡改系統(tǒng)在校園網(wǎng)中的應(yīng)用研究[D];河北科技大學(xué);2011年
10 史晶晶;基于CRF的Web機(jī)構(gòu)實(shí)體信息抽取系統(tǒng)[D];吉林大學(xué);2011年
本文關(guān)鍵詞:個(gè)性化網(wǎng)絡(luò)搜索引擎研究,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):133244
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/133244.html