基于Android的主題搜索引擎的研究
本文關(guān)鍵詞:基于Android的主題搜索引擎的研究,由筆耕文化傳播整理發(fā)布。
《湖北工業(yè)大學(xué)》 2014年
基于Android的主題搜索引擎的研究
黃日
【摘要】:網(wǎng)絡(luò)資源越來越豐富,搜索引擎技術(shù)獲得大量的關(guān)注和普遍的應(yīng)用,如何獲得精確,有效的信息成為了研究的熱點(diǎn)問題,因此搜索引擎首要的目標(biāo)是準(zhǔn)確率[1][2]。而這正是傳統(tǒng)搜索引擎面臨的問題所在。為此,專門用來查詢學(xué)科信息或者某個(gè)主題的主題搜索引擎[3]便應(yīng)運(yùn)而生,并且,已然成為當(dāng)前搜索引擎發(fā)展的主要熱點(diǎn)之一。與此同時(shí),博客是一種廣泛的共享網(wǎng)絡(luò)信息的載體,隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,移動(dòng)博客已經(jīng)成為下一代在線娛樂的主流。早在上個(gè)世紀(jì),人們獲取信息的一個(gè)重要方法就是使用搜索引擎,而依靠傳統(tǒng)的搜索引擎檢索個(gè)人感興趣的博客信息內(nèi)容,還遠(yuǎn)遠(yuǎn)達(dá)不到人們的要求;诖耍疚闹荚谠O(shè)計(jì)關(guān)于RSS[4](Resource Description Framework Site Summary)博客的主題搜索引擎,并用Android[5]移動(dòng)終端實(shí)現(xiàn)數(shù)據(jù)搜索,即基于Android的主題搜索引擎(以下簡(jiǎn)稱:TSEBA:Topic-Specific Search Engine based on Android)。 人們希望博客搜索引擎[6]能提供全面的信息資源,與此同時(shí),也對(duì)博客搜索引擎的體驗(yàn)服務(wù)有了更高的要求,相比于普通的搜索引擎,博客搜索引擎在檢索內(nèi)容,工作原理,檢索方式等方面具有較大的不同。博客有著其特定的描述格式,這種格式就是目前最廣泛的XML[7]應(yīng)用RSS,是一種描述和同步網(wǎng)站內(nèi)容的格式。XML是一種可擴(kuò)展的標(biāo)記語言,為跨平臺(tái)、跨領(lǐng)域的應(yīng)用提供了一種通信手段,被廣泛頻繁的運(yùn)用到信息服務(wù)站點(diǎn)中,如博客站點(diǎn)、新聞網(wǎng)站等。因此,假如用傳統(tǒng)的搜索引擎檢索一些以RSS格式發(fā)布的博客內(nèi)容,就會(huì)存在著更新速度慢、檢索效率低的弊端。 本文深入研究了博客主題搜索引擎的工作原理,,博客網(wǎng)絡(luò)爬蟲,索引和檢索框架,以及Android開源工具等主要技術(shù)。利用Heritrix爬蟲、Lucene全文索引檢索工具包,以及Android系統(tǒng)等開源工具實(shí)現(xiàn)了基于Android的RSS博客主題搜索引擎,針對(duì)RSS/XML文本格式的博客信息完成了文本解析、中文分詞和索引建立等工作,并利用PageRank算法對(duì)原有的Lucene排序算法進(jìn)行了改進(jìn)。在此基礎(chǔ)上,又利用時(shí)間作為影響因子對(duì)PageRank算法做了進(jìn)一步的優(yōu)化?朔藗鹘y(tǒng)搜索引擎檢索RSS格式效率低、更新速度慢以及搜索終端限制的問題。實(shí)驗(yàn)證明,該系統(tǒng)有良好的搜索性能,能實(shí)時(shí)、高效的在手機(jī)終端進(jìn)行博客搜索,使用戶能獲得優(yōu)于傳統(tǒng)博客檢索的體驗(yàn)。能實(shí)際滿足用戶的搜索需求。
【關(guān)鍵詞】:
【學(xué)位授予單位】:湖北工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP391.3
【目錄】:
下載全文 更多同類文獻(xiàn)
CAJ全文下載
(如何獲取全文? 歡迎:購(gòu)買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前4條
1 曹桂宏,何丕廉,吳光遠(yuǎn),聶頌;中文分詞對(duì)中文信息檢索系統(tǒng)性能的影響[J];計(jì)算機(jī)工程與應(yīng)用;2003年19期
2 趙珂;逯鵬;李永強(qiáng);;基于Lucene的搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2011年16期
3 陳建峽;黃日;馬忠寶;;基于PageRank的Lucene排序算法優(yōu)化與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與科學(xué);2012年10期
4 劉淑梅;夏亮;許南山;;主題搜索引擎網(wǎng)絡(luò)爬蟲搜索策略的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2010年03期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 龍樹全;趙正文;唐華;;中文分詞算法概述[J];電腦知識(shí)與技術(shù);2009年10期
2 楊元峰;趙敏涯;廖黎莉;;基于Lucene的客服知識(shí)庫(kù)系統(tǒng)結(jié)構(gòu)設(shè)計(jì)[J];福建電腦;2012年01期
3 葉昭暉;曾瓊;李強(qiáng);;基于搜索引擎的網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];廣西大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年S1期
4 諶超;強(qiáng)保華;石龍;;基于Hadoop MapReduce的大規(guī)模數(shù)據(jù)索引構(gòu)建與集群性能分析[J];桂林電子科技大學(xué)學(xué)報(bào);2012年04期
5 許昊;王躍勝;;基于Lucene的FTP搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];福建電腦;2012年07期
6 洪穎;;基于Lucene的服裝領(lǐng)域?qū)I(yè)搜索引擎研究[J];北京服裝學(xué)院學(xué)報(bào)(自然科學(xué)版);2012年03期
7 孔浩;全曉松;陳永華;;高校網(wǎng)絡(luò)社區(qū)輿論搜集中同義詞分詞器的實(shí)現(xiàn)[J];北京郵電大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2012年05期
8 許璐蕾;周莉;湯可金;姜艷萍;;基于Lucene的垂直搜索引擎的設(shè)計(jì)和實(shí)現(xiàn)[J];電腦與電信;2013年03期
9 潘文富;;基于lucene的人才網(wǎng)全文搜索系統(tǒng)設(shè)計(jì)及應(yīng)用[J];電子技術(shù)與軟件工程;2014年09期
10 張安妮;姜華;郝相蓮;;面向主題的快速搜索引擎的設(shè)計(jì)與研究[J];淮陰工學(xué)院學(xué)報(bào);2011年03期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前3條
1 馬春雷;;基于向量空間模型的中文文本檢索研究[A];2007年河北省電子學(xué)會(huì)、河北省計(jì)算機(jī)學(xué)會(huì)、河北省自動(dòng)化學(xué)會(huì)、河北省人工智能學(xué)會(huì)、河北省計(jì)算機(jī)輔助設(shè)計(jì)研究會(huì)、河北省軟件行業(yè)協(xié)會(huì)聯(lián)合學(xué)術(shù)年會(huì)論文集[C];2007年
2 王芳;萬常選;;基于可信度的中文完整詞自動(dòng)識(shí)別[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
3 王芳;萬常選;;基于互信息的中文完整詞自動(dòng)識(shí)別模型[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2007年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
2 何嘉;基于遺傳算法優(yōu)化的中文分詞研究[D];電子科技大學(xué);2012年
3 黃建年;農(nóng)業(yè)古籍的計(jì)算機(jī)斷句標(biāo)點(diǎn)與分詞標(biāo)引研究[D];南京農(nóng)業(yè)大學(xué);2009年
4 馮建周;語義Web服務(wù)自動(dòng)組合的關(guān)鍵技術(shù)研究[D];燕山大學(xué);2013年
5 陳浩;Web搜索的用戶興趣與智能優(yōu)化研究[D];中南大學(xué);2012年
6 王明軍;基于Web的空間數(shù)據(jù)爬取與度量研究[D];武漢大學(xué);2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 王紅勝;多文檔全文檢索系統(tǒng)的設(shè)計(jì)與開發(fā)[D];電子科技大學(xué);2010年
2 華大年;手機(jī)產(chǎn)品信息垂直搜索引擎系統(tǒng)設(shè)計(jì)與開發(fā)[D];武漢理工大學(xué);2011年
3 于景茹;基于Lucene的職位垂直搜索引擎的研究與實(shí)現(xiàn)[D];鄭州大學(xué);2011年
4 李蓉;面向主題的搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];華東交通大學(xué);2011年
5 白玉昭;垂直搜索引擎的研究與實(shí)現(xiàn)[D];江南大學(xué);2012年
6 張曉淼;基于神經(jīng)網(wǎng)絡(luò)的中文分詞算法的研究[D];大連理工大學(xué);2006年
7 楊珂;基于Linux的智能內(nèi)容過濾防火墻的研究與實(shí)現(xiàn)[D];西北大學(xué);2006年
8 呂鴻略;基于向量空間的中文科技文獻(xiàn)信息檢索系統(tǒng)研究[D];哈爾濱工程大學(xué);2007年
9 賈麗潔;基于最大熵模型的分詞技術(shù)研究[D];山東師范大學(xué);2007年
10 蘇雪峰;隱交互式個(gè)性化搜索引擎研究[D];太原理工大學(xué);2007年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 吳偉;陳建峽;;基于Heritrix的web信息抽取優(yōu)化與實(shí)現(xiàn)[J];湖北工業(yè)大學(xué)學(xué)報(bào);2012年02期
2 郭立力;趙春江;;高效FTP搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年01期
3 張宇;王映輝;張翔南;;基于Spring的MVC框架設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2010年04期
4 李勇;韓亮;;主題搜索引擎中網(wǎng)絡(luò)爬蟲的搜索策略研究[J];計(jì)算機(jī)工程與科學(xué);2008年03期
5 劉金紅;陸余良;;主題網(wǎng)絡(luò)爬蟲研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2007年10期
6 王鳳紅;;簡(jiǎn)單分布式網(wǎng)絡(luò)爬蟲模型的設(shè)計(jì)與分析[J];中國(guó)現(xiàn)代教育裝備;2008年04期
7 曹軍;Google的PageRank技術(shù)剖析[J];情報(bào)雜志;2002年10期
8 鄭健珍;林坤輝;周昌樂;康愷;;基于本體語義的定題爬蟲[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2006年03期
9 倪賢貴;蔡明;;基于鏈接結(jié)構(gòu)和內(nèi)容相似度的聚焦爬蟲系統(tǒng)[J];計(jì)算機(jī)工程與設(shè)計(jì);2008年07期
10 黃知義,周寧;Google搜索引擎的PageRank技術(shù)及其優(yōu)化研究[J];圖書館學(xué)研究;2005年08期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條
1 史鵬輝;專業(yè)服務(wù)網(wǎng)站搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];大連理工大學(xué);2004年
2 王亮;搜索引擎及其相關(guān)性排序研究[D];武漢大學(xué);2004年
3 壽周翔;專業(yè)搜索引擎的研究與設(shè)計(jì)[D];浙江大學(xué);2005年
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 趙建勛;;基于Android平臺(tái)的移動(dòng)位置服務(wù)的開發(fā)與實(shí)現(xiàn)[J];現(xiàn)代商貿(mào)工業(yè);2010年20期
2 李楊;馮剛;李亮;羅擁華;;基于Android的多媒體應(yīng)用開發(fā)與研究[J];計(jì)算機(jī)與現(xiàn)代化;2011年04期
3 李林濤;朱珊虹;;基于Android系統(tǒng)的手機(jī)游戲黑白棋的設(shè)計(jì)與實(shí)現(xiàn)[J];新鄉(xiāng)學(xué)院學(xué)報(bào)(自然科學(xué)版);2011年03期
4 趙亮;張維;;基于Android技術(shù)的界面設(shè)計(jì)與研究[J];電腦知識(shí)與技術(shù);2009年29期
5 叢秋波;;用于Android手機(jī)操作系統(tǒng)的視頻引擎[J];電子設(shè)計(jì)技術(shù);2010年07期
6 蘇亞光;吳亞峰;于復(fù)興;;基于Android嵌入式平臺(tái)傳感器應(yīng)用開發(fā)水平儀[J];電腦編程技巧與維護(hù);2011年05期
7 靳建林;劉曉燕;;基于Android系統(tǒng)的無線監(jiān)控系統(tǒng)[J];軟件導(dǎo)刊;2011年06期
8 王豐;付明棟;馮海亮;施玉海;;智能終端圖形用戶界面設(shè)計(jì)與實(shí)現(xiàn)[J];廣播電視信息;2011年08期
9 溫敏;艾麗蓉;王志國(guó);;Android智能手機(jī)系統(tǒng)中文件實(shí)時(shí)監(jiān)控的研究與實(shí)現(xiàn)[J];科學(xué)技術(shù)與工程;2009年07期
10 葉炳發(fā);孟小華;;Android圖形系統(tǒng)的分析與移植[J];電信科學(xué);2010年02期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 金潔;張琳;;基于Android平臺(tái)的校園街景的研究和實(shí)現(xiàn)[A];2010年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2010年
2 符易陽;周丹平;;Android安全機(jī)制分析[A];第26次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2011年
3 高峰;畢經(jīng)平;郭景峰;劉建航;;汽車狀態(tài)感知系統(tǒng)的Android客戶端設(shè)計(jì)與實(shí)現(xiàn)[A];第十四屆全國(guó)容錯(cuò)計(jì)算學(xué)術(shù)會(huì)議(CFTC'2011)論文集[C];2011年
4 丁曉安;徐伯夏;;基于智能搜索功能的Android平臺(tái)手機(jī)拼車系統(tǒng)設(shè)計(jì)[A];全國(guó)第五屆信號(hào)和智能信息處理與應(yīng)用學(xué)術(shù)會(huì)議?(第一冊(cè))[C];2011年
5 趙凡;孫明;;基于Android手機(jī)系統(tǒng)的QR碼識(shí)別技術(shù)綜述[A];中國(guó)農(nóng)業(yè)工程學(xué)會(huì)電氣信息與自動(dòng)化專業(yè)委員會(huì)、中國(guó)電機(jī)工程學(xué)會(huì)農(nóng)村電氣化分會(huì)科技與教育專委會(huì)2010年學(xué)術(shù)年會(huì)論文摘要[C];2010年
6 張立;韓銀和;袁小龍;;Android系統(tǒng)網(wǎng)絡(luò)模塊功耗的評(píng)估和分析[A];第十四屆全國(guó)容錯(cuò)計(jì)算學(xué)術(shù)會(huì)議(CFTC'2011)論文集[C];2011年
7 徐國(guó)華;徐慧;;基于Android平臺(tái)煤礦安全系統(tǒng)3G手機(jī)客戶端設(shè)計(jì)[A];煤礦自動(dòng)化與信息化——第21屆全國(guó)煤礦自動(dòng)化與信息化學(xué)術(shù)會(huì)議暨第3屆中國(guó)煤礦信息化與自動(dòng)化高層論壇論文集(上冊(cè))[C];2011年
8 雷地球;羅海勇;劉曉明;;一種基于WiFi的室內(nèi)定位系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年
9 張長(zhǎng)學(xué);王建秀;邢燕霞;;從跨平臺(tái)技術(shù)困境談運(yùn)營(yíng)商的終端分平臺(tái)發(fā)展策略[A];中國(guó)通信學(xué)會(huì)信息通信網(wǎng)絡(luò)技術(shù)委員會(huì)2011年年會(huì)論文集(上冊(cè))[C];2011年
10 鄭元中;梁延剛;;香港天文臺(tái)氣象信息服務(wù)的最新發(fā)展[A];第28屆中國(guó)氣象學(xué)會(huì)年會(huì)——S10公共氣象服務(wù)政策體制機(jī)制和學(xué)科建設(shè)[C];2011年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 北京 袁楚;[N];電腦報(bào);2010年
2 本報(bào)記者 鐘順欽;[N];通信信息報(bào);2010年
3 本報(bào)記者 胡強(qiáng);[N];通信產(chǎn)業(yè)報(bào);2010年
4 ;[N];通信產(chǎn)業(yè)報(bào);2010年
5 本報(bào)記者 程久龍;[N];21世紀(jì)經(jīng)濟(jì)報(bào)道;2011年
6 Google中國(guó)工程研究總經(jīng)理 楊文洛;[N];通信產(chǎn)業(yè)報(bào);2011年
7 本報(bào)記者 李映;[N];中國(guó)電子報(bào);2011年
8 勒夫;[N];中國(guó)經(jīng)濟(jì)時(shí)報(bào);2011年
9 本報(bào)記者 董軍;[N];中國(guó)經(jīng)營(yíng)報(bào);2011年
10 李濤;[N];人民郵電;2011年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條
1 龔愛平;基于嵌入式機(jī)器視覺的信息采集與處理技術(shù)研究[D];浙江大學(xué);2013年
2 任飛;智能電視軟件平臺(tái)關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2013年
3 魏代敏;中年女性體內(nèi)雄激素水平的變化及與機(jī)體脂肪含量、脂肪分布的相關(guān)性研究[D];北京協(xié)和醫(yī)學(xué)院;2012年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 葉炳發(fā);Android操作系統(tǒng)移植及關(guān)鍵技術(shù)研究[D];暨南大學(xué);2010年
2 岳傳真;Android系統(tǒng)移植和應(yīng)用程序開發(fā)[D];復(fù)旦大學(xué);2010年
3 劉敏;移動(dòng)終端的Android移植與應(yīng)用程序設(shè)計(jì)[D];西安電子科技大學(xué);2011年
4 王蕾;哈爾濱招行Android手機(jī)銀行匯率換算模塊的設(shè)計(jì)與實(shí)現(xiàn)[D];吉林大學(xué);2011年
5 胡思捷;基于Android平臺(tái)的觸摸屏系統(tǒng)設(shè)計(jì)及實(shí)現(xiàn)[D];南開大學(xué);2011年
6 施金蘭;基于Android平臺(tái)的網(wǎng)絡(luò)共享研究與實(shí)現(xiàn)[D];華東師范大學(xué);2011年
7 郭凱敏;基于Android平臺(tái)的維吾爾文智能輸入法研究與實(shí)現(xiàn)[D];新疆大學(xué);2011年
8 周連強(qiáng);Android開源操作系統(tǒng)的大眾生產(chǎn)研究[D];華南理工大學(xué);2011年
9 李凱;Android操作系統(tǒng)分析與移植[D];華南理工大學(xué);2011年
10 劉瑞順;基于Android平臺(tái)的智能手機(jī)輸入法研究與設(shè)計(jì)[D];汕頭大學(xué);2011年
本文關(guān)鍵詞:基于Android的主題搜索引擎的研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):129256
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/129256.html