手機(jī)產(chǎn)品垂直搜索引擎的研究與實現(xiàn)
本文關(guān)鍵詞:手機(jī)產(chǎn)品垂直搜索引擎的研究與實現(xiàn)
更多相關(guān)文章: 垂直搜索 Heritrix 抽取 索引
【摘要】:隨著網(wǎng)絡(luò)技術(shù)的快速發(fā)展,通用搜索引擎已經(jīng)不能滿足用戶的一些需求,特別是當(dāng)用戶需要搜索某一領(lǐng)域內(nèi)的信息時,垂直搜索引擎就正好符合這種需求。以手機(jī)資源為背景,通過運(yùn)用擴(kuò)展Heritrix和Lucene,構(gòu)建了一個檢索結(jié)果比較精準(zhǔn)的垂直搜索引擎。研究了通過定制和擴(kuò)展Heritrix從互聯(lián)網(wǎng)上爬取相關(guān)的信息資源,利用HtmlParser工具對爬取的信息進(jìn)行分析和抽取,運(yùn)用Lucene建立全文索引和提供檢索服務(wù),并設(shè)計了MVC的查詢接口。通過響應(yīng)時間、查全率和查準(zhǔn)率的測試實驗表明,系統(tǒng)達(dá)到了設(shè)計目標(biāo)。
【作者單位】: 武漢理工大學(xué)華夏學(xué)院;
【基金】:武漢理工大學(xué)華夏學(xué)院院級科研基金項目(11030)資助
【分類號】:TP391.3
【正文快照】: 本文受武漢理工大學(xué)華夏學(xué)院院級科研基金項目(11030)資助。搜索引擎的產(chǎn)生是為了讓用戶能夠方便地從網(wǎng)絡(luò)空間獲得其所需要的信息,它根據(jù)一定的策略,運(yùn)用特定的計算機(jī)程序搜集互聯(lián)網(wǎng)上的信息,在對信息進(jìn)行組織和處理后,將處理后的信息顯示給用戶,其是為用戶提供檢索服務(wù)的系統(tǒng)
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 奉國和;鄭偉;;國內(nèi)中文自動分詞技術(shù)研究綜述[J];圖書情報工作;2011年02期
2 ;第2屆智能計算技術(shù)與自動化國際會議(英文)[J];智能系統(tǒng)學(xué)報;2009年02期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 王曄;垂直搜索引擎若干問題研究[D];復(fù)旦大學(xué);2011年
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 黎孟雄;郭鵬飛;;基于模糊聚類的教學(xué)資源自適應(yīng)推薦研究[J];中國遠(yuǎn)程教育;2012年07期
2 張麗媛;;1984—2011年中國自動分詞研究綜述[J];農(nóng)業(yè)圖書情報學(xué)刊;2012年06期
3 梁勝;成衛(wèi)青;;基于組合型中文分詞技術(shù)的改進(jìn)[J];南京郵電大學(xué)學(xué)報(自然科學(xué)版);2013年06期
4 周益軍;何鋒考;張斌;;聚焦時尚智能新聞采集系統(tǒng)研究[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2014年05期
5 熊志斌;朱劍鋒;;基于改進(jìn)Trie樹結(jié)構(gòu)的正向最大匹配算法[J];計算機(jī)應(yīng)用與軟件;2014年05期
6 陳燕紅;張?zhí)t;馬健;;中英文跨語種嵌入式數(shù)據(jù)庫查詢處理研究[J];計算機(jī)應(yīng)用與軟件;2014年06期
7 魏刃佳;吳振強(qiáng);;面向教育視頻資源的垂直搜索引擎設(shè)計與實現(xiàn)[J];計算機(jī)工程與應(yīng)用;2014年15期
8 聶琰;;基于Nutch與元搜索引擎技術(shù)的高校網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)研究[J];計算機(jī)時代;2014年11期
9 顧磊;楊李婷;;微博信息挖掘技術(shù)在課程教學(xué)中的應(yīng)用研究[J];科技視界;2014年33期
10 李玲;;基于雙詞典機(jī)制的中文分詞系統(tǒng)設(shè)計[J];機(jī)械工程與自動化;2013年01期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 李云;基于肌電模式的中國手語識別研究及康復(fù)應(yīng)用探索[D];中國科學(xué)技術(shù)大學(xué);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 孫勝平;中文微博客熱點話題檢測與跟蹤技術(shù)研究[D];北京交通大學(xué);2011年
2 李少波;支持語義的分布式視頻檢索系統(tǒng)的設(shè)計與實現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2011年
3 田建勛;基于N-gram模型和句法模型的連續(xù)中國手語識別方法研究[D];中國科學(xué)技術(shù)大學(xué);2011年
4 陳勃;基于Nutch的企業(yè)搜索引擎的研究與實現(xiàn)[D];華中科技大學(xué);2011年
5 錢立毅;企業(yè)郵件監(jiān)管系統(tǒng)的設(shè)計與實現(xiàn)[D];南京理工大學(xué);2012年
6 賈永;農(nóng)家書屋數(shù)字化平臺的自動應(yīng)答模塊分析與設(shè)計[D];貴州財經(jīng)學(xué)院;2012年
7 楊星;面向時空數(shù)據(jù)庫的中文地名二義性辨析系統(tǒng)的設(shè)計與實現(xiàn)[D];中山大學(xué);2012年
8 張曉彩;基于K-means的中文文本精確聚類算法研究[D];燕山大學(xué);2012年
9 李海瑞;基于信息增益和信息熵的特征詞權(quán)重計算研究[D];重慶大學(xué);2012年
10 楊志倩;基于信任的Web信息采集的研究與實現(xiàn)[D];東華大學(xué);2013年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 龔漢明,周長勝;漢語分詞技術(shù)綜述[J];北京機(jī)械工業(yè)學(xué)院學(xué)報;2004年03期
2 孫茂松,鄒嘉彥;漢語自動分詞研究評述[J];當(dāng)代語言學(xué);2001年01期
3 林亞平,李彥,童調(diào)生,尹鋒;漢語自動分詞中的神經(jīng)網(wǎng)絡(luò)技術(shù)研究[J];湖南大學(xué)學(xué)報(自然科學(xué)版);1997年06期
4 陳桂林,王永成,韓客松,王剛;一種改進(jìn)的快速分詞算法[J];計算機(jī)研究與發(fā)展;2000年04期
5 孫茂松,黃昌寧,鄒嘉彥,陸方,沈達(dá)陽;利用漢字二元語法關(guān)系解決漢語自動分詞中的交集型歧義[J];計算機(jī)研究與發(fā)展;1997年05期
6 姚繼偉;趙東范;;基于短語匹配的中文分詞消歧方法[J];吉林大學(xué)學(xué)報(理學(xué)版);2010年03期
7 蘇菲,王丹力,戴國忠;基于標(biāo)記的規(guī)則統(tǒng)計模型與未登錄詞識別算法[J];計算機(jī)工程與應(yīng)用;2004年15期
8 佟曉筠;宋國龍;劉強(qiáng);張俐;姜偉;;中文分詞及詞性標(biāo)注一體化模型研究[J];計算機(jī)科學(xué);2007年09期
9 孫茂松,肖明,鄒嘉彥;基于無指導(dǎo)學(xué)習(xí)策略的無詞表條件下的漢語自動分詞[J];計算機(jī)學(xué)報;2004年06期
10 梁南元;書面漢語自動分詞系統(tǒng)—CDWS[J];中文信息學(xué)報;1987年02期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 鄭凱明;李義杰;;垂直搜索引擎及其應(yīng)用價值[J];信息技術(shù);2008年04期
2 許鑫;黃仲清;;垂直搜索引擎應(yīng)用中的若干策略探討——以12580餐飲垂直搜索為例[J];現(xiàn)代圖書情報技術(shù);2009年02期
3 肖婷;;垂直搜索引擎與旅游行業(yè)探討[J];農(nóng)業(yè)網(wǎng)絡(luò)信息;2009年11期
4 祝奕;;垂直搜索引擎的構(gòu)建與應(yīng)用[J];信息與電腦(理論版);2010年01期
5 張美芳;張迎春;;淺議垂直搜索引擎服務(wù)市場的商業(yè)模式[J];現(xiàn)代商業(yè);2010年06期
6 焦龍;;垂直搜索引擎在旅游企業(yè)中應(yīng)用的探索[J];商場現(xiàn)代化;2010年08期
7 趙宏中;李亞;;垂直搜索引擎應(yīng)用研究[J];現(xiàn)代商貿(mào)工業(yè);2010年04期
8 陳高維;鄧天權(quán);曾云磊;王維國;張龍;;基于垂直搜索引擎的旅游線路評價模型的設(shè)計[J];科技創(chuàng)新導(dǎo)報;2010年18期
9 劉小強(qiáng);;二手轉(zhuǎn)讓及房產(chǎn)租售垂直搜索引擎的設(shè)計與實現(xiàn)[J];三門峽職業(yè)技術(shù)學(xué)院學(xué)報;2010年03期
10 鄭凱明;;垂直搜索引擎應(yīng)用研究[J];赤峰學(xué)院學(xué)報(自然科學(xué)版);2011年02期
中國重要會議論文全文數(shù)據(jù)庫 前4條
1 褚蓓蓓;劉丹;;垂直搜索引擎:搜索引擎發(fā)展方向[A];2007年河北省電子學(xué)會、河北省計算機(jī)學(xué)會、河北省自動化學(xué)會、河北省人工智能學(xué)會、河北省計算機(jī)輔助設(shè)計研究會、河北省軟件行業(yè)協(xié)會聯(lián)合學(xué)術(shù)年會論文集[C];2007年
2 林歡歡;王文杰;史忠植;;移動環(huán)境下垂直搜索引擎[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
3 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計與實現(xiàn)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
4 毛華揚(yáng);劉衛(wèi);;會計信息搜索方法研究[A];第十屆全國會計信息化年會論文集[C];2011年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 北大縱橫管理顧問公司高級顧問戴曉東;“商搜”變法 垂直搜索引擎的春天還遠(yuǎn)嗎?[N];中國經(jīng)營報;2006年
2 王艷;垂直搜索引擎市場看好[N];中國旅游報;2000年
3 王靖;賽迪網(wǎng)推出垂直搜索引擎[N];人民日報海外版;2000年
4 楊國民;國內(nèi)生物醫(yī)藥行業(yè) 垂直搜索引擎誕生[N];經(jīng)濟(jì)日報;2007年
5 本報記者 王曉雁;垂直搜索引擎著作權(quán)之爭未破題[N];法制日報;2009年
6 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學(xué)技術(shù)情報研究所 周峻松;用開源軟件建垂直搜索引擎[N];計算機(jī)世界;2010年
7 中新;生意寶推“生意搜”攪局電子商務(wù)搜索市場[N];經(jīng)理日報;2008年
8 源訊 編譯;搜索巨頭的下一步[N];計算機(jī)世界;2006年
9 賽迪網(wǎng) 方剛;不只是網(wǎng)站才垂直[N];中國計算機(jī)報;2000年
10 ;沱沱網(wǎng)“亮劍”國際消費(fèi)電子博覽會 專業(yè)服務(wù)帶來B2B差異化變革[N];中國貿(mào)易報;2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 王曄;垂直搜索引擎若干問題研究[D];復(fù)旦大學(xué);2011年
2 吳羽;面向時間敏感對象的垂直搜索引擎關(guān)鍵技術(shù)研究[D];浙江大學(xué);2011年
3 胡宜敏;農(nóng)業(yè)垂直搜索引擎語義化若干問題的研究與實現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2012年
4 陳竹敏;面向垂直搜索引擎的主題爬行技術(shù)研究[D];山東大學(xué);2008年
5 王桂紅;農(nóng)產(chǎn)品市場價格web信息分析方法研究[D];沈陽農(nóng)業(yè)大學(xué);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 海濤;垂直搜索引擎數(shù)據(jù)采集技術(shù)的研究與實現(xiàn)[D];華北電力大學(xué)(北京);2008年
2 崔詩遠(yuǎn);基于垂直搜索引擎的旅行社網(wǎng)絡(luò)營銷[D];青島大學(xué);2009年
3 翟曉玲;面向?qū)W科的基礎(chǔ)教育資源垂直搜索引擎的研究與實現(xiàn)[D];東北師范大學(xué);2009年
4 王嘉杰;面向博客領(lǐng)域的垂直搜索引擎的研究與實現(xiàn)[D];北京郵電大學(xué);2009年
5 劉明君;垂直搜索引擎?zhèn)鞑W(xué)特征及應(yīng)用研究[D];華中科技大學(xué);2008年
6 黎斌;可擴(kuò)展分布式垂直搜索引擎設(shè)計與實現(xiàn)研究[D];國防科學(xué)技術(shù)大學(xué);2008年
7 李春燕;企業(yè)信息垂直搜索引擎的研究與實現(xiàn)[D];中國地質(zhì)大學(xué)(北京);2010年
8 石占偉;垃圾頁面檢測及其在垂直搜索引擎中的應(yīng)用[D];燕山大學(xué);2010年
9 張楠;面向汽車主題的垂直搜索引擎研究與實現(xiàn)[D];西南交通大學(xué);2010年
10 陳向東;寵物用品垂直搜索引擎研究與設(shè)計[D];西北農(nóng)林科技大學(xué);2010年
,本文編號:1262187
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1262187.html