基于Lucene的房產(chǎn)信息垂直搜索引擎的研究
本文關(guān)鍵詞: 垂直搜索 房產(chǎn) Lucene Nutch 出處:《沈陽建筑大學(xué)學(xué)報(自然科學(xué)版)》2011年01期 論文類型:期刊論文
【摘要】:目的針對目前國內(nèi)房產(chǎn)信息資源比較分散特點(diǎn),研究房產(chǎn)信息垂直搜索引擎的建立模式與實現(xiàn)技術(shù).方法應(yīng)用Lucene與Nutch平臺以及垂直搜索引擎技術(shù),開發(fā)具有市場應(yīng)用價值的房產(chǎn)信息垂直搜索引擎.結(jié)果設(shè)計建立了包含網(wǎng)頁抓取模塊、網(wǎng)頁解析模塊、數(shù)據(jù)庫存儲模塊、索引建立模塊、查詢模塊組成的房產(chǎn)信息垂直搜索引擎.結(jié)論該房產(chǎn)信息垂直搜索引擎可為用戶提供房源信息、房產(chǎn)新聞和數(shù)據(jù)的檢索、查詢與分析等服務(wù).相比其他搜索引擎在搜索結(jié)果方面精度提高一倍,在運(yùn)作成本方面僅為其他搜索引擎運(yùn)作成本的1/2,搜索速度方面相比其他搜索引擎提高20%.
[Abstract]:Objective according to the current domestic real estate information resources scattered characteristics, establish model research and implementation of real estate information vertical search engine. Methods using Lucene and Nutch platform and vertical search engine technology, development of market of real estate information vertical search engine application value. Results included the establishment of a web crawler module, web analysis module, database storage module, indexing module, real estate information vertical search engine query module. The real estate information vertical search engine can provide information retrieval for users of real estate listings, news and data, query and analysis services. Compared to other search engines in search results to improve the accuracy of a times, the operating cost is only other search engine operation cost 1/2, search speed compared to other search engines to improve 20%.
【作者單位】: 沈陽建筑大學(xué)理學(xué)院;沈陽建筑大學(xué)信息與控制工程學(xué)院;
【基金】:遼寧省教育廳基金項目(L2010449)
【分類號】:TP391.3
【正文快照】: 隨著信息技術(shù)的高速發(fā)展,互聯(lián)網(wǎng)上信息量也在急劇增長.為廣大用戶提供房產(chǎn)信息服務(wù)的網(wǎng)站也日趨豐富,但這些網(wǎng)站所提供的信息相對獨(dú)立、內(nèi)容也較為分散,這就使得用戶很難及時有效地獲得較為全面的房產(chǎn)信息.百度、谷歌等通用搜索引擎提供的功能十分強(qiáng)大,在一般情況下可以滿足
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 肖冬梅;垂直搜索引擎研究[J];圖書館學(xué)研究;2003年02期
【共引文獻(xiàn)】
相關(guān)期刊論文 前6條
1 馮是聰,王繼民;關(guān)于“中文網(wǎng)頁自動分類競賽”結(jié)果的分析[J];中文信息學(xué)報;2003年05期
2 劉暢;;綜合搜索引擎與垂直搜索引擎的比較研究[J];情報科學(xué);2007年01期
3 熊化宇;;談網(wǎng)絡(luò)信息采集過程中的質(zhì)量控制[J];情報雜志;2005年12期
4 劉紅泉;后門戶時代的網(wǎng)絡(luò)信息服務(wù)——個性化服務(wù)[J];現(xiàn)代情報;2004年12期
5 許麗麗;專業(yè)搜索引擎對比研究[J];現(xiàn)代情報;2005年01期
6 錢宗玲,張小敏;網(wǎng)上信息檢索技術(shù)的發(fā)展[J];醫(yī)學(xué)信息;2004年12期
相關(guān)會議論文 前1條
1 DING Shifei 1,2, SHI Zhongzhi1, JIN Fengxiang3 , ZHU Xijun 3 (1. Key Laboratory of Intelligent Information Processing, Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100080, China) ( 2. College of Information Science and Engineering, Shandong Agricultural University,Taian 271018, China) (3. College of Geo-Information Science and Engineering, Shandong University of Science and Technology, Qingdao 266510, China);GRD-Based Fuzzy Information Integrated Pattern Recognition[A];智能計算及其應(yīng)用國際會議論文集[C];2005年
相關(guān)博士學(xué)位論文 前4條
1 徐建鎖;知識管理和文本挖掘的若干問題研究[D];天津大學(xué);2004年
2 呂凝;基于內(nèi)容的視頻數(shù)據(jù)庫多模式檢索方法研究[D];吉林大學(xué);2005年
3 雷震;基于事件的新聞報道分析技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2006年
4 胡燕;基于Web信息抽取的專業(yè)知識獲取方法研究[D];武漢理工大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 熊回香;網(wǎng)絡(luò)信息檢索及其發(fā)展趨勢研究[D];華中師范大學(xué);2003年
2 高法欽;非頻繁關(guān)聯(lián)規(guī)則挖掘的研究[D];山東科技大學(xué);2003年
3 馬安香;基于分類語義的Web信息抽取機(jī)制的研究與實現(xiàn)[D];東北大學(xué);2005年
4 熊化宇;網(wǎng)絡(luò)信息組織的質(zhì)量控制研究[D];湘潭大學(xué);2005年
5 王駿;基于垂直搜索引擎技術(shù)的房源信息分析系統(tǒng)的設(shè)計與實現(xiàn)[D];蘇州大學(xué);2006年
6 鐘配蓉;基于Web挖掘的文本預(yù)處理研究及應(yīng)用[D];湖南大學(xué);2006年
7 謝江標(biāo);最優(yōu)搜索理論在元搜索引擎中的應(yīng)用研究[D];電子科技大學(xué);2007年
8 程嵐嵐;面向領(lǐng)域的中文搜索引擎若干關(guān)鍵技術(shù)研究[D];天津大學(xué);2006年
9 羅兵;支持AJAX的互聯(lián)網(wǎng)搜索引擎爬蟲設(shè)計與實現(xiàn)[D];浙江大學(xué);2007年
10 劉斌;基于Web的HTML網(wǎng)頁清洗技術(shù)的研究與實現(xiàn)[D];華北電力大學(xué)(北京);2007年
【二級參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 康桂英,劉春平;新一代中文智能搜索引擎研究[J];東南大學(xué)學(xué)報(哲學(xué)社會科學(xué)版);2002年S1期
2 王忠,周士波;Internet英文搜索引擎評析[J];情報學(xué)報;1999年05期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 顧鵬堯;;讓搜索引擎更好地服務(wù)于教育教學(xué)[J];科學(xué)24小時;2003年Z1期
2 胡文勝;;垂直搜索助號碼百事通與商務(wù)領(lǐng)航[J];每周電腦報;2006年32期
3 胡潔;丁寧;關(guān)靜;曹福年;張磊;;基于“PUBMED+PDF”的醫(yī)學(xué)垂直搜索引擎的實踐[J];信息系統(tǒng)工程;2009年05期
4 牟思;;基于垂直搜索引擎的學(xué)校網(wǎng)站的研究與建設(shè)[J];中國教育技術(shù)裝備;2011年21期
5 田野;垂直搜索火熱為哪般[J];中國計算機(jī)用戶;2005年37期
6 劉小強(qiáng);;二手轉(zhuǎn)讓及房產(chǎn)租售垂直搜索引擎的設(shè)計與實現(xiàn)[J];三門峽職業(yè)技術(shù)學(xué)院學(xué)報;2010年03期
7 王雪冬;李偉英;李強(qiáng);;商業(yè)主題搜索引擎的研究[J];商場現(xiàn)代化;2008年29期
8 張美芳;張迎春;;淺議垂直搜索引擎服務(wù)市場的商業(yè)模式[J];現(xiàn)代商業(yè);2010年06期
9 陳利國;劉忠民;;搜索引擎的工作原理和發(fā)展趨勢[J];電腦知識與技術(shù)(學(xué)術(shù)交流);2007年23期
10 張敏;;基于本體的垂直搜索引擎的研究[J];軟件導(dǎo)刊;2010年02期
相關(guān)會議論文 前10條
1 許谷聲;童小華;;房產(chǎn)地理信息系統(tǒng)的GML模型及其實現(xiàn)技術(shù)研究[A];中國地理信息系統(tǒng)協(xié)會第八屆年會論文集[C];2004年
2 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計與實現(xiàn)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
3 關(guān)麗;劉湘南;;大慶市房產(chǎn)地理信息系統(tǒng)開發(fā)的若干關(guān)鍵技術(shù)[A];全國地圖學(xué)與GIS學(xué)術(shù)會議論文集[C];2004年
4 林歡歡;王文杰;史忠植;;移動環(huán)境下垂直搜索引擎[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
5 石偉偉;蔡陽軍;顧晨剛;;基于SuperMap的房產(chǎn)GIS系統(tǒng)配置方案[A];中國地理信息系統(tǒng)協(xié)會第八屆年會論文集[C];2004年
6 方志民;蔣云霞;;宗地與房產(chǎn)基底圖入庫系統(tǒng)的設(shè)計與開發(fā)[A];經(jīng)天緯地——全國測繪科技信息網(wǎng)中南分網(wǎng)第十九次學(xué)術(shù)交流會優(yōu)秀論文選編[C];2005年
7 王旭;杜軍平;;質(zhì)檢總局互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng)中聚焦爬蟲的研究[A];中國電子學(xué)會第十七屆信息論學(xué)術(shù)年會論文集[C];2010年
8 李仁德;謝剛生;;基于GIS的房產(chǎn)綜合管理信息系統(tǒng)的技術(shù)進(jìn)展[A];中國地理信息系統(tǒng)協(xié)會第四次會員代表大會暨第十一屆年會論文集[C];2007年
9 雷娟;;工作流設(shè)計案例分析——房產(chǎn)管理系統(tǒng)中的工作流設(shè)計[A];計算機(jī)技術(shù)在工程建設(shè)中的應(yīng)用——第十三屆全國工程建設(shè)計算機(jī)應(yīng)用學(xué)術(shù)會議論文集[C];2006年
10 劉春;魏曉燕;;房產(chǎn)數(shù)據(jù)質(zhì)量批量檢查模型與應(yīng)用[A];中國測繪學(xué)會九屆三次理事會暨2007年“信息化測繪論壇”學(xué)術(shù)年會論文集[C];2007年
相關(guān)重要報紙文章 前5條
1 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學(xué)技術(shù)情報研究所 周峻松;用開源軟件建垂直搜索引擎[N];計算機(jī)世界;2010年
2 佚名;虛擬現(xiàn)實在房產(chǎn)建筑設(shè)計中的應(yīng)用[N];中華建筑報;2008年
3 王沛霖;保護(hù)企業(yè)信息安全就是這么簡單[N];中國計算機(jī)報;2006年
4 ;賣家請“托兒”抬價,英記者喬裝揭網(wǎng)上拍賣黑幕[N];新華每日電訊;2007年
5 本報記者 陳嘉佳;網(wǎng)絡(luò)營銷創(chuàng)新航空公司尋找的“冬季牧草”[N];中國民航報;2009年
相關(guān)博士學(xué)位論文 前3條
1 王曄;垂直搜索引擎若干問題研究[D];復(fù)旦大學(xué);2011年
2 胡宜敏;農(nóng)業(yè)垂直搜索引擎語義化若干問題的研究與實現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2012年
3 李傳席;基于本體的自適應(yīng)Web信息抽取方法研究[D];中國科學(xué)技術(shù)大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 李春燕;企業(yè)信息垂直搜索引擎的研究與實現(xiàn)[D];中國地質(zhì)大學(xué)(北京);2010年
2 齊鵬;垂直搜索引擎分類索引系統(tǒng)的設(shè)計與實現(xiàn)[D];大連海事大學(xué);2010年
3 張楠;面向汽車主題的垂直搜索引擎研究與實現(xiàn)[D];西南交通大學(xué);2010年
4 陳向東;寵物用品垂直搜索引擎研究與設(shè)計[D];西北農(nóng)林科技大學(xué);2010年
5 周佳慶;實時垂直搜索引擎數(shù)據(jù)抓取調(diào)度研究[D];浙江大學(xué);2010年
6 華大年;手機(jī)產(chǎn)品信息垂直搜索引擎系統(tǒng)設(shè)計與開發(fā)[D];武漢理工大學(xué);2011年
7 薛萍;基于教育領(lǐng)域的垂直搜索引擎的研究與實現(xiàn)[D];天津師范大學(xué);2011年
8 馮效棟;垂直搜索引擎技術(shù)在網(wǎng)絡(luò)輿情巡控中的研究與應(yīng)用[D];中國海洋大學(xué);2010年
9 張贏;個性化多媒體資源垂直搜索引擎技術(shù)研究[D];華東交通大學(xué);2009年
10 李海升;垂直搜索引擎的研究與實現(xiàn)[D];西安電子科技大學(xué);2009年
,本文編號:1449986
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1449986.html