垂直搜索引擎爬蟲(chóng)系統(tǒng)DIPRE算法及改進(jìn)
[Abstract]:In order to solve the problem of accurately extracting specific fields from web pages in vertical search engine, the DIPRE algorithm is studied and improved. This paper expounds the important role of DIPRE algorithm in vertical search engine, probes into the shortcomings of DIPRE algorithm in extracting complex structure web pages, and puts forward some improvements, including seed location mode, which extends single mode matching to multimode matching and introduces location index, and then verifies the improved algorithm by experiments according to the existing techniques. The results show that the accuracy and efficiency of the improved algorithm are in line with expectations.
【作者單位】: 武漢設(shè)計(jì)工程學(xué)院信息工程學(xué)院;
【分類(lèi)號(hào)】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 胡華梁;何進(jìn);鐘元生;;圖書(shū)垂直搜索引擎的設(shè)計(jì)[J];計(jì)算機(jī)與現(xiàn)代化;2007年08期
2 鄭凱明;李義杰;;垂直搜索引擎及其應(yīng)用價(jià)值[J];信息技術(shù);2008年04期
3 畢建濤;霍云福;;垂直搜索引擎贏利模式探討[J];大連大學(xué)學(xué)報(bào);2008年03期
4 許鑫;黃仲清;;垂直搜索引擎應(yīng)用中的若干策略探討——以12580餐飲垂直搜索為例[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2009年02期
5 孔祥春;李義杰;鄭凱明;;垂直搜索引擎應(yīng)用研究[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2009年07期
6 楊皖蘇;閆冬;;垂直搜索引擎發(fā)展策略探討[J];商業(yè)時(shí)代;2009年23期
7 王寧;毛垣生;;水平和垂直搜索引擎的比較與應(yīng)用實(shí)踐[J];圖書(shū)館工作與研究;2009年12期
8 祝奕;;垂直搜索引擎的構(gòu)建與應(yīng)用[J];信息與電腦(理論版);2010年01期
9 張美芳;張迎春;;淺議垂直搜索引擎服務(wù)市場(chǎng)的商業(yè)模式[J];現(xiàn)代商業(yè);2010年06期
10 焦龍;;垂直搜索引擎在旅游企業(yè)中應(yīng)用的探索[J];商場(chǎng)現(xiàn)代化;2010年08期
相關(guān)會(huì)議論文 前4條
1 褚蓓蓓;劉丹;;垂直搜索引擎:搜索引擎發(fā)展方向[A];2007年河北省電子學(xué)會(huì)、河北省計(jì)算機(jī)學(xué)會(huì)、河北省自動(dòng)化學(xué)會(huì)、河北省人工智能學(xué)會(huì)、河北省計(jì)算機(jī)輔助設(shè)計(jì)研究會(huì)、河北省軟件行業(yè)協(xié)會(huì)聯(lián)合學(xué)術(shù)年會(huì)論文集[C];2007年
2 林歡歡;王文杰;史忠植;;移動(dòng)環(huán)境下垂直搜索引擎[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
3 王上;于海;王鉦旋;;Deep Web垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年
4 毛華揚(yáng);劉衛(wèi);;會(huì)計(jì)信息搜索方法研究[A];第十屆全國(guó)會(huì)計(jì)信息化年會(huì)論文集[C];2011年
相關(guān)重要報(bào)紙文章 前1條
1 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學(xué)技術(shù)情報(bào)研究所 周峻松;用開(kāi)源軟件建垂直搜索引擎[N];計(jì)算機(jī)世界;2010年
相關(guān)博士學(xué)位論文 前3條
1 王曄;垂直搜索引擎若干問(wèn)題研究[D];復(fù)旦大學(xué);2011年
2 胡宜敏;農(nóng)業(yè)垂直搜索引擎語(yǔ)義化若干問(wèn)題的研究與實(shí)現(xiàn)[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年
3 王桂紅;農(nóng)產(chǎn)品市場(chǎng)價(jià)格web信息分析方法研究[D];沈陽(yáng)農(nóng)業(yè)大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 韓冰;垂直搜索引擎?zhèn)性化推薦研究與應(yīng)用[D];大連理工大學(xué);2009年
2 關(guān)小敏;垂直搜索引擎的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2012年
3 吳燕瑋;基于行業(yè)知識(shí)垂直搜索引擎的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2012年
4 黃興財(cái);大學(xué)生職位垂直c\索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2015年
5 陳龍飛;垂直搜索引擎在煙草行業(yè)的研究與應(yīng)用[D];浙江理工大學(xué);2016年
6 林祖新;視頻垂直搜索引擎中信息抽取與存儲(chǔ)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2013年
7 李廣麗;垂直搜索引擎的研究與設(shè)計(jì)[D];華東交通大學(xué);2008年
8 謝僑;一個(gè)基于二次過(guò)濾的垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];暨南大學(xué);2008年
9 陳宏曉;面向技術(shù)信息領(lǐng)域垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];天津大學(xué);2007年
10 張小莉;面向絲綢領(lǐng)域的垂直搜索引擎關(guān)鍵算法研究[D];蘇州大學(xué);2008年
,本文編號(hào):2511934
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2511934.html