移動元搜索引擎中網頁內容提取算法研究
本文選題:移動搜索 切入點:元搜索引擎 出處:《現(xiàn)代圖書情報技術》2010年10期
【摘要】:提出和實現(xiàn)基于VIPS的網頁內容提取算法WEAV(Web-page Extraction Algorithm based on VIPS)。將該算法用于移動元搜索引擎M-Meta中,對移動搜索的結果頁面進行內容提取并返回給用戶,以適應移動設備的顯示,提高用戶獲取信息的速度,增強Web在移動設備中的可用性。
[Abstract]:This paper proposes and implements WEAV(Web-page Extraction Algorithm based on VIPSU, a web page content extraction algorithm based on VIPS.The algorithm is used in mobile meta search engine M-Meta to extract the content of the mobile search result page and return it to the user in order to adapt to the display of mobile device improve the speed of obtaining information and enhance the usability of Web in mobile device.
【作者單位】: 杭州電子科技大學計算機學院;
【分類號】:TP393.092
【參考文獻】
相關期刊論文 前5條
1 劉洪,賀琛,黃河燕;WAP頁面轉換代理系統(tǒng)原理及其實現(xiàn)[J];計算機工程與應用;2002年04期
2 于滿泉,陳鐵睿,許洪波;基于分塊的網頁信息解析器的研究與設計[J];計算機應用;2005年04期
3 孫桂煌;劉發(fā)升;;基于正文特征的網頁正文信息提取方法[J];現(xiàn)代計算機(專業(yè)版);2008年09期
4 高琰;谷士文;譚立球;;基于多種策略的頁面內容提取算法[J];西南交通大學學報;2007年04期
5 路松峰;王丹丹;;面向移動設備的WEB頁面分塊算法[J];小型微型計算機系統(tǒng);2007年09期
【共引文獻】
相關期刊論文 前10條
1 鄭志材;張晶;;基于JAVA的網絡蜘蛛的設計與實現(xiàn)[J];硅谷;2009年14期
2 任玉;樊勇;鄭家恒;;基于分塊的網頁主題文本抽取[J];廣西師范大學學報(自然科學版);2009年01期
3 胡俊坤;王浩;楊靜;;一種基于決策樹的新聞內容抽取方法[J];合肥工業(yè)大學學報(自然科學版);2009年06期
4 吳飛;吳兵;申志斌;;新一代網絡教學平臺特征和技術難點的分析與探討[J];開放教育研究;2009年01期
5 胡大洋;陳金鑫;;一種發(fā)現(xiàn)多記錄Web文檔記錄分隔符的方法[J];計算機與信息技術;2008年08期
6 余靜;劉萬軍;;基于網頁分塊的主題爬蟲研究[J];計算機與信息技術;2008年10期
7 李蕾;王勁林;白鶴;胡晶晶;;基于FFT的網頁正文提取算法研究與實現(xiàn)[J];計算機工程與應用;2007年30期
8 李慶誠;彭潔;宮曉利;劉嘉欣;;嵌入式HTML文檔解析器的設計與實現(xiàn)[J];計算機工程;2009年09期
9 黃文蓓;楊靜;顧君忠;;基于分塊的網頁正文信息提取算法研究[J];計算機應用;2007年S1期
10 陳翰生;曾劍平;張世永;;一種基于位置信息的Web頁面分割方法[J];計算機應用與軟件;2009年07期
相關會議論文 前1條
1 吳倩;楊逍;張兆心;;基于視覺特征的網頁信息提取[A];第六屆全國信息檢索學術會議論文集[C];2010年
相關博士學位論文 前2條
1 孟憲軍;互聯(lián)網文本聚類與檢索技術研究[D];哈爾濱工業(yè)大學;2009年
2 陳竹敏;面向垂直搜索引擎的主題爬行技術研究[D];山東大學;2008年
相關碩士學位論文 前10條
1 周佳穎;面向普適計算的正文抽取技術的研究與設計[D];湘潭大學;2009年
2 余靜;基于Nutch的面向特定主題的爬蟲研究[D];遼寧工程技術大學;2008年
3 王t熺,
本文編號:1721539
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1721539.html