基于規(guī)則的網(wǎng)頁分割預(yù)處理算法研究
[Abstract]:Aiming at the problem that the content and style of web pages are designed independently and the algorithm of page segmentation is difficult to run, a preprocessing algorithm for web page segmentation based on rules is proposed, and the association between page labels and style information is established. The algorithm consists of three steps: first, obtaining style information; second, associating style information and tags; third, outputting lists of HTML and PerfectNode association classes. A preprocessing algorithm for web pages running on 100 national excellent course websites is randomly selected. The experimental results show that the algorithm can effectively fuse the page label and style information and solve the problem that the page segmentation algorithm can not run.
【作者單位】: 華中師范大學信息與新聞傳播學院;湖北大學教育學院;
【基金】:教育部人文社科基金項目:移動學習服務(wù)適配決策技術(shù)及優(yōu)化策略研究(10YJC880113) 國家科技支撐計劃課題:全媒體在線編輯與適配推送數(shù)字出版技術(shù)研究及應(yīng)用示范(2013BAH30F01) 中央高校基本科研業(yè)務(wù)費項目:泛在多媒體服務(wù)中內(nèi)容適配決策模型及優(yōu)化研究,中央高;究蒲袠I(yè)務(wù)費項目:數(shù)字化學習環(huán)境及工具的典型應(yīng)用(CCNU10C01003)資助
【分類號】:TP393.092
【共引文獻】
相關(guān)期刊論文 前3條
1 宋凱;嚴麗平;甘嵐;;嵌入式Web服務(wù)器的設(shè)計與實現(xiàn)[J];計算機工程與設(shè)計;2009年04期
2 嚴麗平;宋凱;甘嵐;;Genie Shell for uC/OS-Ⅱ的設(shè)計與實現(xiàn)[J];計算機工程與設(shè)計;2009年06期
3 程京;鄧欽文;王璇;;一種基于ARM9的智能水位監(jiān)測系統(tǒng)的設(shè)計[J];微計算機信息;2010年32期
相關(guān)碩士學位論文 前8條
1 陳長虹;油田網(wǎng)絡(luò)視頻監(jiān)控系統(tǒng)的設(shè)計與實現(xiàn)[D];電子科技大學;2010年
2 吳雪琴;基于S3C2410遠程監(jiān)控系統(tǒng)的設(shè)計與實現(xiàn)[D];電子科技大學;2010年
3 張海東;基于互聯(lián)網(wǎng)的遠程視頻監(jiān)控終端設(shè)計[D];太原理工大學;2011年
4 唐偉;面向小家電的無線網(wǎng)關(guān)設(shè)計與實施[D];武漢理工大學;2009年
5 劉雅光;基于ARM的遠程視頻監(jiān)控系統(tǒng)設(shè)計與實現(xiàn)[D];武漢理工大學;2009年
6 成小霞;基于ARM的通信電源監(jiān)控系統(tǒng)的研究[D];武漢理工大學;2009年
7 鄭杜鵑;基于ARM嵌入式的遠程環(huán)境視頻監(jiān)控系統(tǒng)設(shè)計[D];武漢理工大學;2013年
8 宋成儒;基于Linux嵌入式的視頻監(jiān)控系統(tǒng)設(shè)計與應(yīng)用[D];昆明理工大學;2013年
【相似文獻】
相關(guān)期刊論文 前10條
1 段昕;馬軍;宋玲;;利用分塊重要度進行中文網(wǎng)頁分類的研究[J];山東大學學報(理學版);2006年03期
2 余小燕;陸全華;;一種欺騙網(wǎng)頁檢測判定算法[J];成都大學學報(自然科學版);2009年04期
3 張宏麗;吳承勇;王海鳳;;基于XML/XSL與設(shè)備無關(guān)的Web服務(wù)研究[J];內(nèi)蒙古大學學報(自然科學版);2006年02期
4 彭瑩;;基于CSS技術(shù)在網(wǎng)頁設(shè)計中的應(yīng)用[J];硅谷;2009年08期
5 侯明燕;楊天奇;;基于網(wǎng)頁分割的Web信息提取算法[J];微型機與應(yīng)用;2011年05期
6 袁自海;;CSS在網(wǎng)頁設(shè)計中的應(yīng)用[J];電腦知識與技術(shù);2008年08期
7 孫曉輝;劉建;王勁林;陳曉;;基于CSS的網(wǎng)頁分割算法[J];微計算機應(yīng)用;2008年09期
8 曹玖新;毛波;羅軍舟;劉波;;基于嵌套EMD的釣魚網(wǎng)頁檢測算法[J];計算機學報;2009年05期
9 尹建偉;張璇;尹瑛;董金祥;羅尚虎;;支持語義耦合的設(shè)備自適應(yīng)網(wǎng)頁布局算法[J];浙江大學學報(工學版);2009年09期
10 陳翰生;曾劍平;張世永;;一種基于位置信息的Web頁面分割方法[J];計算機應(yīng)用與軟件;2009年07期
相關(guān)碩士學位論文 前4條
1 徐超;基于DOM的網(wǎng)頁凈化方法研究[D];中國石油大學;2009年
2 黃美寧;基于用戶行為分析的網(wǎng)頁分類系統(tǒng)的研究與實現(xiàn)[D];北京郵電大學;2011年
3 劉宇婷;基于Web日志挖掘的個性化服務(wù)研究與應(yīng)用[D];北京理工大學;2010年
4 鄭海祥;系統(tǒng)調(diào)用在主機入侵檢測中的研究與應(yīng)用[D];廣東工業(yè)大學;2011年
,本文編號:2314707
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2314707.html