天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于海量冗余網(wǎng)頁過濾的Web挖掘技術研究

發(fā)布時間:2018-07-13 14:49
【摘要】:智能教學系統(tǒng)通過搜索網(wǎng)頁關鍵詞獲取教學資源時,由于存在許多具有相同關鍵詞的垃圾網(wǎng)頁的影響,使得教學資源較難從海量網(wǎng)頁信息中快速挖掘出來,傳統(tǒng)的關鍵詞查找方法受垃圾網(wǎng)頁的影響使得搜索量過大,造成智能教學資源獲取的及時性不高。為此,提出Web信息抽取技術應用在智能教學資源挖掘中。根據(jù)教學資源獲取要求批量獲取相關Web網(wǎng)頁,利用Xpath語言結(jié)合搜索請求和網(wǎng)頁主題信息塊特征對Web網(wǎng)頁進行清洗,然后根據(jù)Web文本特征模型挖掘出教學所需的資源。仿真實驗表明,這種方法能夠有效克服垃圾網(wǎng)頁地干擾,快速完成教學資源地挖掘,取得了滿意的結(jié)果。
[Abstract]:When the intelligent teaching system acquires teaching resources by searching for web keywords, because of the influence of many garbage pages with the same keywords, it is difficult for teaching resources to be quickly excavated from the massive web pages. The traditional keyword search method is influenced by spam web pages, which makes the search amount too large, resulting in a lack of timeliness in the acquisition of intelligent teaching resources. Therefore, this paper puts forward the application of Web information extraction technology in intelligent teaching resource mining. According to the requirements of obtaining teaching resources, the relevant Web pages are obtained in batches, and the Web pages are cleaned by XPath language combined with search requests and the features of web pages' subject information blocks, and then the resources needed for teaching are mined according to the Web text feature model. The simulation results show that this method can effectively overcome the interference of garbage web pages and quickly complete the mining of teaching resources with satisfactory results.
【作者單位】: 北京聯(lián)合大學師范學院;
【分類號】:TP393.092

【參考文獻】

相關期刊論文 前3條

1 婁德成;姚天f ;;漢語句子語義極性分析和觀點抽取方法的研究[J];計算機應用;2006年11期

2 史西兵;王浩鳴;;隱馬爾可夫模型解決信息抽取問題的仿真研究[J];計算機仿真;2010年05期

3 蔣云霞;;基于層次分析法的工程管理專業(yè)方向選擇分析[J];科技通報;2011年04期

【共引文獻】

相關期刊論文 前10條

1 崔大志;劉影;李媛;;論網(wǎng)絡社區(qū)評論情感語義的模糊化[J];大連海事大學學報(社會科學版);2010年03期

2 黃瑾娉;蘇庭波;;一種產(chǎn)品評論信息的意見挖掘技術研究[J];工業(yè)控制計算機;2011年06期

3 許璐蕾;;網(wǎng)絡評論中情感詞的獲取及極性判斷方法比較[J];電腦與電信;2011年01期

4 談國新;方一;;突發(fā)公共事件網(wǎng)絡輿情監(jiān)測指標體系研究[J];華中師范大學學報(人文社會科學版);2010年03期

5 伍星;何中市;黃永文;;產(chǎn)品評論挖掘研究綜述[J];計算機工程與應用;2008年36期

6 李娟;張全;賈寧;;中文詞語傾向性分析處理[J];計算機工程與應用;2009年02期

7 田生偉;禹龍;王宇光;;維吾爾語情感分類算法[J];計算機工程與應用;2011年36期

8 趙俊芹;楊丹;余淼;陳林;;評論信息抽取技術在網(wǎng)絡貿(mào)易系統(tǒng)平臺上的應用[J];計算機科學;2008年04期

9 李維杰;;情感分析與認知[J];計算機科學;2010年07期

10 李芳;何婷婷;宋樂;;評價主題挖掘及其傾向性識別[J];計算機科學;2012年06期

相關會議論文 前2條

1 郝博一;夏云慶;鄭方;;OPINAX:一個有效的產(chǎn)品屬性挖掘系統(tǒng)[A];第四屆全國信息檢索與內(nèi)容安全學術會議論文集(上)[C];2008年

2 王倩;何婷婷;聞彬;宋樂;張茂元;;基于依存關系的中文情感要素抽取技術研究[A];中國計算機語言學研究前沿進展(2007-2009)[C];2009年

相關博士學位論文 前5條

1 鄧斌;B2C在線評論中的客戶知識管理研究[D];電子科技大學;2010年

2 舒江波;面向中文信息處理的復句關系詞自動標識研究[D];華中師范大學;2011年

3 胡燕;基于Web信息抽取的專業(yè)知識獲取方法研究[D];武漢理工大學;2007年

4 黃永文;中文產(chǎn)品評論挖掘關鍵技術研究[D];重慶大學;2009年

5 杜偉夫;文本傾向性分析中的情感詞典構(gòu)建技術研究[D];哈爾濱工業(yè)大學;2010年

相關碩士學位論文 前10條

1 呂韶華;面向中文評論文本的情感傾向性研究[D];大連理工大學;2010年

2 邢鑫巖;基于序列模型的情感分析研究[D];大連理工大學;2010年

3 楊鼎;基于樸素貝葉斯的中文文本情感傾向分類研究[D];湖南工業(yè)大學;2010年

4 李海林;網(wǎng)絡輿情熱點信息發(fā)現(xiàn)及其傾向性研究[D];武漢理工大學;2010年

5 吳秀梅;基于潛在語義分析和最大熵的中文情感分析研究[D];北京交通大學;2011年

6 張瑞;基于在線評論的消費者品牌認知和信任模糊推理研究[D];大連理工大學;2011年

7 黃鑫;基于句法分析的產(chǎn)品評論挖掘研究[D];北京郵電大學;2011年

8 史麗君;基于特征強化的中文產(chǎn)品評價挖掘研究[D];合肥工業(yè)大學;2011年

9 蘇庭波;產(chǎn)品評論的意見傾向分類技術研究[D];安徽工業(yè)大學;2011年

10 蔣磊;面向產(chǎn)品評論的意見挖掘關鍵技術研究[D];哈爾濱工業(yè)大學;2010年

【二級參考文獻】

相關期刊論文 前4條

1 孫春玲,尹貽林,嚴玲;專業(yè)協(xié)會對工程管理學科人才培養(yǎng)的介入機制研究[J];高等工程教育研究;2005年05期

2 宋永發(fā),袁永博,吳智敏;國內(nèi)重點高等院校工程管理專業(yè)本科教學計劃比較研究[J];高等建筑教育;2004年03期

3 莫生紅;呂宏芬;李明偉;;層次分析法在市民購房決策中的應用[J];經(jīng)濟論壇;2007年19期

4 Thomas L.SAATY;DECISION MAKING - THE ANALYTIC HIERARCHY AND NETWORK PROCESSES (AHP/ANP)[J];Journal of Systems Science and Systems Engineering;2004年01期

【相似文獻】

相關期刊論文 前10條

1 于薇;;包裝器的自動生成方法介紹[J];才智;2009年28期

2 祝偉華;盧熠;劉斌斌;;基于HMM的Web信息抽取算法的研究與應用[J];計算機科學;2010年02期

3 王立建;尹四清;;基于Web頁面有效信息抽取的分類方法[J];電腦開發(fā)與應用;2010年06期

4 鐘艷花,余偉紅,余永權;Web文本挖掘系統(tǒng)及其關鍵技術研究[J];計算機工程與應用;2003年34期

5 洪流;張巍;肖明軍;蔡慶生;;一種改進的基于HMM的信息抽取模型[J];模式識別與人工智能;2004年03期

6 崔繼馨,張鵬,楊文柱;基于DOM的Web信息抽取[J];河北農(nóng)業(yè)大學學報;2005年03期

7 王勝,朱明;基于最大熵馬爾可夫模型的地址信息抽取[J];計算機工程與應用;2005年21期

8 翟東升,余e,

本文編號:2119759


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2119759.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶e057b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com