天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

面向Web文本的滑坡災(zāi)害信息提取技術(shù)研究

發(fā)布時(shí)間:2017-03-25 11:13

  本文關(guān)鍵詞:面向Web文本的滑坡災(zāi)害信息提取技術(shù)研究,由筆耕文化傳播整理發(fā)布。


【摘要】:面對滑坡災(zāi)害的威脅,如何獲取充足、準(zhǔn)確、及時(shí)的滑坡災(zāi)害信息,對于研究滑坡災(zāi)害及減少風(fēng)險(xiǎn)具有重要意義;ヂ(lián)網(wǎng)作為一個(gè)擁有海量數(shù)據(jù)與信息的數(shù)據(jù)倉庫,運(yùn)用Web文本提取技術(shù)來實(shí)現(xiàn)滑坡災(zāi)害數(shù)據(jù)的提取,可以有效的提高信息提取的簡易程度及時(shí)效性。本文針對滑坡災(zāi)害信息在網(wǎng)絡(luò)文本中的特點(diǎn),通過研究地名識別、時(shí)間和屬性提取技術(shù),較為系統(tǒng)地探索了Web文本中滑坡災(zāi)害信息提取方法,并開發(fā)了相應(yīng)的原型系統(tǒng),進(jìn)行了實(shí)驗(yàn)驗(yàn)證分析。本文主要研究內(nèi)容和結(jié)論包括以下三個(gè)方面:(1)滑坡災(zāi)害信息Web文本抽。涸O(shè)計(jì)了利用搜索引擎及新聞頁面進(jìn)行滑坡災(zāi)害信息檢索的方法,實(shí)現(xiàn)了滑坡災(zāi)害主題頁面信息的有效提;通過分析滑坡災(zāi)害主題信息的結(jié)構(gòu)性特點(diǎn)以及互聯(lián)網(wǎng)中信息出現(xiàn)規(guī)律設(shè)計(jì)了滑坡災(zāi)害信息主題去重方法;最終運(yùn)用正則表達(dá)式與TMLParse方法相結(jié)合的方式對滑坡信息頁面中災(zāi)害正文信息進(jìn)行有效提取。(2)滑坡災(zāi)害信息分類提。簩⒒聻(zāi)害信息提取類型分為了時(shí)間信息、地名信息、屬性信息三種類型;先運(yùn)用文本分塊與分詞技術(shù)將文本信息進(jìn)行結(jié)構(gòu)化分割,然后針對不同信息類型的信息研究了其信息提取方法,并最終形成了一套有效的滑坡災(zāi)害信息提取技術(shù)。(3)滑坡災(zāi)害提取系統(tǒng)實(shí)現(xiàn)和實(shí)驗(yàn)驗(yàn)證:在以上技術(shù)研究的基礎(chǔ)上,利用.Net開發(fā)平臺與Html技術(shù)設(shè)計(jì)了滑坡災(zāi)害信息提取系統(tǒng),主要實(shí)現(xiàn)了滑坡災(zāi)害信息提取、信息提取規(guī)則庫管理、滑坡信息地圖展示等功能,并以四川地區(qū)為樣例,進(jìn)行了實(shí)驗(yàn)驗(yàn)證與結(jié)果分析。通過本文研究表明,利用互聯(lián)網(wǎng)中的文本數(shù)據(jù)可以有效的提取滑坡災(zāi)害信息數(shù)據(jù),能成為一種有效的滑坡災(zāi)害信息發(fā)現(xiàn)的輔助手段。由于災(zāi)害信息文本內(nèi)容的豐富性,運(yùn)用人工整理的規(guī)則與統(tǒng)計(jì)的方式進(jìn)行災(zāi)害信息提取存在一定的局限性。此外,網(wǎng)絡(luò)中災(zāi)害信息的描述并不直接,具有模糊性與不確定性,需要結(jié)合其他滑坡災(zāi)害信息提取方式進(jìn)行進(jìn)一步數(shù)據(jù)整合。
【關(guān)鍵詞】:滑坡 災(zāi)害 Web文本 信息提取 規(guī)則
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.1;P642.22
【目錄】:
  • 摘要6-7
  • ABSTRACT7-11
  • 第1章 緒論11-20
  • 1.1 研究背景及意義11-12
  • 1.2 研究現(xiàn)狀及進(jìn)展12-16
  • 1.2.1 災(zāi)害信息提取技術(shù)研究進(jìn)展12-13
  • 1.2.2 災(zāi)害信息提取應(yīng)用現(xiàn)狀13-16
  • 1.3 研究目標(biāo)及內(nèi)容16-17
  • 1.3.1 研究目標(biāo)16
  • 1.3.2 研究內(nèi)容16-17
  • 1.4 技術(shù)路線17-18
  • 1.5 論文組織與結(jié)構(gòu)18-20
  • 第2章 滑坡災(zāi)害信息的web文本抽取20-35
  • 2.1 滑坡信息檢索方法21-26
  • 2.1.1 滑坡信息的主題特征歸納21-23
  • 2.1.2 基于百度新聞搜索的滑坡網(wǎng)頁獲取23-26
  • 2.2 網(wǎng)頁主題信息過濾與去重26-30
  • 2.2.1 圖像視頻信息頁面過濾27-28
  • 2.2.2 文本主題信息去重28-30
  • 2.3 網(wǎng)頁正文提取方法30-34
  • 2.3.1 基于正則表達(dá)式的信息解析31-33
  • 2.3.2 使用HTMLParse技術(shù)提取網(wǎng)頁正文33-34
  • 2.4 小結(jié)34-35
  • 第3章 Web文本中滑坡災(zāi)害相關(guān)信息提取35-53
  • 3.1 文本信息結(jié)構(gòu)化處理35-38
  • 3.1.1 文本分塊處理35-36
  • 3.1.2 文本分詞處理36-38
  • 3.2 滑坡災(zāi)害發(fā)生時(shí)間信息抽取38-41
  • 3.2.1 時(shí)間表達(dá)式提取與轉(zhuǎn)換38-40
  • 3.2.2 災(zāi)害時(shí)間信息有效性篩選40-41
  • 3.3 地理位置信息提取41-49
  • 3.3.1 地名提取42-44
  • 3.3.2 災(zāi)害發(fā)生地名組合與篩選44-45
  • 3.3.3 地名與地理位置匹配45-49
  • 3.4 災(zāi)害屬性信息提取49-52
  • 3.4.1 滑坡災(zāi)害屬性采集規(guī)則庫49-50
  • 3.4.2 屬性信息抽取50-52
  • 3.5 小結(jié)52-53
  • 第4章 滑坡災(zāi)害信息提取系統(tǒng)實(shí)現(xiàn)及實(shí)驗(yàn)驗(yàn)證53-65
  • 4.1 系統(tǒng)設(shè)計(jì)及框架結(jié)構(gòu)53-55
  • 4.1.1 系統(tǒng)設(shè)計(jì)53-54
  • 4.1.2 系統(tǒng)框架結(jié)構(gòu)54-55
  • 4.2 系統(tǒng)主要功能55-62
  • 4.2.1 系統(tǒng)登錄55-56
  • 4.2.2 系統(tǒng)管理模塊56-57
  • 4.2.3 信息提取模塊57-61
  • 4.2.4 規(guī)則庫管理61
  • 4.2.5 地圖展示61-62
  • 4.3 實(shí)驗(yàn)驗(yàn)證及分析62-64
  • 4.4 小結(jié)64-65
  • 總結(jié)與展望65-67
  • 總結(jié)65
  • 展望65-67
  • 致謝67-68
  • 參考文獻(xiàn)68-72
  • 攻讀碩士學(xué)位期間發(fā)表的論文72

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 劉元鳳;周榮福;李鳳玲;;基于文本的地理空間數(shù)據(jù)挖掘與可視化[J];測繪科學(xué);2010年04期

2 閆會杰;趙巍;;服務(wù)于基礎(chǔ)地理信息數(shù)據(jù)動態(tài)更新的網(wǎng)絡(luò)蜘蛛[J];測繪技術(shù)裝備;2012年02期

3 余麗;陸鋒;張恒才;;網(wǎng)絡(luò)文本蘊(yùn)涵地理信息抽取:研究進(jìn)展與展望[J];地球信息科學(xué)學(xué)報(bào);2015年02期

4 黃德根,岳廣玲,楊元生;基于統(tǒng)計(jì)的中文地名識別[J];中文信息學(xué)報(bào);2003年02期

5 鄒濤,戚廣智,蔡麗娟,張福炎;網(wǎng)絡(luò)信息挖掘系統(tǒng)IDGS的實(shí)現(xiàn)[J];南京大學(xué)學(xué)報(bào)(自然科學(xué)版);2000年02期

6 劉磊;李壯;張鑫;呂帥;;中文網(wǎng)絡(luò)文本的語義信息處理研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2015年01期

7 唐旭日;陳小荷;張雪英;;中文文本的地名解析方法研究[J];武漢大學(xué)學(xué)報(bào)(信息科學(xué)版);2010年08期

8 胡國晴;李建華;;一種基于可信度分析的Web頁面新屬性發(fā)現(xiàn)方法[J];計(jì)算機(jī)技術(shù)與發(fā)展;2009年01期

9 周合明;奚建清;;基于模板的Web信息提取系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年11期

10 李麗雙,黃德根,陳春榮,楊元生;用支持向量機(jī)進(jìn)行中文地名識別的研究[J];小型微型計(jì)算機(jī)系統(tǒng);2005年08期


  本文關(guān)鍵詞:面向Web文本的滑坡災(zāi)害信息提取技術(shù)研究,,由筆耕文化傳播整理發(fā)布。



本文編號:267109

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/267109.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶007cf***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com