天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

面向網(wǎng)頁文本的地理要素變化檢測

發(fā)布時(shí)間:2017-09-04 10:15

  本文關(guān)鍵詞:面向網(wǎng)頁文本的地理要素變化檢測


  更多相關(guān)文章: 網(wǎng)頁文本 地理要素變化 信息抽取 網(wǎng)頁爬蟲 文本解析


【摘要】:地理要素變化檢測已成為國家地理信息"十二五"規(guī)劃和全國地理國情普查的重要組成部分。網(wǎng)頁文本中蘊(yùn)含海量的地理要素信息,尤其是新聞、政府、社交平臺等網(wǎng)站的網(wǎng)頁文本更新頻繁,可為地理要素變化檢測提供現(xiàn)勢性的數(shù)據(jù)源。本文針對網(wǎng)頁文本中地理要素變化的語言描述特點(diǎn),構(gòu)建了表達(dá)地理要素變化的語義知識庫,設(shè)計(jì)了搜索引擎和通用主題相結(jié)合的網(wǎng)頁爬蟲,實(shí)現(xiàn)了相關(guān)網(wǎng)頁文本的高效獲取;采用規(guī)則模型和條件隨機(jī)場模型,分別進(jìn)行網(wǎng)頁文本中地理要素變化信息抽取,包括地理要素名稱、位置(地名)、時(shí)間和屬性等。實(shí)驗(yàn)結(jié)果顯示,本文設(shè)計(jì)的網(wǎng)頁爬蟲具有較高的相關(guān)網(wǎng)頁文本獲取能力,地理要素變化信息抽取的準(zhǔn)確率能夠達(dá)到70%以上,但是,語義知識庫的完備程度對于信息抽取性能具有較大影響。研究成果表明,以網(wǎng)頁文本為數(shù)據(jù)源的地理要素變化信息獲取方法,能提供一種快速檢測地理要素變化的新途徑,與實(shí)地調(diào)繪和遙感影像檢測等方法結(jié)合應(yīng)用具有較好的優(yōu)勢互補(bǔ)性,可作為有力的輔助手段解決地理要素的持續(xù)更新和實(shí)時(shí)更新問題。
【作者單位】: 英國利茲大學(xué)地理學(xué)院;南京師范大學(xué)虛擬地理環(huán)境教育部重點(diǎn)實(shí)驗(yàn)室;中國國家基礎(chǔ)地理信息中心;南京郵電大學(xué)計(jì)算機(jī)學(xué)院;
【關(guān)鍵詞】網(wǎng)頁文本 地理要素變化 信息抽取 網(wǎng)頁爬蟲 文本解析
【基金】:國家測繪科技項(xiàng)目“網(wǎng)絡(luò)地理信息變化檢測技術(shù)研究” 國家自然科學(xué)基金項(xiàng)目(40971231) “863”計(jì)劃項(xiàng)目(2007AA12Z221)
【分類號】:TP393.092;P207
【正文快照】: 1引言地理要素對地物現(xiàn)狀描述的準(zhǔn)確性和時(shí)效性直接影響地理信息服務(wù)質(zhì)量。地理信息的核心就是數(shù)據(jù),而數(shù)據(jù)的生命力在于數(shù)據(jù)更新保障,具體體現(xiàn)在數(shù)據(jù)的現(xiàn)勢性、準(zhǔn)確性和共享性等方面[1]。目前,地理要素變化檢測主要采用遙感影像檢測和實(shí)地調(diào)繪兩種手段[2-3],但是,通過遙感影像

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 王迪偉;;基于PDA的1∶10000比例尺地形圖野外調(diào)繪[J];測繪通報(bào);2010年07期

2 陳軍;王東華;商瑤玲;廖安平;趙仁亮;劉建軍;朱武;李力勐;;國家1∶50000數(shù)據(jù)庫更新工程總體設(shè)計(jì)研究與技術(shù)創(chuàng)新[J];測繪學(xué)報(bào);2010年01期

3 李麗雙;黨延忠;廖文平;黃德根;張穎;;CRF與規(guī)則相結(jié)合的中文地名識別[J];大連理工大學(xué)學(xué)報(bào);2012年02期

4 錢育華;數(shù)字城鎮(zhèn)的數(shù)據(jù)更新[J];地球信息科學(xué);2002年03期

5 張雪英;閭國年;李伯秋;陳文君;;基于規(guī)則的中文地址要素解析方法[J];地球信息科學(xué)學(xué)報(bào);2010年01期

6 周立;鄧云青;;城市地理信息系統(tǒng)數(shù)據(jù)更新方式研究[J];地理空間信息;2008年05期

7 閆會杰;趙巍;;服務(wù)于基礎(chǔ)地理信息數(shù)據(jù)動態(tài)更新的網(wǎng)絡(luò)蜘蛛[J];測繪技術(shù)裝備;2012年02期

8 曾文華;黃樺;;基于網(wǎng)頁信息檢索的地理信息變化檢測方法[J];計(jì)算機(jī)應(yīng)用;2010年04期

9 李麗雙;黃德根;陳春榮;楊元生;;SVM與規(guī)則相結(jié)合的中文地名自動識別[J];中文信息學(xué)報(bào);2006年05期

10 高文利;;IERDL—基于關(guān)鍵詞驅(qū)動的信息抽取系統(tǒng)的規(guī)則描述語言[J];軟件導(dǎo)刊;2009年10期

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 趙國榮;中文新聞?wù)Z料中的時(shí)間短語識別方法研究[D];山西大學(xué);2006年

【共引文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 付艷;楊冬青;唐世渭;伍偉;王騰蛟;高軍;;基于實(shí)體識別的在線主題檢測方法[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年02期

2 安曉亞;李穎;孫群;嚴(yán)薇;;面向空間數(shù)據(jù)主動更新的地理事件模型研究[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期

3 劉椿年,宋霞;基于Boosting的半結(jié)構(gòu)化信息抽取[J];北京工業(yè)大學(xué)學(xué)報(bào);2005年02期

4 何章鴻;董守斌;;基于XPath的廣告數(shù)據(jù)提取研究[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年02期

5 李玉森;張雪英;袁正午;;面向GIS的地理命名實(shí)體識別研究[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年06期

6 何友全;徐澄;徐小樂;唐華姣;;一種基于統(tǒng)計(jì)學(xué)特征和DOM樹的網(wǎng)頁去噪技術(shù)[J];重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期

7 張雪穎;杜安麗;安軍;;基礎(chǔ)地理信息數(shù)據(jù)更新的過程質(zhì)量控制[J];測繪標(biāo)準(zhǔn)化;2011年04期

8 劉勇;李成名;;城市基礎(chǔ)空間數(shù)據(jù)庫更新方法研究[J];測繪科學(xué);2006年04期

9 劉昌華;梁洪有;楊麗;張文志;任筱芳;;城市多種地圖一體化綜合測繪模式分析與研究[J];測繪科學(xué);2008年05期

10 滕龍妹;;廣域網(wǎng)絡(luò)環(huán)境下的土地資源空間數(shù)據(jù)更新機(jī)制[J];地理信息世界;2009年05期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 陳紅兵;;基于XML的電子政務(wù)信息集成框架[A];2005年“數(shù)字安徽”博士科技論壇論文集[C];2005年

2 李紀(jì)華;夏薇;;基于XML的web信息提取方法研究[A];全國高校社科信息資料研究會第六次會員代表大會暨第13次學(xué)術(shù)研討會論文集[C];2010年

3 董俊林;聶偉;楊君英;張春爐;;命名實(shí)體識別與提取分析[A];邏輯學(xué)及其應(yīng)用研究——第四屆全國邏輯系統(tǒng)、智能科學(xué)與信息科學(xué)學(xué)術(shù)會議論文集[C];2008年

4 劉秉權(quán);王喻紅;葛冬梅;李佳;;基于結(jié)構(gòu)樹解析的網(wǎng)頁正文抽取方法[A];黑龍江省計(jì)算機(jī)學(xué)會2007年學(xué)術(shù)交流年會論文集[C];2007年

5 ;A Classification Method for Web Information Extraction[A];Proceedings of the First Conference on Web Information System and Applications[C];2004年

6 汪建偉;高軍;王騰蛟;楊冬青;;一種基于顯示屬性的網(wǎng)頁信息提取方法[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會論文集(上冊)[C];2007年

7 葉娜;吳雪軍;朱靖波;陳文亮;;基于相似計(jì)算的信息抽取模板自動獲取方法[A];第二屆全國學(xué)生計(jì)算語言學(xué)研討會論文集[C];2004年

8 葉娜;羅海濤;朱靖波;張斌;;基于歸納邏輯編程的多槽信息抽取規(guī)則自動學(xué)習(xí)方法[A];全國第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年

9 王鵬;張永奎;;基于新聞網(wǎng)頁主題要素的網(wǎng)頁去重方法研究[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集[C];2006年

10 陳禹;史曉東;向曉雯;張潤延;;基于混合方法的中文命名實(shí)體識別[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會議論文集[C];2007年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 鄧斌;B2C在線評論中的客戶知識管理研究[D];電子科技大學(xué);2010年

2 荊濤;面向領(lǐng)域網(wǎng)頁的語義標(biāo)注若干問題研究[D];吉林大學(xué);2011年

3 蔡盈芳;基于本體的航空產(chǎn)品知識庫構(gòu)建研究[D];北京交通大學(xué);2011年

4 陳珂銳;基于本體演化的Deep Web數(shù)據(jù)抽取與注釋[D];吉林大學(xué);2011年

5 張海軍;基于大規(guī)模語料的中文新詞識別技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2011年

6 趙彬彬;多尺度矢量地圖空間目標(biāo)匹配方法及其應(yīng)用研究[D];中南大學(xué);2011年

7 龍華;定義問答檢索關(guān)鍵技術(shù)研究[D];重慶大學(xué);2010年

8 湯步洲;序列標(biāo)注問題的監(jiān)督學(xué)習(xí)方法及應(yīng)用[D];哈爾濱工業(yè)大學(xué);2011年

9 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年

10 劉亞清;開放式環(huán)境中的本體演化及其在信息抽取的應(yīng)用研究[D];大連海事大學(xué);2011年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 樊敬川;Deep Web數(shù)據(jù)庫的選擇研究[D];河北大學(xué);2009年

2 孫嶺;一種基于前綴表達(dá)式的Web信息抽取方法的關(guān)鍵問題的實(shí)現(xiàn)[D];山東科技大學(xué);2010年

3 雷斌;基于Java技術(shù)的智能化搜索引擎的研究與設(shè)計(jì)[D];哈爾濱工程大學(xué);2010年

4 廖文平;基于CRF的中文地名識別研究[D];大連理工大學(xué);2010年

5 紅霞;基于層疊條件隨機(jī)場的中文機(jī)構(gòu)名識別的研究[D];大連理工大學(xué);2010年

6 金璐鈺;基于框架的事件抽取關(guān)鍵技術(shù)研究[D];蘇州大學(xué);2010年

7 鐘鴻鵬;基于時(shí)態(tài)信息的網(wǎng)頁排序系統(tǒng)的研究與實(shí)現(xiàn)[D];華南理工大學(xué);2010年

8 王培正;基于Deep Web的網(wǎng)絡(luò)信息抽取技術(shù)研究[D];華南理工大學(xué);2010年

9 楊曉東;中文命名實(shí)體識別及若干相關(guān)問題的研究[D];江蘇大學(xué);2010年

10 谷文;基于概念樹的Web信息抽取技術(shù)研究[D];長春工業(yè)大學(xué);2010年

【二級參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 朱建偉,王澤民;地理編碼原理及其本地化解決方案[J];北京測繪;2004年02期

2 鄭新;網(wǎng)絡(luò)信息的安全問題及應(yīng)對措施[J];商業(yè)研究;2001年10期

3 許捍衛(wèi);移動式GIS發(fā)展的關(guān)鍵技術(shù)及應(yīng)用前景[J];測繪工程;2003年01期

4 王東華;;國家1∶50000基礎(chǔ)地理數(shù)據(jù)庫建庫的技術(shù)研究與實(shí)踐[J];地理信息世界;2006年04期

5 陳軍;趙仁亮;王東華;;基礎(chǔ)地理信息動態(tài)更新技術(shù)體系初探[J];地理信息世界;2007年05期

6 趙仁亮;陳軍;王東華;商瑤玲;王中祥;艾廷華;;數(shù)字環(huán)境下的數(shù)據(jù)縮編更新方法[J];地理信息世界;2008年03期

7 孫紅春,王衛(wèi)安;基礎(chǔ)地理信息圖文一體化數(shù)據(jù)模型[J];測繪通報(bào);2001年01期

8 張鶴;孔令彥;陳倬;孫樂兵;;城市地址編碼發(fā)展歷史及現(xiàn)狀分析[J];測繪通報(bào);2008年07期

9 陳軍;劉萬增;李志林;程濤;趙仁亮;;線目標(biāo)間拓?fù)潢P(guān)系的細(xì)化計(jì)算方法[J];測繪學(xué)報(bào);2006年03期

10 陳軍;周曉光;;基于拓?fù)渎?lián)動的增量更新方法研究——以地籍?dāng)?shù)據(jù)庫為例[J];測繪學(xué)報(bào);2008年03期

中國重要會議論文全文數(shù)據(jù)庫 前5條

1 孫亞夫;陳文斌;;基于分詞的地址匹配技術(shù)[A];中國地理信息系統(tǒng)協(xié)會第四次會員代表大會暨第十一屆年會論文集[C];2007年

2 季Y,

本文編號:790902


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/790902.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶bd05b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com