天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

面向網(wǎng)頁(yè)文本的地理要素變化檢測(cè)

發(fā)布時(shí)間:2017-09-04 10:15

  本文關(guān)鍵詞:面向網(wǎng)頁(yè)文本的地理要素變化檢測(cè)


  更多相關(guān)文章: 網(wǎng)頁(yè)文本 地理要素變化 信息抽取 網(wǎng)頁(yè)爬蟲 文本解析


【摘要】:地理要素變化檢測(cè)已成為國(guó)家地理信息"十二五"規(guī)劃和全國(guó)地理國(guó)情普查的重要組成部分。網(wǎng)頁(yè)文本中蘊(yùn)含海量的地理要素信息,尤其是新聞、政府、社交平臺(tái)等網(wǎng)站的網(wǎng)頁(yè)文本更新頻繁,可為地理要素變化檢測(cè)提供現(xiàn)勢(shì)性的數(shù)據(jù)源。本文針對(duì)網(wǎng)頁(yè)文本中地理要素變化的語(yǔ)言描述特點(diǎn),構(gòu)建了表達(dá)地理要素變化的語(yǔ)義知識(shí)庫(kù),設(shè)計(jì)了搜索引擎和通用主題相結(jié)合的網(wǎng)頁(yè)爬蟲,實(shí)現(xiàn)了相關(guān)網(wǎng)頁(yè)文本的高效獲取;采用規(guī)則模型和條件隨機(jī)場(chǎng)模型,分別進(jìn)行網(wǎng)頁(yè)文本中地理要素變化信息抽取,包括地理要素名稱、位置(地名)、時(shí)間和屬性等。實(shí)驗(yàn)結(jié)果顯示,本文設(shè)計(jì)的網(wǎng)頁(yè)爬蟲具有較高的相關(guān)網(wǎng)頁(yè)文本獲取能力,地理要素變化信息抽取的準(zhǔn)確率能夠達(dá)到70%以上,但是,語(yǔ)義知識(shí)庫(kù)的完備程度對(duì)于信息抽取性能具有較大影響。研究成果表明,以網(wǎng)頁(yè)文本為數(shù)據(jù)源的地理要素變化信息獲取方法,能提供一種快速檢測(cè)地理要素變化的新途徑,與實(shí)地調(diào)繪和遙感影像檢測(cè)等方法結(jié)合應(yīng)用具有較好的優(yōu)勢(shì)互補(bǔ)性,可作為有力的輔助手段解決地理要素的持續(xù)更新和實(shí)時(shí)更新問題。
【作者單位】: 英國(guó)利茲大學(xué)地理學(xué)院;南京師范大學(xué)虛擬地理環(huán)境教育部重點(diǎn)實(shí)驗(yàn)室;中國(guó)國(guó)家基礎(chǔ)地理信息中心;南京郵電大學(xué)計(jì)算機(jī)學(xué)院;
【關(guān)鍵詞】網(wǎng)頁(yè)文本 地理要素變化 信息抽取 網(wǎng)頁(yè)爬蟲 文本解析
【基金】:國(guó)家測(cè)繪科技項(xiàng)目“網(wǎng)絡(luò)地理信息變化檢測(cè)技術(shù)研究” 國(guó)家自然科學(xué)基金項(xiàng)目(40971231) “863”計(jì)劃項(xiàng)目(2007AA12Z221)
【分類號(hào)】:TP393.092;P207
【正文快照】: 1引言地理要素對(duì)地物現(xiàn)狀描述的準(zhǔn)確性和時(shí)效性直接影響地理信息服務(wù)質(zhì)量。地理信息的核心就是數(shù)據(jù),而數(shù)據(jù)的生命力在于數(shù)據(jù)更新保障,具體體現(xiàn)在數(shù)據(jù)的現(xiàn)勢(shì)性、準(zhǔn)確性和共享性等方面[1]。目前,地理要素變化檢測(cè)主要采用遙感影像檢測(cè)和實(shí)地調(diào)繪兩種手段[2-3],但是,通過遙感影像

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 王迪偉;;基于PDA的1∶10000比例尺地形圖野外調(diào)繪[J];測(cè)繪通報(bào);2010年07期

2 陳軍;王東華;商瑤玲;廖安平;趙仁亮;劉建軍;朱武;李力勐;;國(guó)家1∶50000數(shù)據(jù)庫(kù)更新工程總體設(shè)計(jì)研究與技術(shù)創(chuàng)新[J];測(cè)繪學(xué)報(bào);2010年01期

3 李麗雙;黨延忠;廖文平;黃德根;張穎;;CRF與規(guī)則相結(jié)合的中文地名識(shí)別[J];大連理工大學(xué)學(xué)報(bào);2012年02期

4 錢育華;數(shù)字城鎮(zhèn)的數(shù)據(jù)更新[J];地球信息科學(xué);2002年03期

5 張雪英;閭國(guó)年;李伯秋;陳文君;;基于規(guī)則的中文地址要素解析方法[J];地球信息科學(xué)學(xué)報(bào);2010年01期

6 周立;鄧云青;;城市地理信息系統(tǒng)數(shù)據(jù)更新方式研究[J];地理空間信息;2008年05期

7 閆會(huì)杰;趙巍;;服務(wù)于基礎(chǔ)地理信息數(shù)據(jù)動(dòng)態(tài)更新的網(wǎng)絡(luò)蜘蛛[J];測(cè)繪技術(shù)裝備;2012年02期

8 曾文華;黃樺;;基于網(wǎng)頁(yè)信息檢索的地理信息變化檢測(cè)方法[J];計(jì)算機(jī)應(yīng)用;2010年04期

9 李麗雙;黃德根;陳春榮;楊元生;;SVM與規(guī)則相結(jié)合的中文地名自動(dòng)識(shí)別[J];中文信息學(xué)報(bào);2006年05期

10 高文利;;IERDL—基于關(guān)鍵詞驅(qū)動(dòng)的信息抽取系統(tǒng)的規(guī)則描述語(yǔ)言[J];軟件導(dǎo)刊;2009年10期

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條

1 趙國(guó)榮;中文新聞?wù)Z料中的時(shí)間短語(yǔ)識(shí)別方法研究[D];山西大學(xué);2006年

【共引文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 付艷;楊冬青;唐世渭;伍偉;王騰蛟;高軍;;基于實(shí)體識(shí)別的在線主題檢測(cè)方法[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年02期

2 安曉亞;李穎;孫群;嚴(yán)薇;;面向空間數(shù)據(jù)主動(dòng)更新的地理事件模型研究[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期

3 劉椿年,宋霞;基于Boosting的半結(jié)構(gòu)化信息抽取[J];北京工業(yè)大學(xué)學(xué)報(bào);2005年02期

4 何章鴻;董守斌;;基于XPath的廣告數(shù)據(jù)提取研究[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年02期

5 李玉森;張雪英;袁正午;;面向GIS的地理命名實(shí)體識(shí)別研究[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年06期

6 何友全;徐澄;徐小樂;唐華姣;;一種基于統(tǒng)計(jì)學(xué)特征和DOM樹的網(wǎng)頁(yè)去噪技術(shù)[J];重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年01期

7 張雪穎;杜安麗;安軍;;基礎(chǔ)地理信息數(shù)據(jù)更新的過程質(zhì)量控制[J];測(cè)繪標(biāo)準(zhǔn)化;2011年04期

8 劉勇;李成名;;城市基礎(chǔ)空間數(shù)據(jù)庫(kù)更新方法研究[J];測(cè)繪科學(xué);2006年04期

9 劉昌華;梁洪有;楊麗;張文志;任筱芳;;城市多種地圖一體化綜合測(cè)繪模式分析與研究[J];測(cè)繪科學(xué);2008年05期

10 滕龍妹;;廣域網(wǎng)絡(luò)環(huán)境下的土地資源空間數(shù)據(jù)更新機(jī)制[J];地理信息世界;2009年05期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 陳紅兵;;基于XML的電子政務(wù)信息集成框架[A];2005年“數(shù)字安徽”博士科技論壇論文集[C];2005年

2 李紀(jì)華;夏薇;;基于XML的web信息提取方法研究[A];全國(guó)高校社科信息資料研究會(huì)第六次會(huì)員代表大會(huì)暨第13次學(xué)術(shù)研討會(huì)論文集[C];2010年

3 董俊林;聶偉;楊君英;張春爐;;命名實(shí)體識(shí)別與提取分析[A];邏輯學(xué)及其應(yīng)用研究——第四屆全國(guó)邏輯系統(tǒng)、智能科學(xué)與信息科學(xué)學(xué)術(shù)會(huì)議論文集[C];2008年

4 劉秉權(quán);王喻紅;葛冬梅;李佳;;基于結(jié)構(gòu)樹解析的網(wǎng)頁(yè)正文抽取方法[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2007年學(xué)術(shù)交流年會(huì)論文集[C];2007年

5 ;A Classification Method for Web Information Extraction[A];Proceedings of the First Conference on Web Information System and Applications[C];2004年

6 汪建偉;高軍;王騰蛟;楊冬青;;一種基于顯示屬性的網(wǎng)頁(yè)信息提取方法[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(上冊(cè))[C];2007年

7 葉娜;吳雪軍;朱靖波;陳文亮;;基于相似計(jì)算的信息抽取模板自動(dòng)獲取方法[A];第二屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2004年

8 葉娜;羅海濤;朱靖波;張斌;;基于歸納邏輯編程的多槽信息抽取規(guī)則自動(dòng)學(xué)習(xí)方法[A];全國(guó)第八屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年

9 王鵬;張永奎;;基于新聞網(wǎng)頁(yè)主題要素的網(wǎng)頁(yè)去重方法研究[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年

10 陳禹;史曉東;向曉雯;張潤(rùn)延;;基于混合方法的中文命名實(shí)體識(shí)別[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 鄧斌;B2C在線評(píng)論中的客戶知識(shí)管理研究[D];電子科技大學(xué);2010年

2 荊濤;面向領(lǐng)域網(wǎng)頁(yè)的語(yǔ)義標(biāo)注若干問題研究[D];吉林大學(xué);2011年

3 蔡盈芳;基于本體的航空產(chǎn)品知識(shí)庫(kù)構(gòu)建研究[D];北京交通大學(xué);2011年

4 陳珂銳;基于本體演化的Deep Web數(shù)據(jù)抽取與注釋[D];吉林大學(xué);2011年

5 張海軍;基于大規(guī)模語(yǔ)料的中文新詞識(shí)別技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2011年

6 趙彬彬;多尺度矢量地圖空間目標(biāo)匹配方法及其應(yīng)用研究[D];中南大學(xué);2011年

7 龍華;定義問答檢索關(guān)鍵技術(shù)研究[D];重慶大學(xué);2010年

8 湯步洲;序列標(biāo)注問題的監(jiān)督學(xué)習(xí)方法及應(yīng)用[D];哈爾濱工業(yè)大學(xué);2011年

9 李莎莎;面向搜索引擎的自然語(yǔ)言處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年

10 劉亞清;開放式環(huán)境中的本體演化及其在信息抽取的應(yīng)用研究[D];大連海事大學(xué);2011年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 樊敬川;Deep Web數(shù)據(jù)庫(kù)的選擇研究[D];河北大學(xué);2009年

2 孫嶺;一種基于前綴表達(dá)式的Web信息抽取方法的關(guān)鍵問題的實(shí)現(xiàn)[D];山東科技大學(xué);2010年

3 雷斌;基于Java技術(shù)的智能化搜索引擎的研究與設(shè)計(jì)[D];哈爾濱工程大學(xué);2010年

4 廖文平;基于CRF的中文地名識(shí)別研究[D];大連理工大學(xué);2010年

5 紅霞;基于層疊條件隨機(jī)場(chǎng)的中文機(jī)構(gòu)名識(shí)別的研究[D];大連理工大學(xué);2010年

6 金璐鈺;基于框架的事件抽取關(guān)鍵技術(shù)研究[D];蘇州大學(xué);2010年

7 鐘鴻鵬;基于時(shí)態(tài)信息的網(wǎng)頁(yè)排序系統(tǒng)的研究與實(shí)現(xiàn)[D];華南理工大學(xué);2010年

8 王培正;基于Deep Web的網(wǎng)絡(luò)信息抽取技術(shù)研究[D];華南理工大學(xué);2010年

9 楊曉東;中文命名實(shí)體識(shí)別及若干相關(guān)問題的研究[D];江蘇大學(xué);2010年

10 谷文;基于概念樹的Web信息抽取技術(shù)研究[D];長(zhǎng)春工業(yè)大學(xué);2010年

【二級(jí)參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 朱建偉,王澤民;地理編碼原理及其本地化解決方案[J];北京測(cè)繪;2004年02期

2 鄭新;網(wǎng)絡(luò)信息的安全問題及應(yīng)對(duì)措施[J];商業(yè)研究;2001年10期

3 許捍衛(wèi);移動(dòng)式GIS發(fā)展的關(guān)鍵技術(shù)及應(yīng)用前景[J];測(cè)繪工程;2003年01期

4 王東華;;國(guó)家1∶50000基礎(chǔ)地理數(shù)據(jù)庫(kù)建庫(kù)的技術(shù)研究與實(shí)踐[J];地理信息世界;2006年04期

5 陳軍;趙仁亮;王東華;;基礎(chǔ)地理信息動(dòng)態(tài)更新技術(shù)體系初探[J];地理信息世界;2007年05期

6 趙仁亮;陳軍;王東華;商瑤玲;王中祥;艾廷華;;數(shù)字環(huán)境下的數(shù)據(jù)縮編更新方法[J];地理信息世界;2008年03期

7 孫紅春,王衛(wèi)安;基礎(chǔ)地理信息圖文一體化數(shù)據(jù)模型[J];測(cè)繪通報(bào);2001年01期

8 張鶴;孔令彥;陳倬;孫樂兵;;城市地址編碼發(fā)展歷史及現(xiàn)狀分析[J];測(cè)繪通報(bào);2008年07期

9 陳軍;劉萬(wàn)增;李志林;程濤;趙仁亮;;線目標(biāo)間拓?fù)潢P(guān)系的細(xì)化計(jì)算方法[J];測(cè)繪學(xué)報(bào);2006年03期

10 陳軍;周曉光;;基于拓?fù)渎?lián)動(dòng)的增量更新方法研究——以地籍?dāng)?shù)據(jù)庫(kù)為例[J];測(cè)繪學(xué)報(bào);2008年03期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前5條

1 孫亞夫;陳文斌;;基于分詞的地址匹配技術(shù)[A];中國(guó)地理信息系統(tǒng)協(xié)會(huì)第四次會(huì)員代表大會(huì)暨第十一屆年會(huì)論文集[C];2007年

2 季Y,

本文編號(hào):790902


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/790902.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶bd05b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com