天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于文本地理信息提取的平臺服務(wù)與應(yīng)用研究

發(fā)布時間:2017-06-01 11:12

  本文關(guān)鍵詞:基于文本地理信息提取的平臺服務(wù)與應(yīng)用研究,由筆耕文化傳播整理發(fā)布。


【摘要】:毫無疑問,我們現(xiàn)在已經(jīng)跨入信息時代,數(shù)據(jù)時代人們需要查閱和檢索的信息量也在與日俱增,那么怎樣浩如煙海的數(shù)據(jù)世界里找到其所需的信息就變成了一個越來越重要需要研究的課題當(dāng)今,要處理與日俱增的信息,僅僅通過人工和簡單數(shù)據(jù)庫的方式費(fèi)時費(fèi)力且不太現(xiàn)實(shí)我們需要一種更加智能可靠的方式,更智能的幫助人們查找處理信息數(shù)據(jù),來解決其信息量豐富而知識貧乏的矛盾誠然,目前已經(jīng)出現(xiàn)了很多智能的工具如自動摘要自動文件檢索等語言處理技術(shù),在這些技術(shù)內(nèi)的一個核心關(guān)鍵是主題詞,對于主題詞的提取有助于簡化此類工作,而如何找到主題詞是需要分詞技術(shù)的這也就是當(dāng)前搜索引擎,智能翻譯工具的技術(shù)核心 分詞技術(shù),顧名思義,就是借助計(jì)算機(jī)自動給文本劃分主題詞,使其能夠正確表達(dá)所要表達(dá)的意思同時,值得注意的是,中文不同于西文,沒有空格這個分隔符,同時在中文中充滿了大量的同義詞,相近詞,所以如何給中文分詞是個非常復(fù)雜的問題同時也是一個涉及到語言學(xué)邏輯學(xué)計(jì)算機(jī)科學(xué)自然語言處理認(rèn)知科學(xué)心理學(xué)等諸多領(lǐng)域的技術(shù) 數(shù)據(jù)挖掘技術(shù),是從不同角度分析數(shù)據(jù),并總結(jié)成有用信息的過程,是一個具有巨大潛力的新興技術(shù),能夠幫助企業(yè)收集到他們想要的有關(guān)客戶或者潛在客戶的重要信息絕大部分的網(wǎng)絡(luò)應(yīng)用都是基于數(shù)據(jù)庫來實(shí)現(xiàn),用戶數(shù)據(jù)日益累和科技的更新,最終讓我們進(jìn)入大數(shù)據(jù)時代,如果通過揭露數(shù)據(jù)與數(shù)據(jù)之間看似毫無關(guān)系的秘密隱藏聯(lián)系,通過對過去數(shù)據(jù)的專注預(yù)測未來可能發(fā)生的事情,挖掘其中的價值就是數(shù)據(jù)挖掘被賦予的重要使命 空間數(shù)據(jù)挖掘技術(shù),又稱空間數(shù)據(jù)挖掘和知識發(fā)現(xiàn),是為了解決空間數(shù)據(jù)海量特性而擴(kuò)展的一個新的數(shù)據(jù)挖掘研究分支,是指從空間數(shù)據(jù)庫中提取隱含的用戶感興趣的空間或非空間的模式和普遍特征的過程空間數(shù)據(jù)挖掘的對象主要是空間數(shù)據(jù)庫,而空間數(shù)據(jù)庫中不僅存儲了空間事物或?qū)ο蟮膸缀挝恢眯螤顢?shù)據(jù)屬性數(shù)據(jù)之外,而且還包含了空間事物或?qū)ο笾g的空間拓?fù)潢P(guān)聯(lián)關(guān)系; 地理可視化技術(shù),使用具體的視覺表達(dá)(表現(xiàn)媒質(zhì)是紙計(jì)算機(jī)或者其他介質(zhì))來使空間環(huán)境和問題可視化,從而最大限度地利用與人類視覺能力相關(guān)的信息處理能力,通過結(jié)合科學(xué)可視化,制圖學(xué)和GIS發(fā)展起來的研究方向,目的在于通過 系列可視化技術(shù)使得用戶更好地理解空間數(shù)據(jù),有利于進(jìn)一步探索分析空間數(shù)據(jù)。到目前為止,計(jì)算機(jī)的識別能力仍然不如人類的視覺觀察能力,人類可以迅速而準(zhǔn)確地從圖形圖像中發(fā)現(xiàn)特定的數(shù)據(jù)分布模式。特別是在地理環(huán)境下,人們習(xí)慣處于一個可視化的環(huán)境中分析處理與空間相關(guān)的問題。由于結(jié)合了人敏銳的觀察能力以及可能的用戶專業(yè)知識,交互可視化的SDM可以使得數(shù)據(jù)挖掘過程成為一個互動、可視化、易于理解的重復(fù)過程,而不是完全自動的暗箱操作。這一點(diǎn)對于空間數(shù)據(jù)的探索分析尤為重要。一般而言,人機(jī)交互是最為重要的可視化技術(shù)之一,即時的交互使得空間數(shù)據(jù)分析和知識發(fā)現(xiàn)變得更為人性化和專業(yè)化。因此,地理可視化對于幫助我們分析當(dāng)前數(shù)據(jù)和問題,思考解決問題的方法策略,表達(dá)和解譯空間分析結(jié)果都有十分特殊的意義 那么綜上所述,所謂文本地理信息提取,就是分詞技術(shù)和空間地理信息有機(jī)結(jié)合的衍生,也是空間數(shù)據(jù)挖掘技術(shù)在地理信息領(lǐng)域中的一種具體應(yīng)用的體現(xiàn)。本文首先對分詞技術(shù),數(shù)據(jù)挖掘和空間數(shù)據(jù)挖掘技術(shù),地理可視化等技術(shù)的概念特點(diǎn)介紹闡述。然后基于這些技術(shù),衍生出文本地理信息提取技術(shù)并進(jìn)行了詳細(xì)技術(shù)路線和實(shí)現(xiàn)過程分析。 本研究所做的主要工作如下:(1)研究分詞技術(shù),借助開源算法,集成開發(fā)環(huán)境,輕量級中文分詞API,地理信息系統(tǒng)建立簡單數(shù)據(jù)處理模型,針對地理信息應(yīng)用方面做深入優(yōu)化,提取文本地理信息。 (2)研究數(shù)據(jù)挖掘技術(shù),尤其是空間數(shù)據(jù)挖掘技術(shù),針對空間數(shù)據(jù)庫,研究空間事物或?qū)ο笾g的空間拓?fù)潢P(guān)聯(lián)關(guān)系。探索事物之間的內(nèi)在聯(lián)系,建立簡單空間數(shù)據(jù)模型。 (3)研究地理信息可視化技術(shù),通過前面研究的數(shù)據(jù)成果對其進(jìn)行可視化處理,構(gòu)建簡單交互模型。 (4)最后對文本地理信息構(gòu)建成內(nèi)容服務(wù)以及深入應(yīng)用的可行性進(jìn)行探究。 在研究過程中,所取得的創(chuàng)新點(diǎn)如下: (1)提出了一種文本地理信息提取的方法。基于分詞技術(shù),特別是就漢語言特點(diǎn)的中文分詞技術(shù),提出針對文本地理信息特定優(yōu)化的分詞技術(shù),從而提取文本地理信息,使文本地理分詞精度和處理速度達(dá)到較優(yōu)。 (2)提出了一種基于距離的電子地圖標(biāo)記聚類算法。當(dāng)前主流算法是基于網(wǎng)格的標(biāo)記聚類,其算法優(yōu)點(diǎn)是速度快,實(shí)現(xiàn)簡單,但是精度不夠高,誤差分布廣。 (3)構(gòu)建了一個針對空間地理信息的簡單數(shù)據(jù)挖掘模型。數(shù)據(jù)挖掘作為一門新興技術(shù)在當(dāng)今的研究中更多的是一些理論性質(zhì)的研究,特別是在地理信息領(lǐng)域鮮有建樹,,本文從實(shí)踐的角度探尋和闡述其重要意義
【關(guān)鍵詞】:中文分詞 空間數(shù)據(jù)挖掘 地理信息可視化 地理信息提取 基于距離的電子地圖標(biāo)記聚類
【學(xué)位授予單位】:成都理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.1
【目錄】:
  • 摘要4-7
  • Abstract7-12
  • 第1章 緒論12-23
  • 1.1 研究意義及背景12-14
  • 1.1.1 研究意義12
  • 1.1.2 自然語言處理12
  • 1.1.3 分詞技術(shù)12
  • 1.1.4 數(shù)據(jù)挖掘技術(shù)12-14
  • 1.1.5 地理信息可視化14
  • 1.1.6 文本地理信息提取及顯示14
  • 1.2 國內(nèi)外研究現(xiàn)狀14-20
  • 1.2.1 自然語言處理技術(shù)難點(diǎn)14-15
  • 1.2.2 中文分詞研究方法和技術(shù)瓶頸15-18
  • 1.2.3 數(shù)據(jù)挖掘和地理信息可視化研究現(xiàn)狀18-20
  • 1.3 課題來源20
  • 1.4 研究內(nèi)容20-21
  • 1.5 技術(shù)路線21
  • 1.6 研究過程中所取得的創(chuàng)新和研究成果有:21-22
  • 1.7 論文組織結(jié)構(gòu)22-23
  • 第2章 文本地理信息關(guān)鍵字提取23-42
  • 2.1 文本地理信息初步提取24-35
  • 2.1.1 原子切分24-25
  • 2.1.2 1-最短路徑粗切分25-30
  • 2.1.3 N-最短路徑粗切分30-31
  • 2.1.4 初步分詞31-35
  • 2.2 復(fù)合識別策略35-42
  • 2.2.1 數(shù)字和日期合并等策略35-36
  • 2.2.2 人名和地名識別策略36-38
  • 2.2.3 詞性標(biāo)注和最終結(jié)果38-39
  • 2.2.4 數(shù)據(jù)詞典結(jié)構(gòu)與構(gòu)成模型39-42
  • 第3章 電子地圖標(biāo)記簇研究42-53
  • 3.1 電子地圖標(biāo)記簇的聚類43-45
  • 3.2 地圖視窗管理模式45-47
  • 3.3 電子地圖標(biāo)記簇聚類算法研究47-50
  • 3.3.1 基于網(wǎng)格的聚類算法47-49
  • 3.3.2 基于距離的聚類算法49-50
  • 3.4 電子地圖標(biāo)記簇的應(yīng)用50-53
  • 第4章 基于地理信息的文本挖掘模型構(gòu)建53-64
  • 4.1 文本挖掘概念介紹53-54
  • 4.2 基于地理信息的文本挖掘過程54-56
  • 4.3 文本挖掘關(guān)鍵技術(shù)56-57
  • 4.4 基于地理信息的文本挖掘技術(shù)應(yīng)用研究57-64
  • 第5章 基于文本地理信息提取的平臺服務(wù)設(shè)想64-68
  • 5.1 面向服務(wù)架構(gòu)(SOA-service-oriented architecture)64-65
  • 5.2 Web service65-66
  • 5.3 基于文本地理信息的 SOA 架構(gòu)66-68
  • 結(jié)論68-70
  • 致謝70-71
  • 參考文獻(xiàn)71-73
  • 攻讀學(xué)位期間取得的學(xué)術(shù)成果73

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 王樹良,史文中,李德毅,王新洲;用云解釋空間數(shù)據(jù)挖掘的有關(guān)問題[J];計(jì)算機(jī)工程與應(yīng)用;2003年24期

2 徐勝華;劉紀(jì)平;胡明遠(yuǎn);;空間數(shù)據(jù)挖掘與發(fā)展趨勢探討[J];地理與地理信息科學(xué);2008年03期

3 胡圣武;李鯤鵬;;空間數(shù)據(jù)挖掘的方法進(jìn)展及其問題分析[J];地球科學(xué)與環(huán)境學(xué)報(bào);2008年03期

4 王新華;米飛;馮英春;趙瑋;;空間數(shù)據(jù)挖掘技術(shù)的研究現(xiàn)狀與發(fā)展趨勢[J];計(jì)算機(jī)應(yīng)用研究;2009年07期

5 潘燕芳;王慶光;;空間數(shù)據(jù)挖掘技術(shù)研究[J];福建電腦;2010年02期

6 郭學(xué)軍;;基于空間數(shù)據(jù)挖掘器的空間數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)[J];煤炭技術(shù);2011年05期

7 廖美紅;;基于空間數(shù)據(jù)挖掘的煤礦安全監(jiān)測系統(tǒng)[J];制造業(yè)自動化;2012年24期

8 李丹,高麗;空間數(shù)據(jù)挖掘技術(shù)[J];湖北汽車工業(yè)學(xué)院學(xué)報(bào);1999年03期

9 馬健;;一種新的空間數(shù)據(jù)挖掘系統(tǒng)的分析與研究[J];安康學(xué)院學(xué)報(bào);2014年02期

10 劉宇,曲波,朱仲英,施頌椒;空間數(shù)據(jù)挖掘理論與方法的研究[J];微型電腦應(yīng)用;2000年08期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 孫成忠;趙潤懷;陳士林;哈丹朝魯;劉召芹;;基于聚類的空間數(shù)據(jù)挖掘技術(shù)在中藥資源分析中的應(yīng)用[A];全國第8屆天然藥物資源學(xué)術(shù)研討會論文集[C];2008年

2 郭達(dá)志;何彬彬;;空間數(shù)據(jù)挖掘及其不確定性研究[A];煤炭資源高效綠色開采與數(shù)字礦山學(xué)術(shù)討論會論文集[C];2005年

3 王輝;;城市空間數(shù)據(jù)挖掘方法的研究[A];山東省測繪學(xué)術(shù)年會論文集[C];2006年

4 賈澤露;劉耀林;;可視化空間數(shù)據(jù)挖掘研究綜述[A];《測繪通報(bào)》測繪科學(xué)前沿技術(shù)論壇摘要集[C];2008年

5 王銳;馬德濤;劉曉輝;;基于網(wǎng)格的空間數(shù)據(jù)挖掘研究[A];中國地理信息系統(tǒng)協(xié)會第四次會員代表大會暨第十一屆年會論文集[C];2007年

6 肖予欽;張巨;陳犖;景寧;;空間數(shù)據(jù)挖掘的索引和數(shù)據(jù)訪問方法研究[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2003年

7 彭冶紅;王軍;熊輝;;地球空間數(shù)據(jù)挖掘與知識發(fā)現(xiàn)[A];科技、工程與經(jīng)濟(jì)社會協(xié)調(diào)發(fā)展——河南省第四屆青年學(xué)術(shù)年會論文集(上冊)[C];2004年

8 何撼東;王心源;;地下空間數(shù)據(jù)挖掘與虛擬現(xiàn)實(shí)[A];《測繪通報(bào)》測繪科學(xué)前沿技術(shù)論壇摘要集[C];2008年

9 徐啟昌;裴健;柴瑋;陶有東;楊冬青;唐世渭;;基于空間數(shù)據(jù)挖掘的客戶分析系統(tǒng)原型CASDM[A];第十六屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1999年

10 王銳;馬德濤;;GIS-T中的空間數(shù)據(jù)挖掘研究[A];中國地理信息系統(tǒng)協(xié)會第四次會員代表大會暨第十一屆年會論文集[C];2007年

中國重要報(bào)紙全文數(shù)據(jù)庫 前3條

1 中國科學(xué)院計(jì)算技術(shù)研究所 劉毅勇 何雄 李金山 廖浩均 孟亮 鄧柱中;空間數(shù)據(jù)挖掘:變數(shù)據(jù)為知識[N];計(jì)算機(jī)世界;2005年

2 王銳 白玲 龍波 馬德濤;何為空間數(shù)據(jù)挖掘[N];中國測繪報(bào);2007年

3 張晶晶;地理國情監(jiān)測須“靠譜”[N];中國礦業(yè)報(bào);2013年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 周海燕;空間數(shù)據(jù)挖掘的研究[D];中國人民解放軍信息工程大學(xué);2003年

2 張志兵;空間數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D];華中科技大學(xué);2004年

3 胡彩平;基于空間自相關(guān)的空間數(shù)據(jù)挖掘若干關(guān)鍵技術(shù)的研究[D];南京航空航天大學(xué);2007年

4 陳桂芬;面向精準(zhǔn)農(nóng)業(yè)的空間數(shù)據(jù)挖掘技術(shù)研究與應(yīng)用[D];吉林大學(xué);2009年

5 賈俊杰;空間數(shù)據(jù)挖掘中若干關(guān)鍵技術(shù)研究[D];長安大學(xué);2009年

6 王占全;基于地理信息系統(tǒng)空間數(shù)據(jù)挖掘若干關(guān)鍵技術(shù)的研究[D];浙江大學(xué);2005年

7 李新運(yùn);城市空間數(shù)據(jù)挖掘方法與應(yīng)用研究[D];山東科技大學(xué);2004年

8 樊明輝;空間數(shù)據(jù)挖掘及其可視化系統(tǒng)若干關(guān)鍵技術(shù)研究[D];中國科學(xué)院研究生院(遙感應(yīng)用研究所);2006年

9 席景科;時空孤立點(diǎn)檢測算法研究[D];中國礦業(yè)大學(xué);2010年

10 傅明;基于Web的空間數(shù)據(jù)挖掘研究[D];中南大學(xué);2004年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 崔瑩;多源地質(zhì)空間數(shù)據(jù)挖掘方法及應(yīng)用[D];電子科技大學(xué);2011年

2 劉然;定性空間推理與空間數(shù)據(jù)挖掘技術(shù)[D];重慶大學(xué);2003年

3 楊坤;基于空間數(shù)據(jù)挖掘的超市選址決策研究[D];青島大學(xué);2008年

4 楊清麗;基于空間數(shù)據(jù)挖掘的戰(zhàn)場地理環(huán)境分析系統(tǒng)研究[D];重慶大學(xué);2008年

5 李志建;空間數(shù)據(jù)挖掘原型系統(tǒng)開發(fā)及其應(yīng)用研究[D];中國地質(zhì)大學(xué)(北京);2009年

6 楊蘇寧;空間數(shù)據(jù)挖掘在城市地理信息系統(tǒng)中的應(yīng)用[D];江蘇科技大學(xué);2010年

7 李國鋒;空間數(shù)據(jù)挖掘技術(shù)研究[D];西安電子科技大學(xué);2005年

8 王凌;空間數(shù)據(jù)庫的空間數(shù)據(jù)挖掘技術(shù)研究[D];西安電子科技大學(xué);2005年

9 吳強(qiáng);空間數(shù)據(jù)挖掘中的分類方法及其應(yīng)用研究[D];山東大學(xué);2005年

10 廖曉玉;空間數(shù)據(jù)挖掘在地表水水質(zhì)評價與預(yù)測中的應(yīng)用研究[D];東北師范大學(xué);2006年


  本文關(guān)鍵詞:基于文本地理信息提取的平臺服務(wù)與應(yīng)用研究,由筆耕文化傳播整理發(fā)布。



本文編號:412461

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/412461.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4556a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com