邏輯回歸空間加權(quán)技術(shù)及其在礦產(chǎn)資源信息綜合中的應(yīng)用
本文關(guān)鍵詞:邏輯回歸空間加權(quán)技術(shù)及其在礦產(chǎn)資源信息綜合中的應(yīng)用
更多相關(guān)文章: GIS空間分析 空間加權(quán) 邏輯回歸 證據(jù)權(quán) 各向異性 缺失數(shù)據(jù) 礦產(chǎn)資源信息綜合
【摘要】:綜合地質(zhì)、地球化學(xué)、地球物理以及遙感等多方數(shù)據(jù)是提高成礦預(yù)測的精度重要途徑。自國際地球科學(xué)聯(lián)合會(huì)1978年推薦6種礦產(chǎn)資源評價(jià)與預(yù)測方法以來,各種信息綜合方法被引入成礦預(yù)測。由于成礦預(yù)測是對礦床是否發(fā)生這一二值事件進(jìn)行的預(yù)測,以后驗(yàn)概率為計(jì)算結(jié)果的log-linear模型被廣泛應(yīng)用于礦產(chǎn)資源預(yù)測與評價(jià)領(lǐng)域。目前證據(jù)權(quán)和邏輯回歸是礦產(chǎn)資源評價(jià)與預(yù)測中最常見的信息綜合定量方法。與傳統(tǒng)統(tǒng)計(jì)預(yù)測不同的是,成礦預(yù)測屬于空間統(tǒng)計(jì)預(yù)測范疇,表現(xiàn)在成礦預(yù)測要素和成礦事件具有空間位置屬性。礦產(chǎn)資源定量預(yù)測和評價(jià)很早就開始基于GIS平臺(tái)進(jìn)行,并且一些預(yù)測要素的構(gòu)建是通過空間疊加分析、緩沖區(qū)分析等得到的。然而,一些更加復(fù)雜形式的空間關(guān)系并未在預(yù)測模型中得到有效表達(dá),如空間變量的集聚性和趨勢性。地質(zhì)過程的復(fù)雜性和成礦作用的多期次性使得成礦預(yù)測要素的空間分布呈結(jié)構(gòu)性、非平穩(wěn)性和奇異性,基于經(jīng)典統(tǒng)計(jì)方法建立的成礦信息提取和綜合模型往往存在偏差。加拿大地質(zhì)調(diào)查局Agterberg教授于上個(gè)世紀(jì)60年代末至70年代初就注意到礦產(chǎn)資源預(yù)測中些地質(zhì)變量具有空間趨勢,并會(huì)造成預(yù)測結(jié)果存在系統(tǒng)誤差,對此他提出在預(yù)測模型中引入位置變量以構(gòu)建不同階的空間趨勢。我國學(xué)者成秋明教授則關(guān)注到礦點(diǎn)分布具有空間集聚性,這種集聚性具有分形分布特點(diǎn),為此提出了分形證據(jù)權(quán)模型。近年來,地理加權(quán)回歸模型在經(jīng)濟(jì)地理學(xué)領(lǐng)域興起。該模型采用基于鄰近樣點(diǎn)建立的模型對當(dāng)前點(diǎn)進(jìn)行預(yù)測,且鄰近程度被轉(zhuǎn)化為樣點(diǎn)在預(yù)測模型中的權(quán)重。這實(shí)際上是一種融合了地理學(xué)第一定律的空間變系數(shù)模型。由于采用了局部窗口的思想,地理加權(quán)回歸模型有效克改善了全局模型不能很好克服空間非平穩(wěn)性的缺點(diǎn)。相比于地理加權(quán)線性回歸模型,地理加權(quán)邏輯回歸模型在礦產(chǎn)資源定量預(yù)測預(yù)評價(jià)領(lǐng)域還鮮有報(bào)道。如前所述,成礦預(yù)測的研究對象屬于二值事件,log-linear模型顯然更適用。因此本文將在成礦預(yù)測中引入地理加權(quán)邏輯回歸模型。廣義來說,地理加權(quán)屬于空間加權(quán)的一種形式,后者還包括基于感興趣目標(biāo)的加權(quán),以及基于研究程度的加權(quán)等。由于在成礦預(yù)測中存在著研究區(qū)勘查程度的差異,在建立預(yù)測模型時(shí)對研究區(qū)籠統(tǒng)對待是不科學(xué)的。本研究將考慮區(qū)域研究程度差異,并量化為空間權(quán)重。因此,本研究所指空間加權(quán)技術(shù)實(shí)際上包含了局部窗口權(quán)重和全局權(quán)重兩部分,前者通過地理權(quán)重體現(xiàn),后者則表現(xiàn)在研究區(qū)勘探程度或感興趣目標(biāo)等差異。缺失數(shù)據(jù)是包括成礦預(yù)測在內(nèi)所有空間評價(jià)與預(yù)測領(lǐng)域常見的一個(gè)問題,缺失數(shù)據(jù)的常見處理方法有三種,一是去除含有缺失數(shù)據(jù)的樣本,二是去除含有缺失數(shù)據(jù)的變量,三是用變量均值代替缺失值。證據(jù)權(quán)模型提供了另外一種解決方案,它用正負(fù)權(quán)重代替原始的1和0值,并用0權(quán)重代替缺失值。相比于去除含有缺失值的樣本或變量,平均值方案和證據(jù)權(quán)方案顯然避免了不必要的信息丟失;而前人研究表明,證據(jù)權(quán)缺失數(shù)據(jù)處理方案優(yōu)于平均值。此外,證據(jù)權(quán)模型還包含了一套連續(xù)變量二值化(離散化)方案,在成礦預(yù)測中被廣泛采用。本研究所開發(fā)的空間加權(quán)邏輯回歸模塊采用了證據(jù)權(quán)模型中缺失數(shù)據(jù)處理和離散變量二值化的做法。條件獨(dú)立性是成礦預(yù)測證據(jù)權(quán)模型的基本假設(shè)前提。如果不滿足這一假設(shè),不僅會(huì)造成后驗(yàn)概率估計(jì)值的絕對偏差,也會(huì)造成后驗(yàn)概率排序的差異,進(jìn)而影響遠(yuǎn)景靶區(qū)圈定。邏輯回歸模型則無需條件獨(dú)立性假設(shè),它需要滿足相對寬松的假設(shè)。本研究所發(fā)展的空間加權(quán)邏輯回歸模型實(shí)際上融合了證據(jù)權(quán)和邏輯回歸兩種模型的上述優(yōu)點(diǎn),并且賦予其空間加權(quán)模型的特點(diǎn)。本研究的具體內(nèi)容為:(1)成礦預(yù)測中常用log-linear模型各自優(yōu)缺點(diǎn)及相互關(guān)系研究樸素貝葉斯模型是證據(jù)權(quán)模型和邏輯回歸模型等log-linear模型的基礎(chǔ)模型,這三種模型有各自不同的基本假設(shè)和適用條件。一些文獻(xiàn)將證據(jù)權(quán)模型與樸素貝葉斯模型的基本假設(shè)等同是錯(cuò)誤的,它們忽略了證據(jù)權(quán)模型對于條件獨(dú)立性的進(jìn)一步放寬,實(shí)際上證據(jù)權(quán)模型需要滿足的是一種弱條件獨(dú)立性假設(shè)。盡管如此,想要滿足證據(jù)權(quán)模型的基本假設(shè)仍然有一定困難。而邏輯回歸模型所需基本假設(shè)進(jìn)一步放寬。由于采用極大似然法對后驗(yàn)概率進(jìn)行估計(jì),即使在不滿足條件獨(dú)立性假設(shè)或弱條件獨(dú)立性假設(shè)的條件下,邏輯回歸也總能得到預(yù)測礦點(diǎn)數(shù)與實(shí)際礦點(diǎn)數(shù)相等的結(jié)果。證據(jù)權(quán)模型具有形式簡單和易于操作等優(yōu)點(diǎn),并且提供了缺失數(shù)據(jù)處理和數(shù)據(jù)離散化(二值化)功能,其最大缺點(diǎn)就是需要滿足(弱)條件獨(dú)立性假設(shè),因此一些學(xué)者希望借鑒其它模型對其進(jìn)行改進(jìn),這其中就包括借鑒邏輯回歸對證據(jù)權(quán)模型進(jìn)行改進(jìn)的研究。Deng(2009)的改進(jìn)模型可以在一定程度削不滿足弱條件獨(dú)立性假設(shè)對預(yù)測模型的影響,但是該改進(jìn)模型存在數(shù)學(xué)推導(dǎo)錯(cuò)誤.Agterberg(2011)的改進(jìn)模型真正融合了證據(jù)權(quán)與邏輯回歸這兩種模型,該模型實(shí)際上既包含基于邏輯回歸模型對證據(jù)權(quán)模型的改進(jìn),也包含基于證據(jù)權(quán)模型對邏輯回歸模型的改進(jìn),兩者結(jié)果完全等價(jià)。在沒有缺失數(shù)據(jù)存在的情況下,Agterberg (2011)的改進(jìn)模型與一般邏輯回歸模型等價(jià);當(dāng)存在缺失數(shù)據(jù)時(shí),該改進(jìn)模型優(yōu)于一般的邏輯回歸模型。而透過該改進(jìn)模型還可以建立證據(jù)權(quán)模型與邏輯回歸模型之間的關(guān)系,本研究將采用這種融入證據(jù)權(quán)和邏輯回歸兩種模型特點(diǎn)的改進(jìn)模型,并與空間加權(quán)技術(shù)結(jié)合,成為新的空間加權(quán)邏輯回歸模型。(2)空間加權(quán)技術(shù)與成礦信息綜合詳細(xì)論述了空間非平穩(wěn)性對于成礦信息提取、綜合預(yù)測和覆蓋區(qū)找礦的影響,論證成礦預(yù)測中采用空間加權(quán)技術(shù)的理論依據(jù)和現(xiàn)實(shí)意義;仡櫫饲叭藢臻g非平穩(wěn)性的研究,以及對空間變量趨勢性、結(jié)構(gòu)性和奇異性特點(diǎn)所采取的應(yīng)對措施,討論了現(xiàn)有空間加權(quán)技術(shù)的形式和特點(diǎn),包括地理加權(quán)和感興趣目標(biāo)加權(quán)等。由于成礦預(yù)測中使用的變量具有空間非平穩(wěn)性,需要考慮空間趨勢對于預(yù)測結(jié)果的影響;由于成礦預(yù)測區(qū)存在勘察程度的差異,需要考慮樣本之間的差異性。因此,引入空間加權(quán)技術(shù)是十分必要。最后討論了空間加權(quán)的具體形式。(3)邏輯回歸空間加權(quán)技術(shù)實(shí)現(xiàn)和軟件模塊開發(fā)首先在數(shù)學(xué)層面討論了空間加權(quán)邏輯回歸技術(shù)的實(shí)現(xiàn),包括地理權(quán)重的計(jì)算、研究程度權(quán)重的計(jì)算以及兩種權(quán)重的綜合。接著敘述了空間加權(quán)邏輯回歸模型的功能設(shè)計(jì)過程,包括變量數(shù)據(jù)二值化(離散化)的實(shí)現(xiàn)、缺失數(shù)據(jù)的處理方案,同時(shí)提供了基于地質(zhì)統(tǒng)計(jì)學(xué)變差函數(shù)模型確定局部窗口大小、形狀和權(quán)重衰減形式的方案,以及基于空間t統(tǒng)計(jì)量的帶寬優(yōu)化方案。最后介紹了具體的算法設(shè)計(jì)和實(shí)現(xiàn),包括局部窗口參數(shù)的設(shè)計(jì)和模板的構(gòu)建,以及該模塊實(shí)現(xiàn)的整體流程。(4)實(shí)例研究和對比研究以加拿大新斯科舍省西南Rossignol湖周圍地區(qū)濁積巖型金礦成礦預(yù)測為例,詳細(xì)闡述了邏輯回歸空間加權(quán)技術(shù)在礦產(chǎn)資源信息綜合中的應(yīng)用。同時(shí)基于空間t統(tǒng)計(jì)量和預(yù)測效率比較了空間加權(quán)邏輯回歸模型與證據(jù)權(quán)模型、邏輯回歸模型在成礦預(yù)測中的表現(xiàn)。此外在人為構(gòu)建了缺失數(shù)據(jù)環(huán)境下,比較了這些模型的預(yù)測效果。結(jié)果顯示,空間加權(quán)邏輯回歸模型在本案例中的表現(xiàn)全面優(yōu)于基于全局?jǐn)?shù)據(jù)建立的證據(jù)權(quán)模型和邏輯回歸模型。論文的主要?jiǎng)?chuàng)新點(diǎn)如下:(1)使用GIS空間加權(quán)技術(shù)對加權(quán)邏輯回歸模型進(jìn)行擴(kuò)展,以更好處理空間非平穩(wěn)和各向異性環(huán)境下的礦產(chǎn)資源信息綜合預(yù)測。所使用的空間加權(quán)技術(shù)包含了地理加權(quán)和其它形式加權(quán),如研究區(qū)勘察程度。(2)探索空間各向異性加權(quán)方案,并以地質(zhì)統(tǒng)計(jì)學(xué)空間變異函數(shù)模型確定地理加權(quán)模型中的帶寬和衰減權(quán)重。(3)該模型還融合了證據(jù)權(quán)模型對于缺失數(shù)據(jù)處理和變量圖層二值化(離散化)的功能。
【關(guān)鍵詞】:GIS空間分析 空間加權(quán) 邏輯回歸 證據(jù)權(quán) 各向異性 缺失數(shù)據(jù) 礦產(chǎn)資源信息綜合
【學(xué)位授予單位】:中國地質(zhì)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:P612
【目錄】:
- 作者簡介6-9
- 摘要9-12
- ABSTRACT12-19
- 第一章 緒論19-32
- §1.1 研究背景和意義19-20
- §1.2 國內(nèi)外研究現(xiàn)狀20-30
- 1.2.1 礦產(chǎn)資源定量預(yù)測信息綜合方法研究進(jìn)展20-22
- 1.2.2 空間加權(quán)技術(shù)研究進(jìn)展22-24
- 1.2.3 發(fā)展趨勢與存在的問題24-30
- §1.3 研究內(nèi)容和研究思路30-32
- 1.3.1 研究內(nèi)容30
- 1.3.2 研究思路30-32
- 第二章 成礦預(yù)測Log-linear定量模型32-50
- §2.1 從樸素貝葉斯到證據(jù)權(quán)和邏輯回歸32-38
- 2.1.1 樸素貝葉斯模型32-33
- 2.1.2 證據(jù)權(quán)模型33-35
- 2.1.3 邏輯回歸模型35-38
- §2.2 證據(jù)權(quán)與邏輯回歸關(guān)系探討38-43
- 2.2.1 基本假設(shè)38-40
- 2.2.2 證據(jù)權(quán)與邏輯回歸模型間的定量關(guān)系40-42
- 2.2.3 證據(jù)權(quán)和邏輯回歸模型優(yōu)缺點(diǎn)對比42-43
- §2.3 證據(jù)權(quán)模型與邏輯回歸模型的融合43-49
- 2.3.1 Deng(2009)改進(jìn)證據(jù)權(quán)模型及存在問題43-46
- 2.3.2 Agterberg(2011)修正證據(jù)權(quán)模型46-47
- 2.3.3 Agterberg(2011)模型與邏輯回歸模型等價(jià)關(guān)系證明47-49
- §2.4 小結(jié)49-50
- 第三章 空間加權(quán)技術(shù)與成礦信息綜合50-61
- §3.1 地質(zhì)變量空間非平穩(wěn)性對成礦預(yù)測的影響50-53
- 3.1.1 空間非平穩(wěn)性對成礦信息提取的影響50-51
- 3.1.2 空間非平穩(wěn)性對綜合預(yù)測模型的影響51-52
- 3.1.3 空間非平穩(wěn)性對覆蓋區(qū)成礦預(yù)測的影響52-53
- §3.2 空間非平穩(wěn)性研究進(jìn)展53-57
- 3.2.1 空間趨勢變量回歸模型53-54
- 3.2.2 局部奇異性分析技術(shù)54-55
- 3.2.3 地理加權(quán)回歸55-57
- §3.3 空間加權(quán)形式57-61
- 3.3.1 滑動(dòng)窗口加權(quán)57-59
- 3.3.2 感興趣目標(biāo)加權(quán)59-60
- 3.3.3 研究程度加權(quán)60-61
- 第四章 空間加權(quán)邏輯回歸61-74
- §4.1 模型數(shù)學(xué)表達(dá)61-62
- 4.1.1 地理加權(quán)邏輯回歸模型61
- 4.1.2 空間加權(quán)邏輯回歸模型61-62
- §4.2 模型功能設(shè)計(jì)62-66
- 4.2.1 窗口級別的數(shù)據(jù)二值化方案62-63
- 4.2.2 基于證據(jù)權(quán)權(quán)重的缺失數(shù)據(jù)處理方案63-64
- 4.2.3 基于變差函數(shù)的權(quán)重衰減模型64-65
- 4.2.4 基于空間t統(tǒng)計(jì)量的帶寬優(yōu)化方案65-66
- §4.3 算法設(shè)計(jì)與實(shí)現(xiàn)66-74
- 4.3.1 局部窗口設(shè)計(jì)66-69
- 4.3.2 空間加權(quán)邏輯回歸算法69-71
- 4.3.3 模塊界面設(shè)計(jì)71-72
- 4.3.4 空間加權(quán)邏輯回歸基本流程72-74
- 第五章 加拿大新斯科舍省金礦成礦預(yù)測74-105
- §5.1 研究區(qū)概況74-77
- 5.1.1 區(qū)域地質(zhì)與構(gòu)造75
- 5.1.2 區(qū)域巖漿巖75
- 5.1.3 區(qū)域成礦75
- 5.1.4 區(qū)域數(shù)據(jù)75-77
- §5.2 預(yù)測要素圖層構(gòu)建77-80
- 5.2.1 背斜構(gòu)造77
- 5.2.2 地層接觸關(guān)系77
- 5.2.3 區(qū)域地球化學(xué)數(shù)據(jù)分析77-80
- §5.3 綜合預(yù)測80-97
- 5.3.1 基于證據(jù)權(quán)模型的綜合預(yù)測80-86
- 5.3.2 基于邏輯回歸模型的綜合預(yù)測86-88
- 5.3.3 基于空間加權(quán)邏輯回歸模型的綜合預(yù)測88-97
- §5.4 預(yù)測模型結(jié)果評價(jià)97-104
- 5.4.1 基于空間t統(tǒng)計(jì)量的預(yù)測模型評價(jià)98-99
- 5.4.2 基于預(yù)測效率的預(yù)測模型評價(jià)99-100
- 5.4.3 考慮缺失數(shù)據(jù)的預(yù)測模型評價(jià)100-104
- §5.5 小結(jié)104-105
- 第六章 結(jié)論與展望105-107
- §6.1 主要結(jié)論和創(chuàng)新點(diǎn)105-106
- 6.1.1 主要結(jié)論105
- 6.1.2 創(chuàng)新點(diǎn)105-106
- §6.2 存在問題與展望106-107
- 致謝107-109
- 參考文獻(xiàn)109-122
- 附錄A 部分關(guān)鍵函數(shù)源代碼122-139
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前4條
1 趙鵬大;“三聯(lián)式”資源定量預(yù)測與評價(jià)——數(shù)字找礦理論與實(shí)踐探討[J];地球科學(xué);2002年05期
2 成秋明;趙鵬大;張生元;夏慶霖;陳志軍;陳建國;徐德義;王文磊;;奇異性理論在個(gè)舊錫銅礦產(chǎn)資源預(yù)測中的應(yīng)用:綜合信息集成與靶區(qū)圈定[J];地球科學(xué)(中國地質(zhì)大學(xué)學(xué)報(bào));2009年02期
3 Daimaru HIROMU;Abe KAZUTOKI;Kurokawa USIO;Matsuura SUMIO;;Modeling the potential distribution of shallow-seated landslides using the weights of evidence method and a logistic regression model:a case study of the Sabae Area, Japan[J];International Journal of Sediment Research;2008年02期
4 王志旺;李端有;王湘桂;;證據(jù)權(quán)法在滑坡危險(xiǎn)度區(qū)劃研究中的應(yīng)用[J];巖土工程學(xué)報(bào);2007年08期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 羅罡輝;基于GWR模型的城市住宅地價(jià)空間結(jié)構(gòu)研究[D];浙江大學(xué);2007年
,本文編號:868553
本文鏈接:http://sikaile.net/shoufeilunwen/jckxbs/868553.html