一種基于信息量的時(shí)空深度掃描模型
發(fā)布時(shí)間:2021-08-22 07:37
空間或時(shí)空掃描模型中,會(huì)產(chǎn)生大量有重復(fù)性的集群,現(xiàn)有研究方法會(huì)按Satscan層次結(jié)構(gòu)刪除此類集群,或者用似然比加權(quán)集群分析,在整個(gè)過(guò)程很難量化分析刪除后剩下的集群或是加權(quán)后的集群是否就能提供更多有意義的信息,缺乏系統(tǒng)評(píng)估理論,這將會(huì)混淆風(fēng)險(xiǎn)區(qū)域的判斷.基于此問題本文提出一種基于信息量的時(shí)空深度掃描模型IN-scan model,用于對(duì)上述重復(fù)集群進(jìn)行處理,所提方法從信息量的角度出發(fā)量化每一個(gè)掃描集群.方法中引入了信息量,并使用顯著統(tǒng)計(jì)量和基尼系數(shù)來(lái)進(jìn)行掃描風(fēng)險(xiǎn)區(qū)域分析.文中使用所提方法與Satscan最新方法(LR-scan model)預(yù)警結(jié)果進(jìn)行對(duì)比,所提方法 F-Score性能評(píng)估值提升10%以上,實(shí)驗(yàn)證明該方法較現(xiàn)時(shí)空掃描模型有一定優(yōu)勢(shì).
【文章來(lái)源】:小型微型計(jì)算機(jī)系統(tǒng). 2020,41(09)北大核心CSCD
【文章頁(yè)數(shù)】:7 頁(yè)
【部分圖文】:
基于信息量的時(shí)空深度掃描模型結(jié)構(gòu)
地點(diǎn)B和C與A分析一致.這樣計(jì)算完成后相當(dāng)于把cluster1、cluster2、cluster3的信息映射到掃描區(qū)域L中,二次掃描時(shí)只用分析L中的數(shù)據(jù)即可,見方法介紹模塊.3.2 基于事件均值計(jì)算的基尼系數(shù)
基尼系數(shù)[22]是洛倫茲曲線的一個(gè)度量值,洛倫茲曲線[23]主要用于經(jīng)濟(jì)領(lǐng)域,如圖3所示基尼系數(shù)G=S1/(S1+S2),G越大說(shuō)明收入分配越不平等.Han和Junhee首次將G用于時(shí)空掃描模型中,其橫縱軸分別表示觀察到案例的累加百分比和預(yù)期案例的累積百分比,G=0時(shí),即說(shuō)明該集群無(wú)顯著性,而G越大,對(duì)應(yīng)掃描域的置信度(1-p)越大,Han使用G是為了報(bào)告出更有意義的集群,在我們的研究模型中,研究G亦是為了報(bào)告出能提供更多信息量I的集群.在對(duì)IN-scan model模型的研分析中,由于我們使用的是均值數(shù)據(jù),地點(diǎn)i觀察案件數(shù)n′i與預(yù)測(cè)案件數(shù)μ′i能綜合反映點(diǎn)的風(fēng)險(xiǎn)度,此時(shí)地點(diǎn)i與地點(diǎn)j信息相對(duì)獨(dú)立,所以在掃描區(qū)域L中進(jìn)行二次掃描時(shí),測(cè)試統(tǒng)計(jì)值信息量I(p,G)中的G我們使用掃描域內(nèi)的n′從小到大排序后計(jì)算得到,見圖3,假設(shè)掃描域?yàn)閠able1中的cluster3,掃描時(shí)間為1天,此時(shí)若n′c>n′B>n′A,見圖4中t=1的G顯示圖,圖中陰影部分占下三角的面積百分比即為G值,t=2和t=3類似分析,從圖3中可看出就基尼系數(shù)來(lái)說(shuō),cluster3掃描時(shí)間為1天時(shí)G較大.在IN-scan model中,結(jié)合p與G值計(jì)算各條件下的集群的信息量,報(bào)告I最大的集群.
本文編號(hào):3357307
【文章來(lái)源】:小型微型計(jì)算機(jī)系統(tǒng). 2020,41(09)北大核心CSCD
【文章頁(yè)數(shù)】:7 頁(yè)
【部分圖文】:
基于信息量的時(shí)空深度掃描模型結(jié)構(gòu)
地點(diǎn)B和C與A分析一致.這樣計(jì)算完成后相當(dāng)于把cluster1、cluster2、cluster3的信息映射到掃描區(qū)域L中,二次掃描時(shí)只用分析L中的數(shù)據(jù)即可,見方法介紹模塊.3.2 基于事件均值計(jì)算的基尼系數(shù)
基尼系數(shù)[22]是洛倫茲曲線的一個(gè)度量值,洛倫茲曲線[23]主要用于經(jīng)濟(jì)領(lǐng)域,如圖3所示基尼系數(shù)G=S1/(S1+S2),G越大說(shuō)明收入分配越不平等.Han和Junhee首次將G用于時(shí)空掃描模型中,其橫縱軸分別表示觀察到案例的累加百分比和預(yù)期案例的累積百分比,G=0時(shí),即說(shuō)明該集群無(wú)顯著性,而G越大,對(duì)應(yīng)掃描域的置信度(1-p)越大,Han使用G是為了報(bào)告出更有意義的集群,在我們的研究模型中,研究G亦是為了報(bào)告出能提供更多信息量I的集群.在對(duì)IN-scan model模型的研分析中,由于我們使用的是均值數(shù)據(jù),地點(diǎn)i觀察案件數(shù)n′i與預(yù)測(cè)案件數(shù)μ′i能綜合反映點(diǎn)的風(fēng)險(xiǎn)度,此時(shí)地點(diǎn)i與地點(diǎn)j信息相對(duì)獨(dú)立,所以在掃描區(qū)域L中進(jìn)行二次掃描時(shí),測(cè)試統(tǒng)計(jì)值信息量I(p,G)中的G我們使用掃描域內(nèi)的n′從小到大排序后計(jì)算得到,見圖3,假設(shè)掃描域?yàn)閠able1中的cluster3,掃描時(shí)間為1天,此時(shí)若n′c>n′B>n′A,見圖4中t=1的G顯示圖,圖中陰影部分占下三角的面積百分比即為G值,t=2和t=3類似分析,從圖3中可看出就基尼系數(shù)來(lái)說(shuō),cluster3掃描時(shí)間為1天時(shí)G較大.在IN-scan model中,結(jié)合p與G值計(jì)算各條件下的集群的信息量,報(bào)告I最大的集群.
本文編號(hào):3357307
本文鏈接:http://sikaile.net/kejilunwen/yysx/3357307.html
最近更新
教材專著