社交網(wǎng)絡(luò)時(shí)空大數(shù)據(jù)聚類挖掘有效選擇分析
發(fā)布時(shí)間:2020-12-15 13:25
來自社交網(wǎng)絡(luò)的時(shí)空大數(shù)據(jù)具有海量和高動態(tài)的特性,有效選擇時(shí)空數(shù)據(jù)進(jìn)行聚焦挖掘分析至關(guān)重要。以微博位置簽到數(shù)據(jù)為例,首先,對時(shí)空大數(shù)據(jù)空間聚類挖掘的有效選擇問題進(jìn)行了研究,針對社交網(wǎng)絡(luò)時(shí)空數(shù)據(jù)不確定性問題,提出了時(shí)空大數(shù)據(jù)針對聚類挖掘的有效選擇方法。聚類挖掘有效選擇方法提出從空間、時(shí)間或?qū)傩缘染S度對時(shí)空大數(shù)據(jù)進(jìn)行分割。然后,對分割得到的數(shù)據(jù)集進(jìn)行空間探索分析(exploratory spatial data analysis,ESDA),得到具有聚類挖掘潛力的數(shù)據(jù)集。最后,以武漢市微博位置簽到數(shù)據(jù)進(jìn)行商圈熱點(diǎn)探測為例,對提出的社交網(wǎng)絡(luò)時(shí)空大數(shù)據(jù)聚類挖掘有效選擇方法進(jìn)行驗(yàn)證。結(jié)果表明,有效選擇方法可以得到挖掘效率和精準(zhǔn)性更高的時(shí)空數(shù)據(jù)集。
【文章來源】:測繪地理信息. 2020年02期
【文章頁數(shù)】:6 頁
【部分圖文】:
技術(shù)路線
2)數(shù)據(jù)集格網(wǎng)關(guān)聯(lián)。將目標(biāo)區(qū)域劃分為若干個(gè)固定大小的格網(wǎng),并給每個(gè)格網(wǎng)一個(gè)ID號。將待驗(yàn)證的樣本數(shù)據(jù)集分別與格網(wǎng)疊加,使數(shù)據(jù)集與格網(wǎng)關(guān)聯(lián),并分別計(jì)算這些樣本數(shù)據(jù)集在每個(gè)格網(wǎng)中的簽到數(shù)量,過程如圖2所示。離散簽到數(shù)據(jù)轉(zhuǎn)換為以簽到頻次為灰度的格網(wǎng)簽到數(shù)據(jù)集,既簡化了離散點(diǎn)狀數(shù)據(jù),又保持了簽到數(shù)據(jù)時(shí)空特性和專題屬性特征,滿足空間探索性分析和數(shù)據(jù)挖掘的要求。3)ESDA分析。與格網(wǎng)關(guān)聯(lián)后的數(shù)據(jù)集進(jìn)行空間自相關(guān)性分析,以確定數(shù)據(jù)集在空間上是否呈聚類分布。本文采用ArcGIS中Moran’I空間自相關(guān)分析方法,對于Moran’I指數(shù),可用標(biāo)準(zhǔn)化統(tǒng)計(jì)量zscore值來檢驗(yàn)多個(gè)區(qū)域是否存在空間自相關(guān)關(guān)系。
以新浪微博位置簽到數(shù)據(jù)商圈熱點(diǎn)探測為例,對本文時(shí)空大數(shù)據(jù)的有效選擇方法進(jìn)行驗(yàn)證。實(shí)驗(yàn)數(shù)據(jù)來自新浪微博2011年12月-2015年7月7日武漢境內(nèi)4 772 212條微博位置簽到數(shù)據(jù)。數(shù)據(jù)集有效性驗(yàn)證的流程如圖3所示。1)屬性維度數(shù)據(jù)集。武漢高校眾多,高校類簽到數(shù)據(jù)量高達(dá)1 034 982條。由于大學(xué)生在各個(gè)假期的流動性很大,使得高校類簽到數(shù)據(jù)的不穩(wěn)定性增加,所以在進(jìn)行商圈熱點(diǎn)探測時(shí)應(yīng)考慮將其剔除,把剔除高校位置的簽到數(shù)據(jù)后剩下的簽到數(shù)據(jù)作為商圈熱點(diǎn)探測的一個(gè)樣本,稱為剔除高校類,用符號Dexcol表示,總微博簽到數(shù)據(jù)用Dall表示。
【參考文獻(xiàn)】:
期刊論文
[1]多維度軌跡數(shù)據(jù)的SQL時(shí)空查詢方法[J]. 葉文娟,艾廷華. 測繪地理信息. 2017(06)
[2]多維特征融合的城市商圈劃分方法[J]. 郝斌,董碩,胡引翠,劉學(xué),高玉健,張亞冬. 地理與地理信息科學(xué). 2017(05)
[3]大數(shù)據(jù)時(shí)代數(shù)字地圖制圖課程教學(xué)改革的思考[J]. 李精忠,陳凱. 測繪地理信息. 2017(03)
[4]淺談商圈分析對連鎖零售企業(yè)選址的重要性[J]. 王瑜. 中國商論. 2017(02)
[5]時(shí)空大數(shù)據(jù)處理的需求、應(yīng)用與挑戰(zhàn)[J]. 邊馥苓,杜江毅,孟小亮. 測繪地理信息. 2016(06)
[6]論時(shí)空大數(shù)據(jù)及其應(yīng)用[J]. 李德仁,馬軍,邵振峰. 衛(wèi)星應(yīng)用. 2015(09)
[7]設(shè)施POI的局部空間同位模式挖掘及范圍界定[J]. 禹文豪,艾廷華,周啟. 地理與地理信息科學(xué). 2015(04)
[8]基于Web地理圖片的中國入境游客POI空間格局[J]. 丁娟,李俊峰. 經(jīng)濟(jì)地理. 2015(06)
[9]基于情境的POI個(gè)性化推薦方法研究[J]. 李偉,陳毓芬,李萌,錢凌韜,方瀟. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版). 2015(06)
[10]基于城市網(wǎng)絡(luò)空間的POI分布密度分析及可視化[J]. 王爽,李炯. 城市勘測. 2015(01)
本文編號:2918344
【文章來源】:測繪地理信息. 2020年02期
【文章頁數(shù)】:6 頁
【部分圖文】:
技術(shù)路線
2)數(shù)據(jù)集格網(wǎng)關(guān)聯(lián)。將目標(biāo)區(qū)域劃分為若干個(gè)固定大小的格網(wǎng),并給每個(gè)格網(wǎng)一個(gè)ID號。將待驗(yàn)證的樣本數(shù)據(jù)集分別與格網(wǎng)疊加,使數(shù)據(jù)集與格網(wǎng)關(guān)聯(lián),并分別計(jì)算這些樣本數(shù)據(jù)集在每個(gè)格網(wǎng)中的簽到數(shù)量,過程如圖2所示。離散簽到數(shù)據(jù)轉(zhuǎn)換為以簽到頻次為灰度的格網(wǎng)簽到數(shù)據(jù)集,既簡化了離散點(diǎn)狀數(shù)據(jù),又保持了簽到數(shù)據(jù)時(shí)空特性和專題屬性特征,滿足空間探索性分析和數(shù)據(jù)挖掘的要求。3)ESDA分析。與格網(wǎng)關(guān)聯(lián)后的數(shù)據(jù)集進(jìn)行空間自相關(guān)性分析,以確定數(shù)據(jù)集在空間上是否呈聚類分布。本文采用ArcGIS中Moran’I空間自相關(guān)分析方法,對于Moran’I指數(shù),可用標(biāo)準(zhǔn)化統(tǒng)計(jì)量zscore值來檢驗(yàn)多個(gè)區(qū)域是否存在空間自相關(guān)關(guān)系。
以新浪微博位置簽到數(shù)據(jù)商圈熱點(diǎn)探測為例,對本文時(shí)空大數(shù)據(jù)的有效選擇方法進(jìn)行驗(yàn)證。實(shí)驗(yàn)數(shù)據(jù)來自新浪微博2011年12月-2015年7月7日武漢境內(nèi)4 772 212條微博位置簽到數(shù)據(jù)。數(shù)據(jù)集有效性驗(yàn)證的流程如圖3所示。1)屬性維度數(shù)據(jù)集。武漢高校眾多,高校類簽到數(shù)據(jù)量高達(dá)1 034 982條。由于大學(xué)生在各個(gè)假期的流動性很大,使得高校類簽到數(shù)據(jù)的不穩(wěn)定性增加,所以在進(jìn)行商圈熱點(diǎn)探測時(shí)應(yīng)考慮將其剔除,把剔除高校位置的簽到數(shù)據(jù)后剩下的簽到數(shù)據(jù)作為商圈熱點(diǎn)探測的一個(gè)樣本,稱為剔除高校類,用符號Dexcol表示,總微博簽到數(shù)據(jù)用Dall表示。
【參考文獻(xiàn)】:
期刊論文
[1]多維度軌跡數(shù)據(jù)的SQL時(shí)空查詢方法[J]. 葉文娟,艾廷華. 測繪地理信息. 2017(06)
[2]多維特征融合的城市商圈劃分方法[J]. 郝斌,董碩,胡引翠,劉學(xué),高玉健,張亞冬. 地理與地理信息科學(xué). 2017(05)
[3]大數(shù)據(jù)時(shí)代數(shù)字地圖制圖課程教學(xué)改革的思考[J]. 李精忠,陳凱. 測繪地理信息. 2017(03)
[4]淺談商圈分析對連鎖零售企業(yè)選址的重要性[J]. 王瑜. 中國商論. 2017(02)
[5]時(shí)空大數(shù)據(jù)處理的需求、應(yīng)用與挑戰(zhàn)[J]. 邊馥苓,杜江毅,孟小亮. 測繪地理信息. 2016(06)
[6]論時(shí)空大數(shù)據(jù)及其應(yīng)用[J]. 李德仁,馬軍,邵振峰. 衛(wèi)星應(yīng)用. 2015(09)
[7]設(shè)施POI的局部空間同位模式挖掘及范圍界定[J]. 禹文豪,艾廷華,周啟. 地理與地理信息科學(xué). 2015(04)
[8]基于Web地理圖片的中國入境游客POI空間格局[J]. 丁娟,李俊峰. 經(jīng)濟(jì)地理. 2015(06)
[9]基于情境的POI個(gè)性化推薦方法研究[J]. 李偉,陳毓芬,李萌,錢凌韜,方瀟. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版). 2015(06)
[10]基于城市網(wǎng)絡(luò)空間的POI分布密度分析及可視化[J]. 王爽,李炯. 城市勘測. 2015(01)
本文編號:2918344
本文鏈接:http://sikaile.net/kejilunwen/dizhicehuilunwen/2918344.html
最近更新
教材專著