【摘要】:地震災(zāi)害被稱為群災(zāi)之首,而我國(guó)又是全球范圍內(nèi)地震災(zāi)害最為嚴(yán)重的國(guó)家之一。地震災(zāi)害分布區(qū)域廣、發(fā)生頻率高、造成損失嚴(yán)重是我國(guó)的基本國(guó)情,減輕地震災(zāi)害損失成為我國(guó)經(jīng)濟(jì)建設(shè)面臨和必須重點(diǎn)關(guān)注的現(xiàn)實(shí)。破壞性地震發(fā)生后,如何高效、迅速地獲取災(zāi)情信息并進(jìn)行與地震損失相關(guān)的烈度評(píng)估,是地震應(yīng)急救援和管理面臨的關(guān)鍵問題,對(duì)這一問題的探索一直以來都是學(xué)術(shù)界瞄準(zhǔn)的重要研究課題,也是災(zāi)區(qū)各級(jí)政府最為關(guān)注的問題之一。近年來,伴隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,蘊(yùn)含海量數(shù)據(jù)的社交媒體平臺(tái)為開展地震災(zāi)情獲取和地震烈度快速評(píng)估提供了全新的視角和重要的途徑。由于社交媒體數(shù)據(jù)具有海量性、時(shí)空性、交互性、強(qiáng)擴(kuò)散性、融合性等特點(diǎn),公眾通過社交媒體可以自由表達(dá)自己的所見、觀點(diǎn)與情感,無形中加速了災(zāi)情信息的共享與傳播。挖掘震后用戶自發(fā)貢獻(xiàn)的社交媒體海量數(shù)據(jù),使“眾包”和“群智”思想在地震應(yīng)急中發(fā)揮其應(yīng)有作用,是有效提升地震災(zāi)情獲取能力的重要途徑與手段。鑒于此,本文在吸收信息科學(xué)、工程地震學(xué)、管理科學(xué)與工程以及統(tǒng)計(jì)學(xué)等學(xué)科的思想和方法的基礎(chǔ)上,對(duì)社交媒體中震后災(zāi)情數(shù)據(jù)的抓取、甄別、存儲(chǔ)以及其時(shí)空特征與主題分布特征等若干問題進(jìn)行了深入研究,在此基礎(chǔ)上結(jié)合機(jī)器學(xué)習(xí)中的人工神經(jīng)網(wǎng)絡(luò)算法,提出了一種基于社交媒體數(shù)據(jù)的地震烈度快速評(píng)估方法。研究的主要目標(biāo)是統(tǒng)計(jì)并分析近年來我國(guó)大陸地區(qū)在社交媒體平臺(tái)產(chǎn)生的地震災(zāi)情數(shù)據(jù)所呈現(xiàn)出的特點(diǎn)和規(guī)律,以此來推動(dòng)社交媒體地震災(zāi)情數(shù)據(jù)挖掘這一新興研究領(lǐng)域的發(fā)展,并探索一種新的基于社交媒體數(shù)據(jù)的烈度快速評(píng)估方法,以期提升地震應(yīng)急救援工作的效率,為地震應(yīng)急指揮決策提供參考依據(jù)。在充分吸收總結(jié)前人已有成果的基礎(chǔ)上,本文以新浪微博移動(dòng)端破壞性地震災(zāi)情數(shù)據(jù)為研究對(duì)象,致力于探索、解決地震應(yīng)急和震害評(píng)估中的關(guān)鍵性科學(xué)問題,完成的主要研究工作及取得的創(chuàng)新成果如下:1.提出了一種多策略的社交媒體地震災(zāi)情數(shù)據(jù)獲取方案,以新浪微博移動(dòng)端為數(shù)據(jù)源,建立了我國(guó)大陸地區(qū)首個(gè)社交媒體地震災(zāi)情數(shù)據(jù)庫及管理平臺(tái),為開展這一領(lǐng)域的研究工作奠定了重要基礎(chǔ)。以我國(guó)現(xiàn)有的規(guī)模最大、用戶最多的社交媒體平臺(tái)新浪微博為例,總結(jié)分析了現(xiàn)有微博數(shù)據(jù)獲取方法。在此基礎(chǔ)上,提出了新浪微博商業(yè)API、網(wǎng)絡(luò)爬蟲、烈度衰減關(guān)系以及歷史震例烈度分布矢量圖相結(jié)合的多策略社交媒體地震災(zāi)情數(shù)據(jù)獲取方案;谛吕宋⒉┮苿(dòng)端,抓取了我國(guó)自2010年以來共206次破壞性地震震后72小時(shí)內(nèi)與地震相關(guān)的微博數(shù)據(jù),建立了我國(guó)大陸地區(qū)首個(gè)社交媒體地震災(zāi)情數(shù)據(jù)庫及管理平臺(tái),并實(shí)現(xiàn)了數(shù)據(jù)可視化。同時(shí),收集整理了我國(guó)大陸地區(qū)26次破壞性地震的烈度分布矢量圖,在此基礎(chǔ)上完成了位置微博的提取與地圖匹配。本文所建立的數(shù)據(jù)庫包含文本內(nèi)容數(shù)據(jù)與用戶關(guān)系數(shù)據(jù),內(nèi)容豐富、資料詳實(shí),便于下載使用,該數(shù)據(jù)庫的建立為今后開展地震災(zāi)情獲取和數(shù)據(jù)挖掘工作提供了寶貴的基礎(chǔ)資料。2.基于社交媒體數(shù)據(jù),分析了2010年以來我國(guó)大陸地區(qū)破壞性地震所呈現(xiàn)的災(zāi)情時(shí)間特征、空間分布特征、時(shí)空變化特征以及主題特征,挖掘得出了地震災(zāi)情的統(tǒng)計(jì)特征和分布規(guī)律;诘谌芦@取的震后72小時(shí)微博數(shù)據(jù)進(jìn)行了描述性挖掘,對(duì)于總體數(shù)據(jù)開展了時(shí)間分析和空間分析,對(duì)于位置微博數(shù)據(jù)基于熱力圖進(jìn)行了時(shí)空特征變化的分析,并應(yīng)用K-means方法做了主題聚類分析,掌握了不同的災(zāi)情主題分布情況和規(guī)律,較為全面地挖掘得出了近年來我國(guó)破壞性地震社交媒體端災(zāi)情數(shù)據(jù)的統(tǒng)計(jì)特征和規(guī)律。3.基于社交媒體數(shù)據(jù),以機(jī)器學(xué)習(xí)中的人工神經(jīng)網(wǎng)絡(luò)算法為基礎(chǔ),建立了烈度快速評(píng)估模型,提出了一種數(shù)據(jù)驅(qū)動(dòng)型的地震烈度快速評(píng)估方法。將機(jī)器學(xué)習(xí)中的多分類問題思想和文本挖掘方法引入到地震烈度快速評(píng)估中,提出了基于震后社交媒體數(shù)據(jù)的地震烈度快速評(píng)估方法的總體框架和流程。采用2010年至2018年的20次破壞性地震新浪微博數(shù)據(jù)為樣本,構(gòu)建微博文本數(shù)據(jù)的特征向量矩陣,建立數(shù)據(jù)與烈度分區(qū)之間的對(duì)應(yīng)關(guān)系,將碎片化、半結(jié)構(gòu)化的微博文本數(shù)據(jù)轉(zhuǎn)化為可以作為分類問題輸入的空間向量形式,形成機(jī)器學(xué)習(xí)所需的結(jié)構(gòu)化的數(shù)據(jù)集,在人工神經(jīng)網(wǎng)絡(luò)算法的基礎(chǔ)上訓(xùn)練出地震烈度快速評(píng)估模型。這一模型經(jīng)測(cè)試集性能測(cè)試評(píng)估準(zhǔn)確率可達(dá)81%,經(jīng)實(shí)例分析評(píng)估準(zhǔn)確率超過67%。本文所提出的這種數(shù)據(jù)驅(qū)動(dòng)型的地震烈度快速評(píng)估方法,從時(shí)效性和精度上均可相對(duì)較好地滿足地震應(yīng)急救援的實(shí)際需求。本文的學(xué)術(shù)貢獻(xiàn)和應(yīng)用價(jià)值主要在于:在大數(shù)據(jù)時(shí)代開辟了地震災(zāi)情信息獲取的一條新途徑,為地震應(yīng)急中的災(zāi)情快速獲取與烈度快速評(píng)估提供了新的技術(shù)思路,提出了一種新的地震烈度快速評(píng)估方法,在地震應(yīng)急救援和政府抗震救災(zāi)中將具有重要的應(yīng)用價(jià)值。
【學(xué)位授予單位】:中國(guó)地震局工程力學(xué)研究所
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類號(hào)】:P315.9
【圖文】:
本文研究技術(shù)路線圖

中國(guó)地震局工程力學(xué)研究所博士學(xué)位論文信方式。經(jīng)過多年的發(fā)展,越來越多的人愿意在社交媒體平臺(tái)上發(fā)表自己的看法這也使得社交媒體數(shù)據(jù)成為了一種重要的數(shù)據(jù)源,它提供了大量有價(jià)值的信息,可以反映現(xiàn)實(shí)世界的各種社會(huì)活動(dòng)(王艷東 等,2016)。圖 2-1 詳細(xì)描述了社交媒體的發(fā)展歷程。

分類是一個(gè)兩階段過程,包括學(xué)習(xí)階段(構(gòu)建分類模型)和分類階段,如圖2-3 所示。學(xué)習(xí)階段的主要任務(wù)是建立描述預(yù)先定義的數(shù)據(jù)類或概念集的分類器,并進(jìn)行準(zhǔn)確率的檢驗(yàn);分類階段則基于學(xué)得的分類模型對(duì)新數(shù)據(jù)進(jìn)行分類(李航,2011)。圖 2-3 分類的兩個(gè)階段常見的分類模型(分類器)主要包括決策樹、支持向量機(jī)、貝葉斯網(wǎng)絡(luò)和神經(jīng)網(wǎng)絡(luò)等,下面對(duì)這些模型做簡(jiǎn)要介紹:(1) 決策樹決策樹利用樹狀結(jié)構(gòu)來表達(dá)分類的流程,整個(gè)流程中涉及多次的判斷。它從一組無次序、無規(guī)則的元組中歸納出一種分類規(guī)則,同時(shí)將這種分類規(guī)則用樹狀結(jié)構(gòu)進(jìn)行表示,因此十分簡(jiǎn)單明了。許多定性問題的表達(dá)都可以采用決策樹來解決,它選取自上向下的遞歸方式,在決策樹的內(nèi)部結(jié)點(diǎn)進(jìn)行屬性值的比較,并?
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李立耀;孫魯敬;楊家海;;社交網(wǎng)絡(luò)研究綜述[J];計(jì)算機(jī)科學(xué);2015年11期
2 徐敬海;褚俊秀;聶高眾;安基文;;基于位置微博的地震災(zāi)情提取[J];自然災(zāi)害學(xué)報(bào);2015年05期
3 吳聯(lián)仁;易蘭麗;閆強(qiáng);;危機(jī)事件下在線群體用戶行為統(tǒng)計(jì)特征分析[J];情報(bào)科學(xué);2015年10期
4 郭紅梅;陳維鋒;張瑩;申源;;多源地震災(zāi)情信息融合的烈度判定方法研究[J];華北地震科學(xué);2015年03期
5 伍育紅;;聚類算法綜述[J];計(jì)算機(jī)科學(xué);2015年S1期
6 方濱興;賈焰;韓毅;;社交網(wǎng)絡(luò)分析核心科學(xué)問題、研究現(xiàn)狀及未來展望[J];中國(guó)科學(xué)院院刊;2015年02期
7 孫曉;葉嘉麒;唐陳意;任福繼;;基于多策略的新浪微博大數(shù)據(jù)抓取及應(yīng)用[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年10期
8 游翔;葛衛(wèi)麗;;微博數(shù)據(jù)獲取技術(shù)及展望[J];電子科技;2014年10期
9 朱立超;李治軍;姜守旭;;基于位置的社交網(wǎng)絡(luò)研究綜述[J];智能計(jì)算機(jī)與應(yīng)用;2014年04期
10 劉經(jīng)南;方媛;郭遲;高柯夫;;位置大數(shù)據(jù)的分析處理研究進(jìn)展[J];武漢大學(xué)學(xué)報(bào)(信息科學(xué)版);2014年04期
相關(guān)博士學(xué)位論文 前1條
1 田野;基于微博平臺(tái)的事件趨勢(shì)分析及預(yù)測(cè)研究[D];武漢大學(xué);2012年
本文編號(hào):
2804395
本文鏈接:http://sikaile.net/kejilunwen/diqiudizhi/2804395.html