基于中文分詞的加權(quán)地理編碼在COVID-19疫情防控空間定位中的應(yīng)用
【文章頁數(shù)】:8 頁
【部分圖文】:
圖1 面‐點結(jié)構(gòu)地址編碼層次關(guān)系圖
中文地址一般可分為行政區(qū)地名、自然地名、街巷(道路、胡同)、道路門牌(門址)、住宅區(qū)、冠樓名等類型[12]。中文標(biāo)準(zhǔn)地址的形式由3部分組成,即〈標(biāo)準(zhǔn)地址〉::=〈行政轄區(qū)〉〈基本區(qū)域限定物〉〈局部點位置描述〉。其中,〈行政轄區(qū)〉為政區(qū)類地名;〈基本區(qū)域限定物〉可以是道路、小區(qū)等低....
圖2 基于中文分詞的加權(quán)地理編碼方法
文本分詞是通過對中文文本詞語進(jìn)行自動識別來達(dá)到對文本自動分割的目的。由于地名地址的籠統(tǒng)性、復(fù)雜性與特殊性,難以遵循一些固有規(guī)律[8,11],因此,本文首先使用維特比算法計算初始狀態(tài)的概率值,然后逐步計算各時刻的轉(zhuǎn)移概率,再利用動態(tài)規(guī)劃求解HMM模型,從而完成對文本的分詞[17]。....
圖3 基于鏈?zhǔn)椒▌t的特征詞選取
基于鏈?zhǔn)椒▌t的特征詞選擇是根據(jù)不同詞組在地址中的重要程度并借鑒鏈?zhǔn)角髮?dǎo)法則原理提出的方法。根據(jù)鏈?zhǔn)角髮?dǎo)法則可知,參數(shù)求導(dǎo)依賴于函數(shù)映射關(guān)系,函數(shù)可微性是函數(shù)是否可導(dǎo)的必要條件。借鑒該原理,將分詞后結(jié)果分為中文和非中文兩種特征詞,其中中文特征詞為主特征詞,非中文特征詞為次特征詞。文....
圖4 COVID‐19病例社區(qū)定位分布圖
為滿足公共疫情防控需求,服務(wù)政府決策與評估,需要提供疫情在城市空間中的統(tǒng)計和分布情況,因此,在匹配完成后需要返回匹配地址的空間坐標(biāo),以滿足城市疫情管控的定位需求。同時,以社區(qū)為單位,將匹配結(jié)果得到的COVID-19病例的定位坐標(biāo)落到空間上,定位其所在社區(qū)的空間位置,并將定位結(jié)果按....
本文編號:4024242
本文鏈接:http://sikaile.net/yixuelunwen/yufangyixuelunwen/4024242.html