文本大數(shù)據(jù)的智慧城市研究與分析
發(fā)布時(shí)間:2021-11-23 21:07
針對(duì)快速了解智慧城市當(dāng)前研究的現(xiàn)狀問(wèn)題,該文基于網(wǎng)絡(luò)爬蟲(chóng)手段,快速獲取中國(guó)知網(wǎng)2009年1月—2019年3月收錄的以智慧城市為關(guān)鍵詞的各類(lèi)研究文獻(xiàn),構(gòu)建了智慧城市文本大數(shù)據(jù)與自動(dòng)分詞模型,基于文本挖掘技術(shù)深入分析了智慧城市的研究熱點(diǎn)、現(xiàn)狀、研究主題,指出了當(dāng)前智慧城市建設(shè)中的問(wèn)題。結(jié)果表明:當(dāng)前處于智慧城市建設(shè)與快速發(fā)展階段,研究熱點(diǎn)歸納為研究方法、技術(shù)手段、應(yīng)用領(lǐng)域3個(gè)層面,研究主題主要集中在技術(shù)與應(yīng)用方面;此外當(dāng)前智慧城市存在著"信息孤島""數(shù)據(jù)孤島"問(wèn)題突出、個(gè)性化設(shè)計(jì)與共享不足、缺乏運(yùn)行維護(hù)長(zhǎng)效機(jī)制、與新型智慧城市的要求還有差距等不足,研究結(jié)果可為智慧城市建設(shè)提供參考。
【文章來(lái)源】:測(cè)繪科學(xué). 2020,45(07)北大核心CSCD
【文章頁(yè)數(shù)】:11 頁(yè)
【部分圖文】:
研究流程
中文分詞是文本挖掘的關(guān)鍵步驟,與英文文檔不同的是中文文檔的語(yǔ)義、詞匯結(jié)構(gòu)等更復(fù)雜,分詞的難度較大。在處理智慧城市相關(guān)文檔時(shí),研究者常借助于jieba分詞框架(該框架是目前主流的開(kāi)源中文分詞框架,具有使用方便、分詞精度高等優(yōu)點(diǎn)[18])進(jìn)行分詞[10,19-20],通常利用隱馬爾可夫模型(HMM)識(shí)別與處理前綴詞典中未登錄的詞匯。但在實(shí)際的使用過(guò)程中,由于前綴詞典缺乏智慧城市相關(guān)的專(zhuān)業(yè)詞匯,直接使用jieba分詞,將對(duì)“大數(shù)據(jù)”“時(shí)空信息云平臺(tái)”“智慧交通”“雄安”等未登錄詞存在誤分的情況;另外智慧城市語(yǔ)料文檔(提取智慧城市文本大數(shù)據(jù)Title字段得到)包括了諸如“實(shí)現(xiàn)”“構(gòu)建”等普通詞匯,和“雄安”等地名詞匯,當(dāng)數(shù)據(jù)量較大,以及前綴詞典的數(shù)量較多時(shí),將會(huì)導(dǎo)致分詞效率降低[9]。為此本文從詞典入手,基于jieba分詞方法,構(gòu)建了智慧城市文本大數(shù)據(jù)的自動(dòng)分詞模型,如圖2所示。首先搜集資料,以人民日?qǐng)?bào)1998年1—6月標(biāo)注語(yǔ)料庫(kù)作為基礎(chǔ)語(yǔ)料文檔;停用詞[21]從基礎(chǔ)語(yǔ)料文檔中提取形成;從智慧城市文本大數(shù)據(jù)中提取,經(jīng)過(guò)去復(fù)、單一化處理形成關(guān)鍵詞數(shù)據(jù)庫(kù)作為專(zhuān)業(yè)詞典;地名地址信息來(lái)源于民政部全國(guó)行政區(qū)劃查詢(xún)平臺(tái)[22];诿嫦蛟~向量算法[23],通過(guò)整合最終得到用于分詞的“新詞典”。
將智慧城市要素?cái)?shù)據(jù)庫(kù)與關(guān)鍵詞數(shù)據(jù)庫(kù)的詞頻進(jìn)行對(duì)比(橫坐標(biāo)與縱坐標(biāo)各取對(duì)數(shù)運(yùn)算),得到如圖3所示的對(duì)比圖基準(zhǔn)線為兩者詞頻值相同的位置。基準(zhǔn)線至縱軸方向顯示的詞匯更多來(lái)自于要素?cái)?shù)據(jù)庫(kù),反映出文獻(xiàn)題名的用詞與智慧城市研究的方法相關(guān),如探討、分析、展望、研究等;基準(zhǔn)線至橫軸方向顯示的詞匯更多來(lái)自于關(guān)鍵詞數(shù)據(jù)庫(kù),反映出關(guān)鍵詞與智慧城市的技術(shù)手段、應(yīng)用范圍相關(guān),如云計(jì)算、大數(shù)據(jù)、電子政務(wù)、生態(tài)城市等。通過(guò)挖掘智慧城市要素?cái)?shù)據(jù)庫(kù)與關(guān)鍵詞數(shù)據(jù)庫(kù)的高頻詞匯,能夠反映智慧城市的研究熱點(diǎn),便于分析各取題名與關(guān)鍵詞前10個(gè)進(jìn)行分析,如圖4所示。總體而言:“建設(shè)”“研究”“發(fā)展”“應(yīng)用”等為智慧城市研究方法的熱點(diǎn),物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算、“互聯(lián)網(wǎng)+”等信息化手段為智慧城重要的技術(shù)支撐;智慧旅游、智慧社區(qū)、城市規(guī)劃為智慧城市研究與應(yīng)用的熱點(diǎn)領(lǐng)域。
【參考文獻(xiàn)】:
期刊論文
[1]基于LDA模型的公眾反饋意見(jiàn)采納研究——共享單車(chē)政策修訂與數(shù)據(jù)挖掘的對(duì)比分析[J]. 楊奕,張毅,李梅,鄧雯. 情報(bào)科學(xué). 2019(01)
[2]中國(guó)新型智慧城市發(fā)展進(jìn)程與趨勢(shì)[J]. 黨安榮,甄茂成,王丹,梁軍. 科技導(dǎo)報(bào). 2018(18)
[3]中國(guó)智慧城市建設(shè)現(xiàn)狀與趨勢(shì)[J]. 陳正偉. 中國(guó)建設(shè)信息化. 2018(13)
[4]從電子政務(wù)、智慧城市到智慧社會(huì)——智慧宜昌一體化建設(shè)實(shí)踐探析[J]. 王俊. 電子政務(wù). 2018(05)
[5]基于LDA主題模型的文獻(xiàn)關(guān)聯(lián)分析及可視化研究[J]. 王麗,鄒麗雪,劉細(xì)文. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2018(03)
[6]我國(guó)智慧城市建設(shè)研究述評(píng)[J]. 楚金華. 現(xiàn)代城市研究. 2017(08)
[7]智慧城市時(shí)空信息云平臺(tái)評(píng)價(jià)指標(biāo)體系研究[J]. 劉曉麗,李成名,印潔. 測(cè)繪通報(bào). 2017(03)
[8]呂蘇語(yǔ)口語(yǔ)標(biāo)注語(yǔ)料的自動(dòng)分詞方法研究[J]. 于重重,操鐳,尹蔚彬,張澤宇,鄭雅. 計(jì)算機(jī)應(yīng)用研究. 2017(05)
[9]細(xì)粒度語(yǔ)義共詞分析方法研究[J]. 王玉林,王忠義. 圖書(shū)情報(bào)工作. 2014(21)
[10]國(guó)內(nèi)外共詞分析法研究的發(fā)展與分析[J]. 唐果媛,張薇. 圖書(shū)情報(bào)工作. 2014(22)
博士論文
[1]智慧城市評(píng)價(jià)體系研究[D]. 周驥.華中科技大學(xué) 2013
碩士論文
[1]基于文本挖掘的智慧城市建設(shè)的熱點(diǎn)與城市差異研究[D]. 龔言浩.南京大學(xué) 2018
[2]基于共詞分析的中小型智慧城市要素研究[D]. 譚驍.湖南大學(xué) 2017
[3]智慧城市發(fā)展水平評(píng)價(jià)及差異比較[D]. 廖世菊.重慶大學(xué) 2016
本文編號(hào):3514645
【文章來(lái)源】:測(cè)繪科學(xué). 2020,45(07)北大核心CSCD
【文章頁(yè)數(shù)】:11 頁(yè)
【部分圖文】:
研究流程
中文分詞是文本挖掘的關(guān)鍵步驟,與英文文檔不同的是中文文檔的語(yǔ)義、詞匯結(jié)構(gòu)等更復(fù)雜,分詞的難度較大。在處理智慧城市相關(guān)文檔時(shí),研究者常借助于jieba分詞框架(該框架是目前主流的開(kāi)源中文分詞框架,具有使用方便、分詞精度高等優(yōu)點(diǎn)[18])進(jìn)行分詞[10,19-20],通常利用隱馬爾可夫模型(HMM)識(shí)別與處理前綴詞典中未登錄的詞匯。但在實(shí)際的使用過(guò)程中,由于前綴詞典缺乏智慧城市相關(guān)的專(zhuān)業(yè)詞匯,直接使用jieba分詞,將對(duì)“大數(shù)據(jù)”“時(shí)空信息云平臺(tái)”“智慧交通”“雄安”等未登錄詞存在誤分的情況;另外智慧城市語(yǔ)料文檔(提取智慧城市文本大數(shù)據(jù)Title字段得到)包括了諸如“實(shí)現(xiàn)”“構(gòu)建”等普通詞匯,和“雄安”等地名詞匯,當(dāng)數(shù)據(jù)量較大,以及前綴詞典的數(shù)量較多時(shí),將會(huì)導(dǎo)致分詞效率降低[9]。為此本文從詞典入手,基于jieba分詞方法,構(gòu)建了智慧城市文本大數(shù)據(jù)的自動(dòng)分詞模型,如圖2所示。首先搜集資料,以人民日?qǐng)?bào)1998年1—6月標(biāo)注語(yǔ)料庫(kù)作為基礎(chǔ)語(yǔ)料文檔;停用詞[21]從基礎(chǔ)語(yǔ)料文檔中提取形成;從智慧城市文本大數(shù)據(jù)中提取,經(jīng)過(guò)去復(fù)、單一化處理形成關(guān)鍵詞數(shù)據(jù)庫(kù)作為專(zhuān)業(yè)詞典;地名地址信息來(lái)源于民政部全國(guó)行政區(qū)劃查詢(xún)平臺(tái)[22];诿嫦蛟~向量算法[23],通過(guò)整合最終得到用于分詞的“新詞典”。
將智慧城市要素?cái)?shù)據(jù)庫(kù)與關(guān)鍵詞數(shù)據(jù)庫(kù)的詞頻進(jìn)行對(duì)比(橫坐標(biāo)與縱坐標(biāo)各取對(duì)數(shù)運(yùn)算),得到如圖3所示的對(duì)比圖基準(zhǔn)線為兩者詞頻值相同的位置。基準(zhǔn)線至縱軸方向顯示的詞匯更多來(lái)自于要素?cái)?shù)據(jù)庫(kù),反映出文獻(xiàn)題名的用詞與智慧城市研究的方法相關(guān),如探討、分析、展望、研究等;基準(zhǔn)線至橫軸方向顯示的詞匯更多來(lái)自于關(guān)鍵詞數(shù)據(jù)庫(kù),反映出關(guān)鍵詞與智慧城市的技術(shù)手段、應(yīng)用范圍相關(guān),如云計(jì)算、大數(shù)據(jù)、電子政務(wù)、生態(tài)城市等。通過(guò)挖掘智慧城市要素?cái)?shù)據(jù)庫(kù)與關(guān)鍵詞數(shù)據(jù)庫(kù)的高頻詞匯,能夠反映智慧城市的研究熱點(diǎn),便于分析各取題名與關(guān)鍵詞前10個(gè)進(jìn)行分析,如圖4所示。總體而言:“建設(shè)”“研究”“發(fā)展”“應(yīng)用”等為智慧城市研究方法的熱點(diǎn),物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算、“互聯(lián)網(wǎng)+”等信息化手段為智慧城重要的技術(shù)支撐;智慧旅游、智慧社區(qū)、城市規(guī)劃為智慧城市研究與應(yīng)用的熱點(diǎn)領(lǐng)域。
【參考文獻(xiàn)】:
期刊論文
[1]基于LDA模型的公眾反饋意見(jiàn)采納研究——共享單車(chē)政策修訂與數(shù)據(jù)挖掘的對(duì)比分析[J]. 楊奕,張毅,李梅,鄧雯. 情報(bào)科學(xué). 2019(01)
[2]中國(guó)新型智慧城市發(fā)展進(jìn)程與趨勢(shì)[J]. 黨安榮,甄茂成,王丹,梁軍. 科技導(dǎo)報(bào). 2018(18)
[3]中國(guó)智慧城市建設(shè)現(xiàn)狀與趨勢(shì)[J]. 陳正偉. 中國(guó)建設(shè)信息化. 2018(13)
[4]從電子政務(wù)、智慧城市到智慧社會(huì)——智慧宜昌一體化建設(shè)實(shí)踐探析[J]. 王俊. 電子政務(wù). 2018(05)
[5]基于LDA主題模型的文獻(xiàn)關(guān)聯(lián)分析及可視化研究[J]. 王麗,鄒麗雪,劉細(xì)文. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2018(03)
[6]我國(guó)智慧城市建設(shè)研究述評(píng)[J]. 楚金華. 現(xiàn)代城市研究. 2017(08)
[7]智慧城市時(shí)空信息云平臺(tái)評(píng)價(jià)指標(biāo)體系研究[J]. 劉曉麗,李成名,印潔. 測(cè)繪通報(bào). 2017(03)
[8]呂蘇語(yǔ)口語(yǔ)標(biāo)注語(yǔ)料的自動(dòng)分詞方法研究[J]. 于重重,操鐳,尹蔚彬,張澤宇,鄭雅. 計(jì)算機(jī)應(yīng)用研究. 2017(05)
[9]細(xì)粒度語(yǔ)義共詞分析方法研究[J]. 王玉林,王忠義. 圖書(shū)情報(bào)工作. 2014(21)
[10]國(guó)內(nèi)外共詞分析法研究的發(fā)展與分析[J]. 唐果媛,張薇. 圖書(shū)情報(bào)工作. 2014(22)
博士論文
[1]智慧城市評(píng)價(jià)體系研究[D]. 周驥.華中科技大學(xué) 2013
碩士論文
[1]基于文本挖掘的智慧城市建設(shè)的熱點(diǎn)與城市差異研究[D]. 龔言浩.南京大學(xué) 2018
[2]基于共詞分析的中小型智慧城市要素研究[D]. 譚驍.湖南大學(xué) 2017
[3]智慧城市發(fā)展水平評(píng)價(jià)及差異比較[D]. 廖世菊.重慶大學(xué) 2016
本文編號(hào):3514645
本文鏈接:http://sikaile.net/jingjilunwen/hongguanjingjilunwen/3514645.html
最近更新
教材專(zhuān)著