大規(guī)模異構(gòu)的政府統(tǒng)計報表信息抽取與集成融合研究
發(fā)布時間:2023-01-15 08:57
政府統(tǒng)計數(shù)據(jù)作為國家的"戰(zhàn)略金礦",充分挖掘其內(nèi)在價值,使之更好地服務(wù)于政府及公眾,已成為當前智慧政務(wù)和新型智庫發(fā)展中大數(shù)據(jù)系統(tǒng)建設(shè)的必然要求。但政府統(tǒng)計報表的半結(jié)構(gòu)化和大規(guī)模異構(gòu)特點,使得統(tǒng)計數(shù)據(jù)之間無法直接關(guān)聯(lián)及聚合,影響了統(tǒng)計數(shù)據(jù)資源的深度挖掘與開發(fā)。鑒于此,本文針對已有研究的不足,在分析政府統(tǒng)計報表語義構(gòu)成要素的基礎(chǔ)上,結(jié)合其信息抽取與集成融合的應(yīng)用目標,將處理任務(wù)分解為表格語義結(jié)構(gòu)解析、表頭語義關(guān)系識別、數(shù)值信息抽取表示、指標術(shù)語消冗轉(zhuǎn)換及不一致統(tǒng)計數(shù)據(jù)消歧等五個邏輯過程,并定義了各過程的作用與主要任務(wù),且研究構(gòu)建了面向該任務(wù)的總體技術(shù)框架及其處理流程。大規(guī)模真實數(shù)據(jù)集上的應(yīng)用結(jié)果表明,本研究方法能夠較為有效地實現(xiàn)異構(gòu)型政府統(tǒng)計報表的抽取與集成融合,具備較好的實際價值,同時也為其他基于半結(jié)構(gòu)化表格的大數(shù)據(jù)建設(shè)與應(yīng)用研究提供參考借鑒。
【文章頁數(shù)】:11 頁
【部分圖文】:
政府統(tǒng)計報表的基本樣式
基于本方法的集成數(shù)據(jù)應(yīng)用示例
指標術(shù)語消冗轉(zhuǎn)換處理示例
【參考文獻】:
期刊論文
[1]“大數(shù)據(jù)”背景下統(tǒng)計數(shù)據(jù)資源整合探索[J]. 蘇州市統(tǒng)計局課題組. 統(tǒng)計科學與實踐. 2018(10)
[2]略論國家高端科技智庫的功能定位[J]. 王世偉. 情報學報. 2018(06)
[3]基于知識挖掘與協(xié)同融合的情報研究方法[J]. 肖洪,趙洪,毋曉霞. 情報理論與實踐. 2018(10)
[4]基于海量事實數(shù)據(jù)和協(xié)同機制的情報集成平臺設(shè)計與實現(xiàn)[J]. 趙洪,肖洪,相生昌. 信息系統(tǒng)工程. 2018(04)
[5]淺談大數(shù)據(jù)在政府統(tǒng)計中的作用[J]. 王文鵬. 統(tǒng)計與咨詢. 2017(04)
[6]非結(jié)構(gòu)化表格文檔數(shù)據(jù)抽取與組織模型研究[J]. 張元鳴,陳苗,陸佳煒,徐俊,肖剛. 浙江工業(yè)大學學報. 2016(05)
[7]科技智庫的社會經(jīng)濟數(shù)據(jù)需求及其建設(shè)模式案例分析[J]. 李純,張冬榮. 圖書情報工作. 2015(11)
[8]數(shù)值信息抽取研究進展綜述[J]. 吳超,鄭彥寧,化柏林. 中國圖書館學報. 2014(02)
[9]基于Web的表格信息抽取研究[J]. 秦振海,譚守標,徐超. 計算機技術(shù)與發(fā)展. 2010(02)
[10]Web表格信息抽取研究綜述[J]. 趙洪,肖洪,薛德軍,師慶輝. 現(xiàn)代圖書情報技術(shù). 2008(03)
博士論文
[1]領(lǐng)域數(shù)據(jù)集成及服務(wù)關(guān)鍵技術(shù)研究[D]. 劉歆.北京科技大學 2017
碩士論文
[1]Web表格數(shù)據(jù)提取與分析系統(tǒng)的設(shè)計與實現(xiàn)[D]. 曹貞興.哈爾濱工業(yè)大學 2016
[2]基于Web結(jié)構(gòu)的表格信息抽取研究[D]. 劉穎.合肥工業(yè)大學 2012
本文編號:3730870
【文章頁數(shù)】:11 頁
【部分圖文】:
政府統(tǒng)計報表的基本樣式
基于本方法的集成數(shù)據(jù)應(yīng)用示例
指標術(shù)語消冗轉(zhuǎn)換處理示例
【參考文獻】:
期刊論文
[1]“大數(shù)據(jù)”背景下統(tǒng)計數(shù)據(jù)資源整合探索[J]. 蘇州市統(tǒng)計局課題組. 統(tǒng)計科學與實踐. 2018(10)
[2]略論國家高端科技智庫的功能定位[J]. 王世偉. 情報學報. 2018(06)
[3]基于知識挖掘與協(xié)同融合的情報研究方法[J]. 肖洪,趙洪,毋曉霞. 情報理論與實踐. 2018(10)
[4]基于海量事實數(shù)據(jù)和協(xié)同機制的情報集成平臺設(shè)計與實現(xiàn)[J]. 趙洪,肖洪,相生昌. 信息系統(tǒng)工程. 2018(04)
[5]淺談大數(shù)據(jù)在政府統(tǒng)計中的作用[J]. 王文鵬. 統(tǒng)計與咨詢. 2017(04)
[6]非結(jié)構(gòu)化表格文檔數(shù)據(jù)抽取與組織模型研究[J]. 張元鳴,陳苗,陸佳煒,徐俊,肖剛. 浙江工業(yè)大學學報. 2016(05)
[7]科技智庫的社會經(jīng)濟數(shù)據(jù)需求及其建設(shè)模式案例分析[J]. 李純,張冬榮. 圖書情報工作. 2015(11)
[8]數(shù)值信息抽取研究進展綜述[J]. 吳超,鄭彥寧,化柏林. 中國圖書館學報. 2014(02)
[9]基于Web的表格信息抽取研究[J]. 秦振海,譚守標,徐超. 計算機技術(shù)與發(fā)展. 2010(02)
[10]Web表格信息抽取研究綜述[J]. 趙洪,肖洪,薛德軍,師慶輝. 現(xiàn)代圖書情報技術(shù). 2008(03)
博士論文
[1]領(lǐng)域數(shù)據(jù)集成及服務(wù)關(guān)鍵技術(shù)研究[D]. 劉歆.北京科技大學 2017
碩士論文
[1]Web表格數(shù)據(jù)提取與分析系統(tǒng)的設(shè)計與實現(xiàn)[D]. 曹貞興.哈爾濱工業(yè)大學 2016
[2]基于Web結(jié)構(gòu)的表格信息抽取研究[D]. 劉穎.合肥工業(yè)大學 2012
本文編號:3730870
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3730870.html
最近更新
教材專著