天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于大數(shù)據(jù)的污染源普查清查方法學(xué)研究

發(fā)布時(shí)間:2020-12-23 10:24
  為了加強(qiáng)對(duì)環(huán)境污染的監(jiān)督管理,及時(shí)了解及記錄各企事業(yè)單位潛在的環(huán)境污染基本信息,我國(guó)于2008年開展了第一次全國(guó)污染源普查。在第一次全國(guó)污染源普查工作中,囿于我國(guó)當(dāng)時(shí)的認(rèn)識(shí)及技術(shù)手段和數(shù)據(jù)分析能力有限,存在許多不足之處。當(dāng)時(shí)在污染源普查清查階段,政府部門僅根據(jù)企業(yè)的行業(yè)分類代碼進(jìn)行篩選,形成一份基本單位名錄作為清查階段的入戶依據(jù)。但政府部門數(shù)據(jù)的不完整以及篩選所用的行業(yè)類別代碼存在大量錯(cuò)誤,致使清查基本單位名錄存在相當(dāng)數(shù)量的漏失企業(yè),造成工業(yè)污染源基本單位名錄不準(zhǔn)確。我國(guó)第二次污染源普查于2018年開始,因此,本研究希望利用大數(shù)據(jù)及相關(guān)技術(shù),以工商數(shù)據(jù)中的企業(yè)經(jīng)營(yíng)范圍作為基礎(chǔ),識(shí)別并糾正行業(yè)類別,同時(shí)利用互聯(lián)網(wǎng)大數(shù)據(jù)技術(shù)對(duì)基本單位名錄進(jìn)行增補(bǔ),最終優(yōu)化污染源普查清查階段數(shù)據(jù)處理流程、提升基本單位名錄的構(gòu)建效率和準(zhǔn)確度。首先,本研究對(duì)可使用的方法進(jìn)行比較,對(duì)政府部門所提供的數(shù)據(jù)進(jìn)行評(píng)價(jià)和篩選,在海量數(shù)據(jù)處理的背景下,構(gòu)建機(jī)器學(xué)習(xí)分類模型。以此為基礎(chǔ),按照機(jī)器學(xué)習(xí)處理實(shí)際問題的基本思路,首先構(gòu)造標(biāo)準(zhǔn)數(shù)據(jù)集并驗(yàn)證其準(zhǔn)確性及可用性,利用多種分類算法進(jìn)行比較分析,擇優(yōu)使用。隨后以此構(gòu)建的標(biāo)定數(shù)據(jù)... 

【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁(yè)數(shù)】:92 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于大數(shù)據(jù)的污染源普查清查方法學(xué)研究


總技術(shù)路線圖

系統(tǒng)圖,文本分類,系統(tǒng)圖


哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文2.2.2.2 自然語(yǔ)言處理自然語(yǔ)言處理技術(shù)(Nature Language Processing)是通過使用計(jì)算機(jī)對(duì)語(yǔ)言文字進(jìn)行處理的技術(shù)及應(yīng)用。近幾年,隨著大數(shù)據(jù)時(shí)代的到來(lái),機(jī)器計(jì)算能力的飛速提升以及機(jī)器學(xué)習(xí)算法的廣泛應(yīng)用,為自然語(yǔ)言處理在應(yīng)用范圍帶來(lái)了新的突破。目前,中文自然語(yǔ)言處理是國(guó)內(nèi)大數(shù)據(jù)應(yīng)用領(lǐng)域的一個(gè)熱點(diǎn)方向。其研究成果已廣泛應(yīng)用于文本分類[44-46]等領(lǐng)域。處理流程包含數(shù)據(jù)的采集與標(biāo)記、數(shù)據(jù)清洗、特征選擇、模型選擇、訓(xùn)練與測(cè)試和性能評(píng)估優(yōu)化等部分。在文本分類問題中,基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)方法目前應(yīng)用較為廣泛。其一般思路為先在全部文檔中均勻抽取部分文檔,進(jìn)行類別標(biāo)記,并以此為訓(xùn)練集,然后在所得訓(xùn)練集中尋找詞語(yǔ)與類別的聯(lián)系。將以上總結(jié)出的聯(lián)系利用數(shù)學(xué)表達(dá)式進(jìn)行闡述,并指導(dǎo)分類預(yù)測(cè)。由于該方法理論基礎(chǔ)較好,容易得到令人滿意的分類效果。如圖 2-1 所示,就是基于統(tǒng)計(jì)的文本分類系統(tǒng)的示意圖。

互聯(lián)網(wǎng),商業(yè)渠道,企業(yè)類別,數(shù)據(jù)


哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文過網(wǎng)絡(luò)爬蟲技術(shù)獲取,其中搜集的企業(yè)數(shù)據(jù)來(lái)源包括基于公共地圖服務(wù)的企業(yè)類別興趣點(diǎn)數(shù)據(jù)、互聯(lián)網(wǎng)網(wǎng)頁(yè)公開數(shù)據(jù)、商業(yè)渠道獲取的數(shù)據(jù),共涉及到天眼查、阿里巴巴、企查查、獵聘網(wǎng)、智聯(lián)招聘和阿土伯黃頁(yè)數(shù)據(jù)。結(jié)合基礎(chǔ)地理信息數(shù)據(jù)庫(kù)與企業(yè)信息數(shù)據(jù)庫(kù),第三方團(tuán)隊(duì)一共獲取了近24 萬(wàn)條企業(yè)數(shù)據(jù)。這些數(shù)據(jù)經(jīng)過規(guī)整化處理后統(tǒng)一存入企業(yè)信息數(shù)據(jù)庫(kù),如圖 4-1 所示。

【參考文獻(xiàn)】:
期刊論文
[1]互聯(lián)網(wǎng)大數(shù)據(jù)在政府統(tǒng)計(jì)中的應(yīng)用研究[J]. 楊海霞,張藝海.  化工管理. 2018(33)
[2]關(guān)于第二次全國(guó)污染源普查清查工作的思考[J]. 陳毅,趙建成,姜?jiǎng)⒅?  綠色科技. 2018(20)
[3]機(jī)器學(xué)習(xí)綜述[J]. 石弘一.  通訊世界. 2018(10)
[4]我國(guó)環(huán)境管理新進(jìn)展及環(huán)境大數(shù)據(jù)技術(shù)應(yīng)用展望[J]. 汪自書,胡迪.  中國(guó)環(huán)境管理. 2018(05)
[5]基于大數(shù)據(jù)的污染企業(yè)環(huán)保督查及產(chǎn)能規(guī)劃指導(dǎo)方案[J]. 賈玉瑋,徐樂西,晁昆,曹麗娟,程新洲.  郵電設(shè)計(jì)技術(shù). 2018(10)
[6]環(huán)保大數(shù)據(jù)分析系統(tǒng)在環(huán)境污染管理中的應(yīng)用[J]. 張布宇,王寒,王春迎.  智庫(kù)時(shí)代. 2018(36)
[7]我國(guó)排污許可制發(fā)展分析[J]. 宛文博,俞欽欽,高鳴,李冰.  環(huán)境與發(fā)展. 2017(10)
[8]基于TFIDF的社區(qū)問答系統(tǒng)問句相似度改進(jìn)算法[J]. 趙勝輝,李吉月,徐碧,孫博研.  北京理工大學(xué)學(xué)報(bào). 2017(09)
[9]對(duì)第二次全國(guó)污染源普查的若干思考和建議[J]. 張震,趙銀慧,王軍霞,景立新.  環(huán)境保護(hù). 2017(07)
[10]第二次全國(guó)污染源普查工作的思考與建議——以三明市為例[J]. 林新堯.  綠色科技. 2016(12)



本文編號(hào):2933548

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/huanjinggongchenglunwen/2933548.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶68645***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com