天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于機(jī)器學(xué)習(xí)的政協(xié)提案和相關(guān)輿情的分析

發(fā)布時(shí)間:2020-09-30 00:44
   全國(guó)政協(xié)提案是我國(guó)政治制度非常重要的機(jī)制之一,每年全國(guó)各級(jí)政協(xié)委員都要提出提案,僅北京市2018年公開(kāi)的提案就有798件,全國(guó)各級(jí)政協(xié)委員提出的提案總數(shù)更多。采用技術(shù)手段對(duì)政協(xié)委員形成的提案進(jìn)行熱點(diǎn)主題發(fā)現(xiàn),并根據(jù)這些熱點(diǎn)主題進(jìn)行輿情統(tǒng)計(jì)分析,可以挖掘相應(yīng)的社情民意,為政協(xié)委員提供技術(shù)信息的參考。目前,關(guān)于提案的熱點(diǎn)主題發(fā)現(xiàn)和采用技術(shù)手段對(duì)熱點(diǎn)主題進(jìn)行輿情統(tǒng)計(jì)的相關(guān)研究尚未見(jiàn)到。本文設(shè)計(jì)了一套政協(xié)提案及其相關(guān)輿情分析系統(tǒng),為政協(xié)委員提供信息技術(shù)支持。本文主要工作包括以下幾個(gè)方面:(1)對(duì)政協(xié)提案劃分主題并提取關(guān)鍵詞。編寫(xiě)網(wǎng)絡(luò)爬蟲(chóng)程序,從政協(xié)提案網(wǎng)站采集了提案數(shù)據(jù);根據(jù)政協(xié)提案的結(jié)構(gòu)特點(diǎn)對(duì)提案進(jìn)行向量化表示,使用K-means聚類算法對(duì)提案進(jìn)行聚類,每一類表示一個(gè)主題;設(shè)計(jì)了兩種關(guān)鍵詞提取算法從每個(gè)主題中分別提取出三個(gè)關(guān)鍵詞,分別簡(jiǎn)稱“長(zhǎng)詞”和“短詞”,并設(shè)計(jì)對(duì)比實(shí)驗(yàn)分析了兩組關(guān)鍵詞的有效性,結(jié)果表明“長(zhǎng)詞”比“短詞”更能反映主題內(nèi)容。(2)設(shè)計(jì)、訓(xùn)練情感分類模型并預(yù)測(cè)所有未標(biāo)注數(shù)據(jù)的標(biāo)簽。開(kāi)發(fā)爬蟲(chóng)程序,采集了每個(gè)“長(zhǎng)詞”的微博輿情數(shù)據(jù)并保存為結(jié)構(gòu)化文本格式;設(shè)計(jì)了基于雙向LSTM的情感分類模型,訓(xùn)練模型,在測(cè)試集上達(dá)到了 90.45%的準(zhǔn)確率,遠(yuǎn)遠(yuǎn)高于基于傳統(tǒng)機(jī)器學(xué)習(xí)算法的情感分類模型在該數(shù)據(jù)集上的測(cè)試準(zhǔn)確率。(3)對(duì)政協(xié)提案的相關(guān)輿情進(jìn)行統(tǒng)計(jì)并可視化。在上述工作的基礎(chǔ)上,對(duì)獲取的微博輿情數(shù)據(jù)進(jìn)行了統(tǒng)計(jì):從關(guān)注度演進(jìn)趨勢(shì)和關(guān)注度大小、情感演進(jìn)趨勢(shì)和情感傾向等角度對(duì)每個(gè)主題的相關(guān)輿情進(jìn)行了統(tǒng)計(jì)分析。
【學(xué)位單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TP391.1;TP181;D627;C912.63
【部分圖文】:

模型結(jié)構(gòu)


圖2-1邋CBOW模型結(jié)構(gòu)圖[41]逡逑Figure邋2-1邋The邋structure邋of邋CBOW邋modell41!逡逑由圖2-1可知,CBOW模型由三層不同的結(jié)構(gòu)組成,分別是輸入層、投影層逡逑和輸出層。對(duì)于語(yǔ)料庫(kù)中的每條樣本數(shù)據(jù),該模型是通過(guò)輸入每個(gè)樣本中某個(gè)中心逡逑詞的前后幾個(gè)詞來(lái)預(yù)測(cè)該詞出現(xiàn)的概率。輸入層輸入的是待訓(xùn)練詞即中心詞w的逡逑前后各c個(gè)詞的詞向量,其中c可以自己設(shè)定,以“今天的天氣很晴朗”為例,將逡逑該句子分詞后的結(jié)果為:“今天”、“的”、“天氣”、“很”、“晴朗”,假設(shè)逡逑我們要得到“天氣”的詞向量,以c的值取1為例,“天氣”的前后各1個(gè)詞分別逡逑是“的”和“很”,則輸入層輸入這兩個(gè)詞的隨機(jī)初始化的詞向量;投影層將輸入逡逑的詞向量相加并輸入到輸出層;輸出層則根據(jù)不同的結(jié)構(gòu)采用不同的算法。逡逑Skip-gram模型與CBOW模型的原理相同,但網(wǎng)絡(luò)結(jié)構(gòu)正好相反。Skip-gram逡逑模型的結(jié)構(gòu)如圖2-2所示:逡逑INPUT邋PROJECTION邋OUTPUT逡逑4邐w(t-2)逡逑<邐W(M)逡逑<邐w(t+1)逡逑,w(H2)逡逑圖2-2邋Skip-gram模型結(jié)構(gòu)圖[41]逡逑Figure邋2-2邋The邋s

模型結(jié)構(gòu)


w(t+1)逡逑w(t+2)逡逑圖2-1邋CBOW模型結(jié)構(gòu)圖[41]逡逑Figure邋2-1邋The邋structure邋of邋CBOW邋modell41!逡逑由圖2-1可知,CBOW模型由三層不同的結(jié)構(gòu)組成,分別是輸入層、投影層逡逑和輸出層。對(duì)于語(yǔ)料庫(kù)中的每條樣本數(shù)據(jù),該模型是通過(guò)輸入每個(gè)樣本中某個(gè)中心逡逑詞的前后幾個(gè)詞來(lái)預(yù)測(cè)該詞出現(xiàn)的概率。輸入層輸入的是待訓(xùn)練詞即中心詞w的逡逑前后各c個(gè)詞的詞向量,其中c可以自己設(shè)定,以“今天的天氣很晴朗”為例,將逡逑該句子分詞后的結(jié)果為:“今天”、“的”、“天氣”、“很”、“晴朗”,假設(shè)逡逑我們要得到“天氣”的詞向量,以c的值取1為例,“天氣”的前后各1個(gè)詞分別逡逑是“的”和“很”,則輸入層輸入這兩個(gè)詞的隨機(jī)初始化的詞向量;投影層將輸入逡逑的詞向量相加并輸入到輸出層;輸出層則根據(jù)不同的結(jié)構(gòu)采用不同的算法。逡逑Skip-gram模型與CBOW模型的原理相同,但網(wǎng)絡(luò)結(jié)構(gòu)正好相反。Skip-gram逡逑模型的結(jié)構(gòu)如圖2-2所示:逡逑INPUT邋PROJECTION邋OUTPUT逡逑4邐w(t-2)逡逑<邐W(M)逡逑<邐w(t+1)逡逑

結(jié)構(gòu)圖,循環(huán)神經(jīng)網(wǎng)絡(luò),結(jié)構(gòu)圖,序列數(shù)據(jù)


循環(huán)神經(jīng)網(wǎng)絡(luò)是一種用于處理時(shí)間序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型[26],常見(jiàn)的時(shí)間逡逑序列數(shù)據(jù)如語(yǔ)音數(shù)據(jù)、文本數(shù)據(jù)等均適用于使用循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行處理。逡逑循環(huán)神經(jīng)網(wǎng)絡(luò)模型如圖2-3所示:逡逑?邐?邐?邐?邐?逡逑rXn邐T邐T邐T邐T逡逑A」邐=邋A邋—?邋A邋—?邋A邋邐?邋A逡逑(^)邋(^)邋(^)邋...邋(^)逡逑圖2-3循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖逡逑Figure邋2-3邋Recurrent邋neural邋network邋structure逡逑15逡逑

【參考文獻(xiàn)】

相關(guān)期刊論文 前9條

1 梁軍;柴玉梅;原慧斌;昝紅英;劉銘;;基于深度學(xué)習(xí)的微博情感分析[J];中文信息學(xué)報(bào);2014年05期

2 王李冬;魏寶剛;袁杰;;基于概率主題模型的文檔聚類[J];電子學(xué)報(bào);2012年11期

3 楊春明;韓永國(guó);;快速的領(lǐng)域文檔關(guān)鍵詞自動(dòng)提取算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2011年06期

4 馬力;焦李成;白琳;周雅夫;董洛兵;;基于小世界模型的復(fù)合關(guān)鍵詞提取方法研究[J];中文信息學(xué)報(bào);2009年03期

5 趙琦;張智雄;孫坦;許雁冬;;主題發(fā)現(xiàn)技術(shù)方法研究[J];情報(bào)理論與實(shí)踐;2009年04期

6 郭建永;蔡勇;甄艷霞;;基于文本聚類技術(shù)的主題發(fā)現(xiàn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2008年06期

7 張玉權(quán);;談?wù)勌岚傅牟杉{與落實(shí)問(wèn)題——關(guān)于提案辦理評(píng)估體系的思考與探索[J];湖北省社會(huì)主義學(xué)院學(xué)報(bào);2007年06期

8 徐軍;丁宇新;王曉龍;;使用機(jī)器學(xué)習(xí)方法進(jìn)行新聞的情感自動(dòng)分類[J];中文信息學(xué)報(bào);2007年06期

9 婁德成;姚天f ;;漢語(yǔ)句子語(yǔ)義極性分析和觀點(diǎn)抽取方法的研究[J];計(jì)算機(jī)應(yīng)用;2006年11期

相關(guān)碩士學(xué)位論文 前2條

1 王君揚(yáng);政協(xié)提案在基層政府決策中的作用分析[D];華僑大學(xué);2015年

2 王法順;政協(xié)提案信息化管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];山東大學(xué);2008年



本文編號(hào):2830499

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2830499.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶704ae***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com