考慮政策因素的貿(mào)易戰(zhàn)輿情分析模型
發(fā)布時(shí)間:2021-08-18 12:16
隨著互聯(lián)網(wǎng)的普及與飛速發(fā)展,網(wǎng)絡(luò)輿情已經(jīng)逐漸成為對(duì)社會(huì)輿論具有極其重要影響的力量,并且在很大程度上引導(dǎo)著網(wǎng)民對(duì)于某些輿論事件的認(rèn)知。由于網(wǎng)絡(luò)輿情信息傳播速度快與信息量大的特性,如何快速發(fā)現(xiàn)并分析網(wǎng)絡(luò)輿情信息,已經(jīng)成為當(dāng)下研究的熱點(diǎn)。貿(mào)易戰(zhàn)作為焦點(diǎn)問(wèn)題之一引起了廣大民眾的熱切關(guān)心,在網(wǎng)絡(luò)上迅速形成為一股龐大的網(wǎng)絡(luò)輿情。而基于考慮政策因素的貿(mào)易戰(zhàn),更是民眾關(guān)心的方向。相比于其他的網(wǎng)絡(luò)輿情信息,考慮政策因素的貿(mào)易戰(zhàn)體現(xiàn)的更多的是政府之間政策的較量,與群眾的利益息息相關(guān),是國(guó)家綜合實(shí)力的體現(xiàn)。本文利用LDA主題模型來(lái)發(fā)現(xiàn)并分析基于考慮政策因素的貿(mào)易戰(zhàn)輿情信息。分析了發(fā)生在貿(mào)易戰(zhàn)中的一些主要事件的變化趨勢(shì)以及政策因素的影響結(jié)果,包括“關(guān)稅事件”、“中興事件”、“和解事件”等。在此基礎(chǔ)上,對(duì)提取的特征詞及其權(quán)重進(jìn)行了隱含主題分析,具體的工作如下:(1)基于考慮政策因素的貿(mào)易戰(zhàn)輿情信息的文本數(shù)據(jù)的采集:本文采用基于主題的網(wǎng)絡(luò)爬蟲技術(shù),設(shè)置貿(mào)易戰(zhàn)、黃金、股市、進(jìn)出口、經(jīng)濟(jì)等主題集來(lái)爬取微博上的相關(guān)文本數(shù)據(jù)。(2)文本預(yù)處理:LDA主題模型只能處理結(jié)構(gòu)化的文本數(shù)據(jù),所以,對(duì)爬取的自然語(yǔ)言進(jìn)行了相關(guān)處理。...
【文章來(lái)源】:湘潭大學(xué)湖南省
【文章頁(yè)數(shù)】:41 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
傳統(tǒng)網(wǎng)絡(luò)爬蟲抓取流程圖
與主題無(wú)關(guān)的網(wǎng)頁(yè)。可以很清楚的看出,利用基于主題的爬蟲技術(shù)獲取的是更準(zhǔn)確、我們所需要的網(wǎng)面信息,節(jié)約資源并且極大的提高了效率。目前基于主的網(wǎng)絡(luò)爬蟲主要有兩個(gè)方向:一個(gè)是基于內(nèi)容方面分析的策略;另一個(gè)是基于子 URL 分析的策略。我所采用的是基于內(nèi)容分析的策略,首先是需要解析 Web面的內(nèi)容,然后保存與主題相關(guān)的網(wǎng)頁(yè),直接過(guò)濾掉與主題無(wú)關(guān)的頁(yè)面。目前網(wǎng)上開源的基于主題的網(wǎng)絡(luò)爬蟲有許多,學(xué)者們可以根據(jù)自己的實(shí)際需求進(jìn)行應(yīng)的改進(jìn)。基于主題的網(wǎng)絡(luò)爬蟲爬取流程如圖 2.3 所示:
圖 2.4 貿(mào)易戰(zhàn)、黃金為主題的爬蟲結(jié)果截圖在爬取過(guò)程中,爬取的內(nèi)容包括了圖中所體現(xiàn)的幾項(xiàng)內(nèi)容,包括發(fā)布人、發(fā)人 id、發(fā)布人性質(zhì),以及具體內(nèi)容,在輿情信息分析的過(guò)程中,我們主要采具體內(nèi)容進(jìn)行分析,獲取的文本數(shù)量為 20596 條。以貿(mào)易戰(zhàn)、股市為主題的網(wǎng)絡(luò)爬蟲數(shù)據(jù)結(jié)果如圖 2.5 所示:圖 2.5 貿(mào)易戰(zhàn)、股市為主題的爬蟲結(jié)果截圖以貿(mào)易戰(zhàn)、進(jìn)出口為主題的網(wǎng)絡(luò)爬蟲數(shù)據(jù)結(jié)果如圖 2.6 所示:
【參考文獻(xiàn)】:
期刊論文
[1]中美貿(mào)易戰(zhàn)評(píng)析與展望[J]. 梅新育. 中國(guó)勞動(dòng)關(guān)系學(xué)院學(xué)報(bào). 2019(02)
[2]基于LDA主題模型的專利文本分析應(yīng)用研究[J]. 艾楚涵,熊新,吳建德. 科技和產(chǎn)業(yè). 2019(03)
[3]貿(mào)易戰(zhàn)背景下的中美勞動(dòng)力市場(chǎng)分析[J]. 李思思. 中國(guó)市場(chǎng). 2019(07)
[4]在線社交網(wǎng)絡(luò)中的新興話題檢測(cè)技術(shù)綜述[J]. 笱程成,杜攀,劉悅,程學(xué)旗. 中文信息學(xué)報(bào). 2016(05)
[5]大規(guī)模網(wǎng)絡(luò)廣義社區(qū)發(fā)現(xiàn)隨機(jī)變分推理算法[J]. 柴變芳,趙曉鵬. 濟(jì)南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(05)
[6]大數(shù)據(jù)背景下微博輿情信息交互模型研究[J]. 蘭月新,董希琳,蘇國(guó)強(qiáng),瞿志凱. 現(xiàn)代圖書情報(bào)技術(shù). 2015(05)
[7]基于LDA的文本聚類在網(wǎng)絡(luò)輿情分析中的應(yīng)用研究[J]. 王少鵬,彭巖,王潔. 山東大學(xué)學(xué)報(bào)(理學(xué)版). 2014(09)
[8]LDA-CF:一種混合協(xié)同過(guò)濾方法[J]. 廉濤,馬軍,王帥強(qiáng),崔超然. 中文信息學(xué)報(bào). 2014(02)
[9]基于TF統(tǒng)計(jì)和語(yǔ)法分析的關(guān)鍵詞提取算法[J]. 戰(zhàn)學(xué)剛,吳強(qiáng). 計(jì)算機(jī)應(yīng)用與軟件. 2014(01)
[10]話題型微博語(yǔ)言特點(diǎn)及其情感分析策略研究[J]. 侯敏,滕永林,李雪燕,陳毓麒,鄭雙美,侯明午,周紅照. 語(yǔ)言文字應(yīng)用. 2013(02)
博士論文
[1]基于主題模型的用戶建模研究[D]. 李文峰.北京郵電大學(xué) 2013
[2]基于主題模型的高空間分辨率遙感影像分類研究[D]. 徐盛.上海交通大學(xué) 2012
碩士論文
[1]基于文本挖掘的網(wǎng)絡(luò)輿情情感傾向及演化分析[D]. 李黎.湘潭大學(xué) 2017
[2]基于主題模型的網(wǎng)絡(luò)輿情監(jiān)控研究[D]. 鐘榮飛.南華大學(xué) 2015
[3]互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 唐勇.北京郵電大學(xué) 2013
[4]互聯(lián)網(wǎng)輿情監(jiān)控分析系統(tǒng)的研究與實(shí)現(xiàn)[D]. 劉德鵬.電子科技大學(xué) 2011
[5]基于網(wǎng)絡(luò)語(yǔ)義挖掘的輿情監(jiān)測(cè)預(yù)警研究[D]. 劉恒文.武漢理工大學(xué) 2010
[6]概率主題模型在文本分類中的應(yīng)用研究[D]. 林洋港.中國(guó)科學(xué)技術(shù)大學(xué) 2009
本文編號(hào):3349868
【文章來(lái)源】:湘潭大學(xué)湖南省
【文章頁(yè)數(shù)】:41 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
傳統(tǒng)網(wǎng)絡(luò)爬蟲抓取流程圖
與主題無(wú)關(guān)的網(wǎng)頁(yè)。可以很清楚的看出,利用基于主題的爬蟲技術(shù)獲取的是更準(zhǔn)確、我們所需要的網(wǎng)面信息,節(jié)約資源并且極大的提高了效率。目前基于主的網(wǎng)絡(luò)爬蟲主要有兩個(gè)方向:一個(gè)是基于內(nèi)容方面分析的策略;另一個(gè)是基于子 URL 分析的策略。我所采用的是基于內(nèi)容分析的策略,首先是需要解析 Web面的內(nèi)容,然后保存與主題相關(guān)的網(wǎng)頁(yè),直接過(guò)濾掉與主題無(wú)關(guān)的頁(yè)面。目前網(wǎng)上開源的基于主題的網(wǎng)絡(luò)爬蟲有許多,學(xué)者們可以根據(jù)自己的實(shí)際需求進(jìn)行應(yīng)的改進(jìn)。基于主題的網(wǎng)絡(luò)爬蟲爬取流程如圖 2.3 所示:
圖 2.4 貿(mào)易戰(zhàn)、黃金為主題的爬蟲結(jié)果截圖在爬取過(guò)程中,爬取的內(nèi)容包括了圖中所體現(xiàn)的幾項(xiàng)內(nèi)容,包括發(fā)布人、發(fā)人 id、發(fā)布人性質(zhì),以及具體內(nèi)容,在輿情信息分析的過(guò)程中,我們主要采具體內(nèi)容進(jìn)行分析,獲取的文本數(shù)量為 20596 條。以貿(mào)易戰(zhàn)、股市為主題的網(wǎng)絡(luò)爬蟲數(shù)據(jù)結(jié)果如圖 2.5 所示:圖 2.5 貿(mào)易戰(zhàn)、股市為主題的爬蟲結(jié)果截圖以貿(mào)易戰(zhàn)、進(jìn)出口為主題的網(wǎng)絡(luò)爬蟲數(shù)據(jù)結(jié)果如圖 2.6 所示:
【參考文獻(xiàn)】:
期刊論文
[1]中美貿(mào)易戰(zhàn)評(píng)析與展望[J]. 梅新育. 中國(guó)勞動(dòng)關(guān)系學(xué)院學(xué)報(bào). 2019(02)
[2]基于LDA主題模型的專利文本分析應(yīng)用研究[J]. 艾楚涵,熊新,吳建德. 科技和產(chǎn)業(yè). 2019(03)
[3]貿(mào)易戰(zhàn)背景下的中美勞動(dòng)力市場(chǎng)分析[J]. 李思思. 中國(guó)市場(chǎng). 2019(07)
[4]在線社交網(wǎng)絡(luò)中的新興話題檢測(cè)技術(shù)綜述[J]. 笱程成,杜攀,劉悅,程學(xué)旗. 中文信息學(xué)報(bào). 2016(05)
[5]大規(guī)模網(wǎng)絡(luò)廣義社區(qū)發(fā)現(xiàn)隨機(jī)變分推理算法[J]. 柴變芳,趙曉鵬. 濟(jì)南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(05)
[6]大數(shù)據(jù)背景下微博輿情信息交互模型研究[J]. 蘭月新,董希琳,蘇國(guó)強(qiáng),瞿志凱. 現(xiàn)代圖書情報(bào)技術(shù). 2015(05)
[7]基于LDA的文本聚類在網(wǎng)絡(luò)輿情分析中的應(yīng)用研究[J]. 王少鵬,彭巖,王潔. 山東大學(xué)學(xué)報(bào)(理學(xué)版). 2014(09)
[8]LDA-CF:一種混合協(xié)同過(guò)濾方法[J]. 廉濤,馬軍,王帥強(qiáng),崔超然. 中文信息學(xué)報(bào). 2014(02)
[9]基于TF統(tǒng)計(jì)和語(yǔ)法分析的關(guān)鍵詞提取算法[J]. 戰(zhàn)學(xué)剛,吳強(qiáng). 計(jì)算機(jī)應(yīng)用與軟件. 2014(01)
[10]話題型微博語(yǔ)言特點(diǎn)及其情感分析策略研究[J]. 侯敏,滕永林,李雪燕,陳毓麒,鄭雙美,侯明午,周紅照. 語(yǔ)言文字應(yīng)用. 2013(02)
博士論文
[1]基于主題模型的用戶建模研究[D]. 李文峰.北京郵電大學(xué) 2013
[2]基于主題模型的高空間分辨率遙感影像分類研究[D]. 徐盛.上海交通大學(xué) 2012
碩士論文
[1]基于文本挖掘的網(wǎng)絡(luò)輿情情感傾向及演化分析[D]. 李黎.湘潭大學(xué) 2017
[2]基于主題模型的網(wǎng)絡(luò)輿情監(jiān)控研究[D]. 鐘榮飛.南華大學(xué) 2015
[3]互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 唐勇.北京郵電大學(xué) 2013
[4]互聯(lián)網(wǎng)輿情監(jiān)控分析系統(tǒng)的研究與實(shí)現(xiàn)[D]. 劉德鵬.電子科技大學(xué) 2011
[5]基于網(wǎng)絡(luò)語(yǔ)義挖掘的輿情監(jiān)測(cè)預(yù)警研究[D]. 劉恒文.武漢理工大學(xué) 2010
[6]概率主題模型在文本分類中的應(yīng)用研究[D]. 林洋港.中國(guó)科學(xué)技術(shù)大學(xué) 2009
本文編號(hào):3349868
本文鏈接:http://sikaile.net/shekelunwen/shgj/3349868.html
最近更新
教材專著