面向現(xiàn)代制造業(yè)的行業(yè)輿情新聞熱點(diǎn)發(fā)現(xiàn)及分析方法研究
發(fā)布時(shí)間:2021-12-15 22:41
伴隨著先進(jìn)制造技術(shù)和信息技術(shù)的開展,現(xiàn)代制造業(yè)運(yùn)用信息技術(shù)提升傳統(tǒng)產(chǎn)業(yè),放大最終產(chǎn)品的信息含量使其增值,提升企業(yè)競爭力。具體而言,在工業(yè)產(chǎn)品的生產(chǎn)銷售過程中,若能妥善利用行業(yè)輿情,可為企業(yè)提供產(chǎn)品升級或營銷策略調(diào)整提供理論依據(jù)。本文針對五個(gè)新聞門戶網(wǎng)站的新聞及評論數(shù)據(jù)開展熱點(diǎn)事件識別、熱點(diǎn)新聞分布特征分析、熱點(diǎn)話題聚類和情感分析方面的研究。主要工作和成果如下:1.為獲取實(shí)驗(yàn)數(shù)據(jù),本文設(shè)計(jì)并實(shí)現(xiàn)了針對五個(gè)新聞門戶網(wǎng)站的采集系統(tǒng);為探究熱點(diǎn)新聞與用戶行為之間的聯(lián)系,以采集到的新聞及評論為樣本,分析其空間時(shí)間的分布特征,并改良基于Hacker News的熱度算法,用于提取新聞當(dāng)中最受用戶關(guān)注的部分。2.為從不斷涌現(xiàn)的新聞報(bào)道中獲取熱點(diǎn)新聞事件信息,本文提出了一種基于評論的熱點(diǎn)新聞事件識別方法,利用結(jié)合時(shí)間因素在內(nèi)的相似度計(jì)算方法,進(jìn)行熱點(diǎn)事件識別,再通過實(shí)驗(yàn)對方法中的識別因子進(jìn)行探究,得到最優(yōu)參數(shù)配置。3.針對企業(yè)需要了解用戶需求及網(wǎng)友討論話題強(qiáng)度來引導(dǎo)產(chǎn)品升級及改變營銷策略的目的,本文設(shè)計(jì)了一種基于主題模型的主題聚類框架,并以汽車產(chǎn)業(yè)為例,驗(yàn)證其應(yīng)用于某一行業(yè)的可行性。4.為對熱點(diǎn)話題除關(guān)...
【文章來源】:浙江科技學(xué)院浙江省
【文章頁數(shù)】:88 頁
【學(xué)位級別】:碩士
【部分圖文】:
汽車領(lǐng)域詞典(局部)
圖 4-9 BosonNLP 情感詞典完成后,運(yùn)用 Word2Vec 對其進(jìn)行擴(kuò)展。W是:Skip-gram 模型和 CBOW 模型。前好相反,依據(jù)上下文預(yù)測當(dāng)前詞語概率權(quán)重相同,于是被稱為 continuous bag-of足夠數(shù)量的詞即可,跟取出的順序沒有關(guān)散向量進(jìn)行訓(xùn)練,采用 Word2Vec 中 Ski圖 4-10 所示。詞典擴(kuò)展(如圖 4-11 所示)可簡述為:感評價(jià)詞集,對部分情感評價(jià)詞進(jìn)行人工語結(jié)合 HowNet 中的正負(fù)情感評價(jià)詞語人工標(biāo)注的詞語,向量化表示得到的詞的相似度,從而獲得對應(yīng)相似度最高的詞
圖 5-4 新聞實(shí)況圖 5-5 評論實(shí)況表 5-4 標(biāo)準(zhǔn)事件集事件號 事件名稱 相關(guān)新聞數(shù)量1 法院凍結(jié)樂視創(chuàng)始人賈躍亭的資產(chǎn) 5042 保定容大在有爭議的平局后威脅退出中超聯(lián)賽 110
【參考文獻(xiàn)】:
期刊論文
[1]層次聚類的算法研究[J]. 周世杰. 課程教育研究. 2018(40)
[2]基于Python的Web信息獲取方法研究[J]. 魏冬梅,何忠秀,唐建梅. 軟件導(dǎo)刊. 2018(01)
[3]基于Scrapy的論文引用爬蟲的設(shè)計(jì)與實(shí)現(xiàn)[J]. 魯繼文. 現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2017(09)
[4]基于多標(biāo)記學(xué)習(xí)的汽車評論文本多性能識別[J]. 張晶,李德玉,王素格. 計(jì)算機(jī)工程與科學(xué). 2016(01)
[5]中文社會媒體環(huán)境下半監(jiān)督學(xué)習(xí)的汽車缺陷識別方法[J]. 蔣翠清,王齊林,劉士喜,丁勇,劉堯. 中國管理科學(xué). 2014(S1)
[6]網(wǎng)絡(luò)新聞跟帖中網(wǎng)民情感表達(dá)分析——以網(wǎng)易新聞跟帖為個(gè)案[J]. 姚江龍,汪芳啟. 編輯之友. 2013(11)
[7]Redis在高速緩存系統(tǒng)中的應(yīng)用[J]. 曾超宇,李金香. 微型機(jī)與應(yīng)用. 2013(12)
[8]淺談網(wǎng)絡(luò)新聞跟帖[J]. 董延波. 新聞傳播. 2011(12)
[9]網(wǎng)絡(luò)新聞跟帖評論的特點(diǎn)及功能[J]. 唐紅,王懷春. 新聞愛好者. 2011(23)
[10]基于語義理解的文本傾向性識別機(jī)制[J]. 徐琳宏,林鴻飛,楊志豪. 中文信息學(xué)報(bào). 2007(01)
碩士論文
[1]基于Scrapy的分布式網(wǎng)絡(luò)新聞抓取系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 馬聯(lián)帥.西安電子科技大學(xué) 2015
[2]基于主題網(wǎng)絡(luò)爬蟲的汽車行業(yè)多元信息web系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 馬漢超.西南交通大學(xué) 2015
[3]新浪網(wǎng)新聞跟帖區(qū)域化特征研究[D]. 孫溢.河北大學(xué) 2014
[4]專利文獻(xiàn)主題發(fā)現(xiàn)方法的比較研究[D]. 賈龍飛.大連理工大學(xué) 2014
[5]Web2.0環(huán)境下汽車制造企業(yè)客戶需求知識獲取研究[D]. 賈浩.合肥工業(yè)大學(xué) 2012
[6]汽車行業(yè)負(fù)面網(wǎng)絡(luò)口碑識別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 黃雅琪.華中科技大學(xué) 2013
本文編號:3537272
【文章來源】:浙江科技學(xué)院浙江省
【文章頁數(shù)】:88 頁
【學(xué)位級別】:碩士
【部分圖文】:
汽車領(lǐng)域詞典(局部)
圖 4-9 BosonNLP 情感詞典完成后,運(yùn)用 Word2Vec 對其進(jìn)行擴(kuò)展。W是:Skip-gram 模型和 CBOW 模型。前好相反,依據(jù)上下文預(yù)測當(dāng)前詞語概率權(quán)重相同,于是被稱為 continuous bag-of足夠數(shù)量的詞即可,跟取出的順序沒有關(guān)散向量進(jìn)行訓(xùn)練,采用 Word2Vec 中 Ski圖 4-10 所示。詞典擴(kuò)展(如圖 4-11 所示)可簡述為:感評價(jià)詞集,對部分情感評價(jià)詞進(jìn)行人工語結(jié)合 HowNet 中的正負(fù)情感評價(jià)詞語人工標(biāo)注的詞語,向量化表示得到的詞的相似度,從而獲得對應(yīng)相似度最高的詞
圖 5-4 新聞實(shí)況圖 5-5 評論實(shí)況表 5-4 標(biāo)準(zhǔn)事件集事件號 事件名稱 相關(guān)新聞數(shù)量1 法院凍結(jié)樂視創(chuàng)始人賈躍亭的資產(chǎn) 5042 保定容大在有爭議的平局后威脅退出中超聯(lián)賽 110
【參考文獻(xiàn)】:
期刊論文
[1]層次聚類的算法研究[J]. 周世杰. 課程教育研究. 2018(40)
[2]基于Python的Web信息獲取方法研究[J]. 魏冬梅,何忠秀,唐建梅. 軟件導(dǎo)刊. 2018(01)
[3]基于Scrapy的論文引用爬蟲的設(shè)計(jì)與實(shí)現(xiàn)[J]. 魯繼文. 現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2017(09)
[4]基于多標(biāo)記學(xué)習(xí)的汽車評論文本多性能識別[J]. 張晶,李德玉,王素格. 計(jì)算機(jī)工程與科學(xué). 2016(01)
[5]中文社會媒體環(huán)境下半監(jiān)督學(xué)習(xí)的汽車缺陷識別方法[J]. 蔣翠清,王齊林,劉士喜,丁勇,劉堯. 中國管理科學(xué). 2014(S1)
[6]網(wǎng)絡(luò)新聞跟帖中網(wǎng)民情感表達(dá)分析——以網(wǎng)易新聞跟帖為個(gè)案[J]. 姚江龍,汪芳啟. 編輯之友. 2013(11)
[7]Redis在高速緩存系統(tǒng)中的應(yīng)用[J]. 曾超宇,李金香. 微型機(jī)與應(yīng)用. 2013(12)
[8]淺談網(wǎng)絡(luò)新聞跟帖[J]. 董延波. 新聞傳播. 2011(12)
[9]網(wǎng)絡(luò)新聞跟帖評論的特點(diǎn)及功能[J]. 唐紅,王懷春. 新聞愛好者. 2011(23)
[10]基于語義理解的文本傾向性識別機(jī)制[J]. 徐琳宏,林鴻飛,楊志豪. 中文信息學(xué)報(bào). 2007(01)
碩士論文
[1]基于Scrapy的分布式網(wǎng)絡(luò)新聞抓取系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 馬聯(lián)帥.西安電子科技大學(xué) 2015
[2]基于主題網(wǎng)絡(luò)爬蟲的汽車行業(yè)多元信息web系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 馬漢超.西南交通大學(xué) 2015
[3]新浪網(wǎng)新聞跟帖區(qū)域化特征研究[D]. 孫溢.河北大學(xué) 2014
[4]專利文獻(xiàn)主題發(fā)現(xiàn)方法的比較研究[D]. 賈龍飛.大連理工大學(xué) 2014
[5]Web2.0環(huán)境下汽車制造企業(yè)客戶需求知識獲取研究[D]. 賈浩.合肥工業(yè)大學(xué) 2012
[6]汽車行業(yè)負(fù)面網(wǎng)絡(luò)口碑識別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 黃雅琪.華中科技大學(xué) 2013
本文編號:3537272
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3537272.html
最近更新
教材專著