天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

融合word2vec和Single-Pass的微博話題檢測(cè)方法研究

發(fā)布時(shí)間:2021-01-01 06:45
  近年來(lái),微博借助于其自身的草根性、便捷性和對(duì)時(shí)事的迅速傳播性越來(lái)越受到大眾的歡迎,成為中國(guó)大眾了解時(shí)事和參與熱門(mén)話題討論的主流媒體。微博是一種通過(guò)關(guān)注機(jī)制共享的短文本實(shí)時(shí)信息的廣播式社交媒體和網(wǎng)絡(luò)平臺(tái),基于該平臺(tái)信息可以通過(guò)用戶關(guān)系進(jìn)行信息共享、傳播和獲取。用戶間的相互交流和傳播產(chǎn)生了多種多樣的話題,微博的即時(shí)性極大的推進(jìn)了話題的發(fā)展,形成并傳播了熱門(mén)話題。在一些引起廣大網(wǎng)友討論的微博話題中,參與閱讀和互動(dòng)的用戶數(shù)量已達(dá)到過(guò)數(shù)千萬(wàn),這些話題通常蘊(yùn)含著重要的信息,并具有很強(qiáng)的社會(huì)影響力度,引起了眾多專家學(xué)者的關(guān)注。因此,如何從大量的微博文本中準(zhǔn)確的挖掘出熱門(mén)話題具有重要意義;诖,本文研究的工作圍繞提高微博話題檢測(cè)的準(zhǔn)確性主要包括以下三個(gè)方面:(1)提出一種基于Word2vec和句子結(jié)構(gòu)的內(nèi)容樹(shù)文本表示方法,提高計(jì)算文本相似度的準(zhǔn)確性首先,在文本中提取特征詞,將該特征詞與文本分詞后的其它詞語(yǔ)根據(jù)皮爾遜相關(guān)系數(shù)進(jìn)行相關(guān)度計(jì)算,創(chuàng)建內(nèi)容樹(shù);其次,借助內(nèi)容樹(shù)將詞語(yǔ)根據(jù)相鄰詞之間的相關(guān)性構(gòu)造依賴于句子結(jié)構(gòu)的詞向量;然后對(duì)得到的所有詞向量求平均值得到句向量表示;最后將該方法通過(guò)中文文本分類和文本... 

【文章來(lái)源】:山東師范大學(xué)山東省

【文章頁(yè)數(shù)】:44 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

融合word2vec和Single-Pass的微博話題檢測(cè)方法研究


CBOW模型

模型圖,模型,文檔,解釋性


a圖?2-4?PV-DBOW?模型??eC模型的優(yōu)點(diǎn)是能夠成功捕獲對(duì)于文檔表示有用但未知的功能,而為固定的大小,不會(huì)出現(xiàn)維度災(zāi)難的問(wèn)題;同時(shí)存在的缺點(diǎn)在于特缺乏解釋性,文檔向量中的每個(gè)值都不能提供任何有關(guān)文檔的明確

詞語(yǔ),皮爾遜相關(guān)系數(shù),示例,求平均值


圖3-丨某影評(píng)內(nèi)容樹(shù)示例??在該部分中,根據(jù)TF-IDF和皮爾遜相關(guān)系數(shù)可以對(duì)文本的詞語(yǔ)根據(jù)詞語(yǔ)之間的相??關(guān)度建立內(nèi)容樹(shù),如圖3-2所示。建立內(nèi)容樹(shù)后,我們需要根據(jù)建立的內(nèi)容樹(shù)進(jìn)行更新??詞向量,將新更新后的詞向量進(jìn)行求平均值得到句向量的表示。??ITF-1DF?‘?|特征伉W大的詞??卜本対1?1?(wordl)??Word2vcc??詞向置?丨乂'‘'、.!■’(』_創(chuàng)違內(nèi)容樹(shù)??圖3-2創(chuàng)建內(nèi)容樹(shù)流程??12??

【參考文獻(xiàn)】:
期刊論文
[1]基于word2vec詞模型的中文短文本分類方法[J]. 高明霞,李經(jīng)緯.  山東大學(xué)學(xué)報(bào)(工學(xué)版). 2019(02)
[2]一種基于word2vec的文本分類方法[J]. 薛煒明,侯霞,李寧.  北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(01)
[3]基于Word2vec的句子語(yǔ)義相似度計(jì)算研究[J]. 李曉,解輝,李立杰.  計(jì)算機(jī)科學(xué). 2017(09)
[4]文本相似度計(jì)算方法研究綜述[J]. 陳二靜,姜恩波.  數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2017(06)
[5]網(wǎng)絡(luò)輿情話題檢測(cè)技術(shù)研究[J]. 張尚韜.  廣東石油化工學(xué)院學(xué)報(bào). 2017(03)
[6]基于改進(jìn)的OLDA模型話題檢測(cè)及演化分析[J]. 余本功,張衛(wèi)春,王龍飛.  情報(bào)雜志. 2017(02)
[7]基于Word2Vec的一種文檔向量表示[J]. 唐明,朱磊,鄒顯春.  計(jì)算機(jī)科學(xué). 2016(06)
[8]基于LDA模型和多層聚類的微博話題檢測(cè)[J]. 劉紅兵,李文坤,張仰森.  計(jì)算機(jī)技術(shù)與發(fā)展. 2016(06)
[9]基于LDA的新聞話題子話題劃分方法[J]. 趙愛(ài)華,劉培玉,鄭燕.  小型微型計(jì)算機(jī)系統(tǒng). 2013(04)
[10]國(guó)內(nèi)中文自動(dòng)分詞技術(shù)研究綜述[J]. 奉國(guó)和,鄭偉.  圖書(shū)情報(bào)工作. 2011(02)

博士論文
[1]基于內(nèi)容的互聯(lián)網(wǎng)輿情信息挖掘關(guān)鍵技術(shù)研究[D]. 劉玉國(guó).山東大學(xué) 2011

碩士論文
[1]基于半監(jiān)督DPMM的新聞話題檢測(cè)研究[D]. 姚冬冬.河北大學(xué) 2017
[2]基于主題模型的話題聚類算法的研究[D]. 張丹.北京郵電大學(xué) 2017
[3]基于大數(shù)據(jù)的互聯(lián)網(wǎng)熱點(diǎn)話題挖掘的研究與實(shí)現(xiàn)[D]. 趙宗飛.華南理工大學(xué) 2016
[4]基于word2vec的中文文本相似度研究與實(shí)現(xiàn)[D]. 吳多堅(jiān).西安電子科技大學(xué) 2016
[5]深度詞匯網(wǎng)絡(luò)學(xué)習(xí)輿情監(jiān)測(cè)關(guān)鍵技術(shù)的研究[D]. 馮佳明.北京化工大學(xué) 2015
[6]網(wǎng)絡(luò)輿情的熱點(diǎn)檢測(cè)及趨勢(shì)分析研究[D]. 張敬.華南理工大學(xué) 2013
[7]基于文本的網(wǎng)絡(luò)輿情話題跟蹤的研究[D]. 廖秀玲.昆明理工大學(xué) 2012
[8]中文短語(yǔ)相似度計(jì)算方法研究及應(yīng)用[D]. 王瑩瑩.長(zhǎng)沙理工大學(xué) 2008



本文編號(hào):2951122

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2951122.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3e214***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
国产亚洲欧美另类久久久| 少妇激情在线免费观看| 老司机这里只有精品视频| 日韩人妻精品免费一区二区三区| 91精品国自产拍老熟女露脸 | 一区二区在线激情视频| 国产av熟女一区二区三区四区 | 欧美精品二区中文乱码字幕高清| 久久精品久久久精品久久| 国产不卡最新在线视频| 亚洲国产欧美精品久久| 国产精品一区二区成人在线| 日本欧美一区二区三区在线播| 国产精品乱子伦一区二区三区| 亚洲一区二区福利在线| 国产av一区二区三区麻豆| 日本最新不卡免费一区二区| 91香蕉国产观看免费人人| 亚洲中文字幕在线乱码av| 青青久久亚洲婷婷中文网| 青草草在线视频免费视频| 精品人妻av区波多野结依| 精品久久久一区二区三| 四季精品人妻av一区二区三区 | 国产亚洲中文日韩欧美综合网| 国产在线观看不卡一区二区 | 欧美激情一区=区三区| 色婷婷在线精品国自产拍| 免费观看潮喷到高潮大叫| 中文字幕av诱惑一区二区| 欧美日韩在线视频一区| 久久精品国产亚洲av麻豆| 日韩精品在线观看一区| 日韩成人h视频在线观看| 尹人大香蕉一级片免费看| 在线免费视频你懂的观看| 亚洲最大的中文字幕在线视频| 色婷婷成人精品综合一区| 国产又大又猛又粗又长又爽| 精品国产亚洲av久一区二区三区| 男人和女人草逼免费视频|