天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于PBTM的海量微博主題發(fā)現(xiàn)

發(fā)布時(shí)間:2017-10-12 01:46

  本文關(guān)鍵詞:基于PBTM的海量微博主題發(fā)現(xiàn)


  更多相關(guān)文章: 主題模型 主題發(fā)現(xiàn) PBTM 吉布斯采樣 分布式計(jì)算


【摘要】:BTM(biterm topic model)能較好挖掘出微博主題。但面對(duì)海量微博,BTM無(wú)法勝任,因?yàn)锽TM挖掘主題速度過(guò)慢;诖,提出一種基于吉布斯采樣本主機(jī)biterm元組來(lái)更新主題單詞全局矩陣的分布式的BTM模型PBTM(parallel biterm topic model),通過(guò)多臺(tái)主機(jī)同時(shí)對(duì)語(yǔ)料庫(kù)進(jìn)行本主機(jī)biterm吉布斯采樣,然后每次迭代后更新全局主題單詞矩陣,直到采樣收斂。通過(guò)MPI集群實(shí)現(xiàn)PBTM模型,實(shí)驗(yàn)結(jié)果表明,PBTM主題挖掘微博文本速度較BTM大大加快。
【作者單位】: 武漢大學(xué)計(jì)算機(jī)學(xué)院;
【關(guān)鍵詞】主題模型 主題發(fā)現(xiàn) PBTM 吉布斯采樣 分布式計(jì)算
【基金】:國(guó)家自然科學(xué)基金重點(diǎn)項(xiàng)目(61133012);國(guó)家自然科學(xué)基金面上項(xiàng)目(61173062)
【分類號(hào)】:TP393.092
【正文快照】: 微博即微博客,始于美國(guó)Twitter公司,是一個(gè)基于用戶關(guān)系信息分享、傳播以及獲取的平臺(tái)。用戶可以通過(guò)Web、WAP等各種客戶端組建個(gè)人社區(qū),以140字左右的文字更新信息,并實(shí)現(xiàn)即時(shí)分享。同時(shí)本土的微博服務(wù)在這幾年非常盛行,其中騰訊微博、新浪微博最為流行。如何快速?gòu)倪@種海量

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條

1 張晨逸;孫建伶;丁軼群;;基于MB-LDA模型的微博主題挖掘[J];計(jì)算機(jī)研究與發(fā)展;2011年10期

【共引文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 孫乃利;王玉龍;沈奇威;;微博客意見領(lǐng)袖識(shí)別的研究[J];電信技術(shù);2012年12期

2 王君澤;馬靜;杜洪濤;;微博輿情分析平臺(tái)的框架與支撐技術(shù)研究[J];電子政務(wù);2013年01期

3 馬慧芳;王博;;基于增量主題模型的微博在線事件分析[J];計(jì)算機(jī)工程;2013年03期

4 余淼淼;王俊麗;趙曉東;岳曉冬;;PAM概率主題模型研究綜述[J];計(jì)算機(jī)科學(xué);2013年05期

5 謝昊;江紅;;一種面向微博主題挖掘的改進(jìn)LDA模型[J];華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年06期

6 馬雯雯;魏文晗;鄧一貴;;基于隱含語(yǔ)義分析的微博話題發(fā)現(xiàn)方法[J];計(jì)算機(jī)工程與應(yīng)用;2014年01期

7 王楨文;肖衛(wèi)東;譚文堂;;基于概率生成模型的網(wǎng)絡(luò)數(shù)據(jù)分類方法[J];計(jì)算機(jī)研究與發(fā)展;2013年12期

8 孫勁光;馬志芳;孟祥福;;基于情感詞屬性和云模型的文本情感分類方法[J];計(jì)算機(jī)工程;2013年12期

9 賴錦輝;梁松;;一種消除孤立點(diǎn)的微博熱點(diǎn)話題發(fā)現(xiàn)方法[J];計(jì)算機(jī)應(yīng)用與軟件;2014年01期

10 姜曉偉;王建民;丁貴廣;;基于主題模型的微博重要話題發(fā)現(xiàn)與排序方法[J];計(jì)算機(jī)研究與發(fā)展;2013年S1期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前1條

1 劉娜;肖智博;路瑩;唐曉君;肖鵬;;自適應(yīng)主題融合的多文檔自動(dòng)摘要算法[A];2013年中國(guó)智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(第五分冊(cè))[C];2013年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前8條

1 劉娜;文本自動(dòng)摘要和信息抽取方法及其應(yīng)用研究[D];大連海事大學(xué);2012年

2 田占偉;基于復(fù)雜網(wǎng)絡(luò)的微博信息傳播研究[D];哈爾濱工業(yè)大學(xué);2012年

3 呂英杰;網(wǎng)絡(luò)健康社區(qū)中的文本挖掘方法研究[D];上海交通大學(xué);2013年

4 段亞娟;微博搜索的關(guān)鍵技術(shù)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年

5 丁兆云;面向微博輿情的影響力分析關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年

6 苑衛(wèi)國(guó);微博用戶行為分析和網(wǎng)絡(luò)結(jié)構(gòu)演化的研究[D];北京交通大學(xué);2014年

7 陳靜茜;表演的狂歡:網(wǎng)絡(luò)社會(huì)的個(gè)體自我呈現(xiàn)與交往行為[D];復(fù)旦大學(xué);2013年

8 肖智博;排序主題模型及其應(yīng)用研究[D];大連海事大學(xué);2014年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 姜楊;基于社會(huì)化媒體節(jié)點(diǎn)屬性的信息預(yù)測(cè)研究[D];北京郵電大學(xué);2012年

2 熊會(huì)會(huì);基于復(fù)雜網(wǎng)絡(luò)的微博客信息傳播機(jī)制研究[D];華南理工大學(xué);2012年

3 鄒鴻程;微博話題檢測(cè)與追蹤技術(shù)研究[D];解放軍信息工程大學(xué);2012年

4 何翔;基于微博的主題社區(qū)發(fā)現(xiàn)[D];華東理工大學(xué);2013年

5 邱洋;微博數(shù)據(jù)提取及話題檢測(cè)方法研究[D];大連理工大學(xué);2013年

6 王偉;Web挖掘技術(shù)及其在互聯(lián)網(wǎng)中的應(yīng)用研究[D];山東大學(xué);2013年

7 王熙;基于用戶關(guān)系分析和微博內(nèi)容挖掘的信息推薦系統(tǒng)研究[D];北京郵電大學(xué);2013年

8 詹勇;基于主題模型和混合模型的微博客交叉話題發(fā)現(xiàn)研究[D];西南交通大學(xué);2013年

9 謝昊;基于主題模型的微博推薦系統(tǒng)研究[D];華東師范大學(xué);2013年

10 張思龍;微博熱點(diǎn)話題預(yù)判技術(shù)研究[D];解放軍信息工程大學(xué);2013年

,

本文編號(hào):1015985

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1015985.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3fa55***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com