基于主題模型的企業(yè)微博推薦方法研究與實(shí)現(xiàn)
本文關(guān)鍵詞:基于主題模型的企業(yè)微博推薦方法研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:隨著PC互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)開(kāi)始融入人們的生活,人們?cè)诰W(wǎng)上的活動(dòng)變得越來(lái)越頻繁,微博作為一種新興的社交平臺(tái)的出現(xiàn),滿足了人們信息獲取、日常交流等目的。企業(yè)微博作為一種特殊的微博群體,可以幫助企業(yè)更加方便地進(jìn)行產(chǎn)品營(yíng)銷、客戶溝通以及行業(yè)信息動(dòng)態(tài)把握,從而可以從中挖掘出更多的商機(jī),促進(jìn)企業(yè)發(fā)展。然而由于微博平臺(tái)信息過(guò)載的問(wèn)題,對(duì)于某些企業(yè)微博用戶來(lái)講,關(guān)注用戶數(shù)過(guò)多導(dǎo)致很多行業(yè)相關(guān)的微博消息被其他消息所掩蓋,未關(guān)注到的行業(yè)相關(guān)的企業(yè)微博用戶發(fā)布的有潛在價(jià)值的消息難以獲得,如何從包含大量無(wú)關(guān)信息的微博集合中找出行業(yè)相關(guān)的微博,從而進(jìn)行行業(yè)情況的分析,這對(duì)于企業(yè)的發(fā)展有著至關(guān)重要的作用。傳統(tǒng)的文本挖掘方法多采用向量空間模型的方式進(jìn)行,而向量空間模型的方法存在自身的缺陷,就是只能根據(jù)文字表面的意義進(jìn)行分析,無(wú)法挖掘文本潛在的深層次的含義,導(dǎo)致了很多有用信息的丟失,而近年來(lái)才出現(xiàn)的主題模型在文本挖掘方面的能力已經(jīng)通過(guò)實(shí)踐得到了證明,相對(duì)于傳統(tǒng)的文本挖掘方法,基于主題模型的文本挖掘?qū)τ诎l(fā)現(xiàn)文本潛在的主題特征有很好的效果。對(duì)于企業(yè)微博文本來(lái)說(shuō),使用主題模型進(jìn)行建?梢院芎玫赝诰虺銎髽I(yè)微博用戶的行業(yè)興趣或者對(duì)不同的行業(yè)微博消息進(jìn)行區(qū)分,這可以幫助企業(yè)更好更快地獲取到所需要的行業(yè)相關(guān)的商業(yè)信息,從而進(jìn)行決策。本文基于主題模型來(lái)對(duì)企業(yè)微博用戶進(jìn)行行業(yè)主題建模,同時(shí)使用向量空間模型進(jìn)行行業(yè)特征選擇,從而建立企業(yè)微博用戶的行業(yè)向量,并在以上基礎(chǔ)上實(shí)現(xiàn)企業(yè)微博用戶以及企業(yè)微博消息的推薦,本文研究的工作體現(xiàn)在以下兩個(gè)方面:1.本文通過(guò)BIG DATA爬蟲(chóng)開(kāi)放平臺(tái)獲取了新浪企業(yè)微博消息作為實(shí)驗(yàn)數(shù)據(jù),并且使用了LDA模型和作者主題模型ATM實(shí)現(xiàn)企業(yè)微博用戶主題維度的行業(yè)興趣建模,實(shí)驗(yàn)證明對(duì)于企業(yè)微博進(jìn)行主題建模是可行的,其中作者主題模型ATM的建模效果要優(yōu)于LDA模型的建模效果,這是因?yàn)長(zhǎng)DA模型對(duì)于短文本的主題建模效果不理想,而ATM模型中將微博消息以用戶為單位整合后在一定程度上消除了文本長(zhǎng)度過(guò)短的缺點(diǎn)。2.在使用主題模型對(duì)各個(gè)企業(yè)微博用戶進(jìn)行主題建模之后,接著對(duì)各類行業(yè)的微博進(jìn)行行業(yè)特征選擇,并使用向量空間模型得出每個(gè)企業(yè)微博用戶的行業(yè)興趣向量,然后將主題模型得到的主題相似度計(jì)算結(jié)果和向量空間模型得到的行業(yè)興趣向量相似度計(jì)算結(jié)果進(jìn)行線性合并,從而將最終得出的行業(yè)相關(guān)性計(jì)算結(jié)果來(lái)作為企業(yè)微博用戶和消息推薦的依據(jù),實(shí)驗(yàn)結(jié)果表明本文提出的推薦方法在企業(yè)微博用戶以及企業(yè)微博消息推薦上都有不錯(cuò)的效果。
【關(guān)鍵詞】:主題模型 企業(yè)微博 LDA 微博推薦 ATM
【學(xué)位授予單位】:安徽大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.3
【目錄】:
- 摘要3-5
- Abstract5-9
- 第一章 緒論9-16
- 1.1 課題背景及其意義9-10
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀10-13
- 1.3 本文主要工作13-14
- 1.4 本文組織結(jié)構(gòu)14-15
- 1.5 本章小結(jié)15-16
- 第二章 相關(guān)技術(shù)概述16-29
- 2.1 傳統(tǒng)文本挖掘方法16-18
- 2.1.1 TFIDF16-17
- 2.1.2 余弦相似度17
- 2.1.3 JS散度17-18
- 2.2 主題模型18-25
- 2.2.1 LSI主題模型20-21
- 2.2.2 PLSI主題模型21-22
- 2.2.3 LDA主題模型22-23
- 2.2.4 ATM主題模型23-25
- 2.3 微博推薦算法概述25-28
- 2.3.1 基于內(nèi)容的推薦25
- 2.3.2 基于協(xié)同過(guò)濾的推薦25-27
- 2.3.3 混合技術(shù)推薦27-28
- 2.4 本章小結(jié)28-29
- 第三章 企業(yè)微博用戶興趣建模29-39
- 3.1 基于主題模型的企業(yè)微博用戶行業(yè)興趣建模29-30
- 3.1.1 基于標(biāo)準(zhǔn)LDA的企業(yè)微博用戶行業(yè)興趣建模29-30
- 3.1.2 基于ATM的企業(yè)微博用戶行業(yè)興趣建模30
- 3.2 模型性能測(cè)試實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析30-36
- 3.2.1 數(shù)據(jù)集30-32
- 3.2.2 數(shù)據(jù)預(yù)處理32-34
- 3.2.3 評(píng)價(jià)方法34
- 3.2.4 實(shí)驗(yàn)結(jié)果分析34-36
- 3.3 向量空間模型中企業(yè)微博用戶行業(yè)興趣建模36-38
- 3.3.1 企業(yè)微博行業(yè)特征選擇36-37
- 3.3.2 向量空間模型中企業(yè)微博用戶建模37-38
- 3.4 本章小結(jié)38-39
- 第四章 針對(duì)企業(yè)微博用戶的個(gè)性化信息推薦39-60
- 4.1 企業(yè)微博用戶推薦39-47
- 4.1.1 企業(yè)微博用戶相似度計(jì)算39-40
- 4.1.2 評(píng)價(jià)方法40-41
- 4.1.3 企業(yè)微博用戶推薦方法41-44
- 4.1.4 企業(yè)微博用戶推薦實(shí)驗(yàn)44-47
- 4.2 企業(yè)微博消息推薦47-58
- 4.2.1 微博消息和微博用戶的相似度計(jì)算48-49
- 4.2.2 評(píng)價(jià)方法49-50
- 4.2.3 企業(yè)微博消息推薦方法50-53
- 4.2.4 企業(yè)微博消息推薦實(shí)驗(yàn)53-58
- 4.3 本章小結(jié)58-60
- 第五章 總結(jié)和展望60-62
- 5.1 總結(jié)60-61
- 5.2 展望61-62
- 參考文獻(xiàn)62-66
- 附錄A 圖索引66-67
- Appendix A Figure Index67-68
- 附錄B 表索引68-69
- Appendix B Table Index69-70
- 致謝70
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 吳玲達(dá),謝毓湘,欒悉道,肖鵬;互聯(lián)網(wǎng)多媒體主題信息自動(dòng)收集與處理系統(tǒng)的研制[J];計(jì)算機(jī)應(yīng)用研究;2005年05期
2 蔣凡,高俊波,張敏,王煦法;BBS中主題發(fā)現(xiàn)原型系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2005年31期
3 周亦鵬;杜軍平;;基于時(shí)空情境模型的主題跟蹤[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年08期
4 陳雄;都云程;李渝勤;施水才;;基于頁(yè)面結(jié)構(gòu)分析的論壇主題信息定位方法研究[J];微計(jì)算機(jī)信息;2010年27期
5 何利益;陸國(guó)鋒;羅鵬;;動(dòng)態(tài)新聞主題信息推薦系統(tǒng)設(shè)計(jì)[J];指揮信息系統(tǒng)與技術(shù);2013年04期
6 關(guān)慧芬;師軍;;基于本體的主題爬蟲(chóng)技術(shù)研究[J];計(jì)算機(jī)仿真;2009年10期
7 張宇;宋巍;劉挺;李生;;基于URL主題的查詢分類方法[J];計(jì)算機(jī)研究與發(fā)展;2012年06期
8 歐健文,董守斌,蔡斌;模板化網(wǎng)頁(yè)主題信息的提取方法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年S1期
9 呂聚旺;都云程;王弘蔚;施水才;;基于新型主題信息量化方法的Web主題信息提取研究[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2008年12期
10 朱夢(mèng)麟;李光耀;周毅敏;;基于樹(shù)比較的Web頁(yè)面主題信息抽取[J];微型機(jī)與應(yīng)用;2011年19期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前6條
1 吳晨;宋丹;薛德軍;師慶輝;;科技主題識(shí)別及表示[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
2 熊方;王曉宇;鄭駿;周傲英;;ITED:一種基于鏈接的主題提取和主題發(fā)現(xiàn)系統(tǒng)[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年
3 王玉婷;杜亞軍;涂騰濤;;基于Web鏈接的主題爬行蟲(chóng)初始URL的研究[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
4 馮少卿;都云程;施水才;;基于模板的網(wǎng)頁(yè)主題信息抽取[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
5 王琦;唐世渭;楊冬青;王騰蛟;;基于DOM的網(wǎng)頁(yè)主題信息自動(dòng)提取[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
6 刁宇峰;王昊;林鴻飛;楊亮;;博客中重復(fù)評(píng)論發(fā)現(xiàn)[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條
1 楊肖;基于主題的互聯(lián)網(wǎng)信息抓取研究[D];浙江大學(xué);2014年
2 趙一鳴;基于多維尺度分析的潛在主題可視化研究[D];華中師范大學(xué);2013年
3 吳永輝;面向?qū)I(yè)領(lǐng)域的網(wǎng)絡(luò)信息采集及主題檢測(cè)技術(shù)研究與應(yīng)用[D];哈爾濱工業(yè)大學(xué);2010年
4 薛利;面向證券應(yīng)用的WEB主題觀點(diǎn)挖掘若干關(guān)鍵問(wèn)題研究[D];復(fù)旦大學(xué);2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 解琰;主題優(yōu)化過(guò)濾方法研究與應(yīng)用[D];大連海事大學(xué);2015年
2 楊春艷;基于語(yǔ)義和引用加權(quán)的文獻(xiàn)主題提取研究[D];浙江大學(xué);2015年
3 盧洋;基于主題模型的混合推薦算法研究[D];電子科技大學(xué);2014年
4 黃志;基于維基歧義頁(yè)的搜索結(jié)果聚類方法研究[D];北京理工大學(xué);2015年
5 王亮;基于主題模型的文本挖掘的研究[D];大連理工大學(xué);2015年
6 任昱鳳;基于Hadoop的分布式主題爬蟲(chóng)及其實(shí)現(xiàn)[D];陜西師范大學(xué);2015年
7 韓琳;基于貝葉斯主題爬蟲(chóng)的研究與實(shí)現(xiàn)[D];北京工業(yè)大學(xué);2015年
8 黎楠;面向?qū)@闹黝}挖掘技術(shù)研究及應(yīng)用[D];北京工業(yè)大學(xué);2015年
9 劉學(xué)江;超大規(guī)模社交網(wǎng)絡(luò)中基于結(jié)構(gòu)與主題的社團(tuán)挖掘[D];電子科技大學(xué);2015年
10 黃文強(qiáng);安卓技術(shù)信息的主題爬蟲(chóng)技術(shù)研究與實(shí)現(xiàn)[D];東南大學(xué);2015年
本文關(guān)鍵詞:基于主題模型的企業(yè)微博推薦方法研究與實(shí)現(xiàn),,由筆耕文化傳播整理發(fā)布。
本文編號(hào):258677
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/258677.html