基于LDA主題模型的用戶興趣發(fā)現(xiàn)方法
本文關鍵詞:基于LDA主題模型的用戶興趣發(fā)現(xiàn)方法
更多相關文章: 用戶興趣 短文本 LDA 特征拓展 K-means
【摘要】:用戶興趣是對微博用戶研究的重要內容,本文使用聚類方法提取用戶興趣。由于微博短文本的特征稀疏和上下文依賴性,傳統(tǒng)方法不能取得良好的效果。本文對微博短文本進行基于LDA主題模型的特征拓展處理。LDA主題模型引入隱含主題,通過主題相似性,在一定程度上拓展文本特征,彌補原文本特征稀疏的缺點。并且,在處理多義詞時,主題相似性能明顯區(qū)分不同詞義,以解決上下文依賴問題。在此基礎上,通過文本聚類方法提取用戶興趣。通過實驗表明,在引入LDA模型下,聚類效果和用戶興趣抽取的到明顯提升,有效解決的微博用戶興趣發(fā)現(xiàn)中文博短文本特征稀疏和上下文依賴問題。
【作者單位】: 北京郵電大學計算機學院;
【關鍵詞】: 用戶興趣 短文本 LDA 特征拓展 K-means
【基金】:國家重點基礎研究發(fā)展計劃(973)(2013CB329606)
【分類號】:TP391.1
【正文快照】: 0引言用戶興趣是對微博用戶研究的重要內容,本研究中使用文本聚類方法發(fā)掘用戶興趣,文本聚類技術一直是文本挖掘領域的重要內容。而微博短文本由于具有短小、新詞多、不規(guī)范等特點,如果直接使用傳統(tǒng)的方法往往不能取得很好的效果。對微博文本的研究,具有十分重要的理論研究和
【參考文獻】
中國期刊全文數(shù)據庫 前1條
1 楊亮;林原;林鴻飛;;基于情感分布的微博熱點事件發(fā)現(xiàn)[J];中文信息學報;2012年01期
【共引文獻】
中國期刊全文數(shù)據庫 前10條
1 邵力;喬墩;;網絡熱點事件微博評論中的情感沖突分析[J];蘭州大學學報(社會科學版);2016年06期
2 李燕飛;;高校心理困難學生動態(tài)監(jiān)測系統(tǒng)的建構[J];赤峰學院學報(自然科學版);2016年17期
3 李明;王高飛;;基于微博平臺的企業(yè)網絡口碑危機預警研究[J];北方經貿;2016年08期
4 萬紅新;彭云;鄭睿穎;;時序化LDA的輿情文本動態(tài)主題提取[J];計算機與現(xiàn)代化;2016年07期
5 張梅;程利偉;;基于Apriori算法的事件識別方法研究[J];數(shù)字技術與應用;2016年05期
6 陳福;林闖;薛超;徐月梅;孟坤;倪藝函;;短句語義向量計算方法[J];通信學報;2016年02期
7 李進華;安仲杰;;基于地理坐標的微博事件檢測與分析[J];現(xiàn)代圖書情報技術;2016年02期
8 王冠群;田雪;黃德根;張婧;;中文微博觀點句識別及要素抽取研究[J];數(shù)據采集與處理;2016年01期
9 鄧佳煜;;突發(fā)性公共危機在微博平臺上的傳播——以昆明火車站暴力恐怖事件為例[J];新媒體研究;2015年18期
10 胡改麗;陳婷;陳福集;鄭小雪;;我國網絡輿情熱度分析文獻綜述[J];情報科學;2016年01期
【二級參考文獻】
中國期刊全文數(shù)據庫 前7條
1 黎志升;王煦法;;基于Language Model的地理信息檢索模型(英文)[J];中國科學技術大學學報;2010年02期
2 陳建美;林鴻飛;楊志豪;;基于語法的情感詞匯自動獲取[J];智能系統(tǒng)學報;2009年02期
3 劉康;趙軍;;基于層疊CRFs模型的句子褒貶度分析研究[J];中文信息學報;2008年01期
4 邢永康;馬少平;;統(tǒng)計語言模型綜述[J];計算機科學;2003年09期
5 李保利,俞士汶;話題識別與跟蹤研究[J];計算機工程與應用;2003年17期
6 徐琳宏;林鴻飛;潘宇;任惠;陳建美;;情感詞匯本體的構造[J];情報學報;2008年02期
7 陳建美;林鴻飛;;中文情感常識知識庫的構建[J];情報學報;2009年04期
【相似文獻】
中國期刊全文數(shù)據庫 前10條
1 王杰;使圖像的編輯更加容易[J];中文信息;1998年Z1期
2 王波,姚敏;基于信息抽取的匿名用戶興趣描述[J];華南理工大學學報(自然科學版);2004年S1期
3 董全德;;用戶興趣遷移模式與個性化服務[J];電腦知識與技術(學術交流);2007年17期
4 鄭運剛;馬建國;;基于分類的用戶興趣漂移模型[J];情報雜志;2008年01期
5 張濤;;基于瀏覽歷史的用戶興趣提取模型[J];軟件導刊;2009年06期
6 楊杰;陳恩紅;;面向個性化服務的用戶興趣偏移檢測及處理方法[J];電子技術;2009年11期
7 陳圣兵;李龍澍;紀霞;;多層次用戶興趣模式的動態(tài)捕捉[J];計算機工程與應用;2009年36期
8 鄭曉健;龐淑英;何英;;一種面向主題的用戶興趣挖掘模型研究[J];昆明學院學報;2010年03期
9 花青松;劉海峰;胡錚;;基于基尼系數(shù)的用戶興趣分布模式度量方法[J];計算機工程;2012年22期
10 孫雨生;劉偉;仇蓉蓉;黃傳慧;;國內用戶興趣建模研究進展[J];情報雜志;2013年05期
中國重要會議論文全文數(shù)據庫 前7條
1 趙琦;駱志剛;田文穎;李聰;丁凡;;一種基于負反饋信息的用戶興趣模型修正方法[A];中國通信學會第六屆學術年會論文集(下)[C];2009年
2 孫靜;郭奇;張志強;馮建華;;一種基于面向領域檢索系統(tǒng)的用戶興趣獲取方法[A];第二十一屆中國數(shù)據庫學術會議論文集(技術報告篇)[C];2004年
3 孫鐵利;教巍巍;;基于馬爾科夫模型的用戶興趣導航模型系統(tǒng)(英文)[A];計算機技術與應用進展——全國第17屆計算機科學與技術應用(CACIS)學術會議論文集(上冊)[C];2006年
4 廖祝華;劉建勛;易愛平;;基于用戶興趣的Web服務發(fā)現(xiàn)[A];2006年全國開放式分布與并行計算機學術會議論文集(三)[C];2006年
5 李曉黎;史忠植;梁永全;劉福桃;;INTERNET網上一種識別用戶興趣的學習方法[A];第十六屆全國數(shù)據庫學術會議論文集[C];1999年
6 田萱;杜小勇;;基于SAM模型的用戶興趣表示研究[A];第二十三屆中國數(shù)據庫學術會議論文集(技術報告篇)[C];2006年
7 王勇;劉奕群;張敏;馬少平;茹立云;;基于用戶興趣分析的網頁生命周期建模(英文)[A];第三屆全國信息檢索與內容安全學術會議論文集[C];2007年
中國重要報紙全文數(shù)據庫 前1條
1 中國科學院計算技術研究所 王 斌;內容為王[N];計算機世界;2004年
中國博士學位論文全文數(shù)據庫 前9條
1 梁政;面向在線社交網絡輿情的信息傳播分析關鍵技術研究[D];國防科學技術大學;2014年
2 張召;在線論壇用戶興趣圖譜發(fā)現(xiàn)與個性化信息推薦[D];華東師范大學;2012年
3 劉淇;基于用戶興趣建模的推薦方法及應用研究[D];中國科學技術大學;2013年
4 郭巖;網絡日志中用戶興趣的挖掘及利用[D];中國科學院研究生院(計算技術研究所);2004年
5 吳麗輝;個性化的Web信息采集技術研究[D];中國科學院研究生院(計算技術研究所);2005年
6 謝興;社會網絡中興趣發(fā)現(xiàn)與信息組織的研究[D];復旦大學;2011年
7 李東勝;基于興趣與保護隱私的在線社區(qū)推薦技術研究[D];復旦大學;2012年
8 陳浩;Web搜索的用戶興趣與智能優(yōu)化研究[D];中南大學;2012年
9 姜邵巍;基于競爭關系的推薦技術研究[D];北京郵電大學;2014年
中國碩士學位論文全文數(shù)據庫 前10條
1 陳媛媛;用戶興趣圖譜演化機制研究[D];武漢理工大學;2014年
2 梁潤庭(Runting Leung);面向微博用戶的興趣識別算法的研究與實現(xiàn)[D];西南交通大學;2015年
3 俞忻峰;新浪微博的數(shù)據采集和推薦方案研究[D];南京理工大學;2015年
4 楊梅;基于樹型網絡的多源用戶興趣數(shù)據融合方法研究[D];四川師范大學;2015年
5 石光蓮;基于形式概念分析的Folksonomy用戶興趣識別研究[D];西南大學;2015年
6 湯文清;微博用戶的興趣及性格分析[D];上海大學;2015年
7 梅佩;基于瀏覽內容的用戶興趣研究[D];北京化工大學;2015年
8 張少杰;基于用戶興趣的微博廣告投放系統(tǒng)的設計與實現(xiàn)[D];山西大學;2015年
9 黃龍偉;基于蟻群算法的WEB日志用戶興趣路徑研究[D];江西師范大學;2015年
10 方正;微博短文本分析技術研究及應用[D];電子科技大學;2014年
,本文編號:960956
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/960956.html