基于AT模型的微博用戶興趣挖掘研究
本文關(guān)鍵詞:基于AT模型的微博用戶興趣挖掘研究
更多相關(guān)文章: 微博 主題挖掘 AT模型 吉布斯采樣
【摘要】:隨著微博的日趨流行與廣泛使用,新浪等微博網(wǎng)站已經(jīng)成為海量信息的來源,雖然傳統(tǒng)的文本主題挖掘方法已經(jīng)得到廣泛的應(yīng)用研究,但對于微博這種特殊結(jié)構(gòu)的文本,傳統(tǒng)的挖掘算法不能很好地對其進行研究。為了彌補目前微博平臺主題挖掘方法的不足,以及考慮到微博信息的稀疏性,多維性等特點,提出有針對性的預(yù)處理方法,將用戶微博數(shù)據(jù)與AT模型結(jié)合,通過吉布斯采樣進行微博主題挖掘,對作者主題進一步提取得到用戶興趣。通過在真實數(shù)據(jù)集上的實驗,以及與LDA模型對比,證明該模型能有效得到微博主題。
【作者單位】: 遼寧工程技術(shù)大學(xué)軟件學(xué)院;
【基金】:國家自然科學(xué)基金(No.60903082) 遼寧省教育廳項目(No.L2012113)
【分類號】:TP393.092;TP391.1
【正文快照】: 1引言作為一個提供用戶互相交流與分享信息的社交網(wǎng)站,微博以其簡單、便捷,傳遞速度快等特性,受到廣大用戶的青睞,并風(fēng)靡全球。著名的Twitter微博網(wǎng)站用戶數(shù)已經(jīng)突破5億[1],而截至2012年8月,新浪微博用戶數(shù)已達3.65億。用戶不僅可以通過微博網(wǎng)站平臺發(fā)布自己最新的情況、表達
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前8條
1 吳晶;張品;羅辛;盛浩;熊璋;;門戶個性化興趣獲取與遷移模式發(fā)現(xiàn)[J];計算機研究與發(fā)展;2007年08期
2 張晨逸;孫建伶;丁軼群;;基于MB-LDA模型的微博主題挖掘[J];計算機研究與發(fā)展;2011年10期
3 康楠;金蓓弘;李京;;面向Blog的興趣挖掘和推薦系統(tǒng)[J];計算機工程;2008年02期
4 徐戈;王厚峰;;自然語言處理中主題模型的發(fā)展[J];計算機學(xué)報;2011年08期
5 刁宇峰;楊亮;林鴻飛;;基于LDA模型的博客垃圾評論發(fā)現(xiàn)[J];中文信息學(xué)報;2011年01期
6 石晶;范猛;李萬龍;;基于LDA模型的主題分析[J];自動化學(xué)報;2009年12期
7 唐曉波;王洪艷;;基于潛在語義分析的微博主題挖掘模型研究[J];圖書情報工作;2012年24期
8 趙愛華;劉培玉;鄭燕;;基于LDA的新聞話題子話題劃分方法[J];小型微型計算機系統(tǒng);2013年04期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 郭力軍;朱群雄;;基于RSS數(shù)據(jù)源的用戶興趣模型改進及應(yīng)用[J];北京化工大學(xué)學(xué)報(自然科學(xué)版);2011年01期
2 胡艷麗;白亮;張維明;;網(wǎng)絡(luò)輿情中一種基于OLDA的在線話題演化方法[J];國防科技大學(xué)學(xué)報;2012年01期
3 孫乃利;王玉龍;沈奇威;;微博客意見領(lǐng)袖識別的研究[J];電信技術(shù);2012年12期
4 朱然;李德華;;新聞聚合系統(tǒng)中的數(shù)據(jù)挖掘技術(shù)初探[J];電腦知識與技術(shù);2013年01期
5 王君澤;馬靜;杜洪濤;;微博輿情分析平臺的框架與支撐技術(shù)研究[J];電子政務(wù);2013年01期
6 葛昊;葉艷;包西林;吳敏;;基于主題模型的英語寫作批閱系統(tǒng)個性化推薦模塊設(shè)計與實現(xiàn)[J];科技和產(chǎn)業(yè);2013年06期
7 王旭仁;姚葉鵬;冉春風(fēng);何發(fā)鎂;;一種并行LDA主題模型建立方法研究[J];北京理工大學(xué)學(xué)報;2013年06期
8 劉江鳴;徐金安;張玉潔;;基于隱主題馬爾科夫模型的多特征自動文摘[J];北京大學(xué)學(xué)報(自然科學(xué)版);2014年01期
9 鄭誠;熊大康;劉倩倩;;基于卡方特征選擇和LDA主題模型的中文短文本分類[J];電腦知識與技術(shù);2014年13期
10 談成訪;汪材印;;基于LDA模型的新聞話題分類研究[J];電腦知識與技術(shù);2014年16期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 劉娜;肖智博;路瑩;唐曉君;肖鵬;;自適應(yīng)主題融合的多文檔自動摘要算法[A];2013年中國智能自動化學(xué)術(shù)會議論文集(第五分冊)[C];2013年
2 丁兆云;王暉;;一種詞位置相關(guān)的LDA模型[A];2013第一屆中國指揮控制大會論文集[C];2013年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉慧君;用戶瀏覽模式挖掘方法與應(yīng)用研究[D];重慶大學(xué);2010年
2 劉娜;文本自動摘要和信息抽取方法及其應(yīng)用研究[D];大連海事大學(xué);2012年
3 張冬梅;文本情感分類及觀點摘要關(guān)鍵問題研究[D];山東大學(xué);2012年
4 賈冬梅;基于數(shù)據(jù)挖掘方法的聶莉芳教授治療慢性腎小球腎炎經(jīng)驗研究[D];中國中醫(yī)科學(xué)院;2012年
5 王志軍;面向標(biāo)識商品的RFID網(wǎng)絡(luò)情境信息管理研究[D];東華大學(xué);2013年
6 羅遠勝;跨語言信息檢索中雙語主題模型及算法研究[D];江西財經(jīng)大學(xué);2013年
7 段東圣;社會網(wǎng)絡(luò)中群組探測和話題建模技術(shù)研究[D];華中科技大學(xué);2013年
8 陸前;英、漢跨語言話題檢測與跟蹤技術(shù)研究[D];中央民族大學(xué);2013年
9 劉杰;食品安全突發(fā)事件跨媒體信息的語義分析與分類研究[D];北京郵電大學(xué);2013年
10 田占偉;基于復(fù)雜網(wǎng)絡(luò)的微博信息傳播研究[D];哈爾濱工業(yè)大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 曾凡興;基于用戶興趣和瀏覽行為的個性化推薦技術(shù)研究[D];江西農(nóng)業(yè)大學(xué);2011年
2 戎怡;局部描述特征結(jié)合概率潛在語義模型的場景分類技術(shù)研究[D];燕山大學(xué);2010年
3 王嵩;基于貝葉斯理論的社會化標(biāo)注主題聚類模型研究[D];江蘇科技大學(xué);2011年
4 劉星;基于融合分類器的垃圾評論識別方法研究[D];天津大學(xué);2012年
5 刁宇峰;基于博客的作者聲譽度分析[D];大連理工大學(xué);2011年
6 劉慧;基于Agent元搜索引擎的個性化研究[D];東華大學(xué);2012年
7 姜楊;基于社會化媒體節(jié)點屬性的信息預(yù)測研究[D];北京郵電大學(xué);2012年
8 劉紅艷;基于hLDA層次主題模型的多文檔摘要技術(shù)研究[D];北京郵電大學(xué);2012年
9 蔣,
本文編號:1163678
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1163678.html