天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于微博的用戶興趣分析與個性化信息推薦

發(fā)布時間:2018-11-07 14:29
【摘要】:在過去的十幾年中,互聯(lián)網(wǎng)上的信息量迅速增加,人們從信息匱乏時代進(jìn)入了信息過載時代。隨之而來的是人們獲取信息的方式的轉(zhuǎn)變,從傳統(tǒng)的人工尋找,到搜索引擎,再到現(xiàn)在的推薦系統(tǒng)。如何有效地給用戶推薦有用的信息,最重要的一個環(huán)節(jié)就是如何有效地獲取用戶興趣。微博等社交網(wǎng)絡(luò)的出現(xiàn)給我們提供了一個新的分析用戶興趣的巨大的數(shù)據(jù)源,成為近幾年研究的熱點(diǎn)。 本文對如何使用微博數(shù)據(jù)分析用戶興趣,以及進(jìn)行個性化推薦的方法進(jìn)行了分析和探索。與現(xiàn)有的工作相比,本文主要有以下幾點(diǎn)不同。首先,考慮到每條微博內(nèi)容都比較短的特點(diǎn),我們并沒有直接在微博數(shù)據(jù)上使用主題模型,而是使用外部知識庫構(gòu)建主題模型,用以對微博內(nèi)容進(jìn)行語義豐富,同時也避免了在微博數(shù)據(jù)上主題數(shù)目不容易確定的問題。其次,我們認(rèn)為并不是所有微博都是與用戶興趣相關(guān)的,也就是所謂的噪音微博,,而這些噪音微博會對模型效果造成影響。因此,我們從多個方面分析了用以識別噪音微博的特征,構(gòu)建了一個聯(lián)合分類器過濾掉噪音微博。最后,我們認(rèn)為用戶興趣是會隨時間變化的,提出了時間加權(quán)的主題分布來描述用戶興趣。在實驗中,我們把我們的算法同非負(fù)矩陣分解算法和直接在微博數(shù)據(jù)上使用主題模型的算法比較。實驗結(jié)果表明,本文的算法能夠更有效地發(fā)現(xiàn)用戶的實時興趣。而且,在用戶微博數(shù)量比較少或者噪音微博比較多的情況下,依然可以有效地分析出用戶興趣。
[Abstract]:In the past ten years, the amount of information on the Internet has increased rapidly, and people have moved from the era of information scarcity to the era of information overload. What follows is the change in the way people obtain information, from traditional manual search to search engine, and then to the present recommendation system. How to effectively recommend useful information to users, the most important link is how to effectively obtain user interest. The emergence of social networks such as Weibo has provided us with a new huge data source for analyzing users' interests, and has become a hot research topic in recent years. This paper analyzes and explores how to use Weibo data to analyze user interest and to carry out personalized recommendation. Compared with the existing work, this paper has the following main differences. First of all, considering that each Weibo content is relatively short, we do not directly use the topic model on Weibo data, but use an external knowledge base to build a topic model, which is used to enrich the semantic content of Weibo. At the same time, it avoids the problem that the number of topics on Weibo's data is not easy to determine. Secondly, we think that not all Weibo is related to user interest, the so-called noise Weibo, which will affect the effect of the model. Therefore, we analyze the features of noise Weibo from several aspects, and construct a combined classifier to filter out the noise Weibo. Finally, we propose a time-weighted topic distribution to describe user interest. In the experiment, our algorithm is compared with the non-negative matrix decomposition algorithm and the algorithm which uses the topic model directly on Weibo data. Experimental results show that the proposed algorithm can more effectively detect the real-time interest of users. Moreover, when the number of users Weibo is relatively small or the noise Weibo is more, user interest can still be effectively analyzed.
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP393.092;TP391.3

【參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 劉維湘;鄭南寧;游屈波;;非負(fù)矩陣分解及其在模式識別中的應(yīng)用[J];科學(xué)通報;2006年03期



本文編號:2316647

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2316647.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶35eb3***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
狠狠干狠狠操在线播放| 清纯少妇被捅到高潮免费观看| 绝望的校花花间淫事2| 国产亚洲欧美另类久久久| 在线免费观看一二区视频| 黑鬼糟蹋少妇资源在线观看| 人妻熟女欲求不满一区二区| 国内尹人香蕉综合在线| 邻居人妻人公侵犯人妻视频| 老鸭窝精彩从这里蔓延| 最新日韩精品一推荐日韩精品| 在线视频免费看你懂的| 99久久成人精品国产免费| 精品日韩欧美一区久久| 99久热只有精品视频免费看| 老司机这里只有精品视频| 蜜桃传媒在线正在播放| av在线免费观看在线免费观看 | 中文字幕乱码免费人妻av| 亚洲av熟女一区二区三区蜜桃 | 少妇特黄av一区二区三区| 色欧美一区二区三区在线| 日韩一区二区三区四区乱码视频| 黄色片国产一区二区三区| 亚洲妇女黄色三级视频| 欧美久久一区二区精品| 欧洲一级片一区二区三区| 日韩夫妻午夜性生活视频| 尹人大香蕉一级片免费看| 亚洲欧美日韩精品永久| 欧美国产日韩变态另类在线看| 黄片免费播放一区二区| 亚洲中文字幕在线观看黑人| 成人亚洲国产精品一区不卡| 国产精品久久香蕉国产线| 中文字幕亚洲视频一区二区| 精品欧美一区二区三久久| 成人午夜在线视频观看| 国产精品福利一级久久| 不卡中文字幕在线视频| 国产精品久久精品毛片|