基于微博的個(gè)性化搜索系統(tǒng)
本文關(guān)鍵詞:基于微博的個(gè)性化搜索系統(tǒng)
更多相關(guān)文章: 個(gè)性化搜索 微博搜索 向量空間模型 用戶興趣模型
【摘要】:當(dāng)今,互聯(lián)網(wǎng)技術(shù)飛速發(fā)展,能夠隨時(shí)隨地發(fā)表和分享自己的即興感受成為人們新的需求。微博作為一種新型社會(huì)媒體形式,受到了廣泛的關(guān)注。目前在互聯(lián)網(wǎng)上每天產(chǎn)生數(shù)以百萬計(jì)的微博,給用戶快速尋找所需的微博信息帶來了挑戰(zhàn);谖⒉╅_發(fā)的搜索引擎可以部分解決這一問題。但是,大多數(shù)的搜索引擎都僅僅基于內(nèi)容構(gòu)建,無法滿足不同用戶從海量微博中獲取個(gè)性化信息的需求。因此,如何將個(gè)性化需求融入微博搜索是一個(gè)亟待研究的課題。針對(duì)上述問題,本文通過建立用戶模型,將個(gè)性化信息引入到微博搜索的過程中,在此基礎(chǔ)上,設(shè)計(jì)實(shí)現(xiàn)了一個(gè)基于微博平臺(tái)的個(gè)性化搜索系統(tǒng)。本文所進(jìn)行的研究工作主要涵蓋了以下幾個(gè)方面:首先是對(duì)用戶模型的構(gòu)建展開了深入研究。本文在組建用戶模型過程中主要研究了四個(gè)方面的內(nèi)容,即數(shù)據(jù)獲取、建模技術(shù)、表示方法以及模型更新方式。在個(gè)性化技術(shù)方面,系統(tǒng)主要通過分析用戶原創(chuàng)微博和轉(zhuǎn)發(fā)微博來構(gòu)建用戶興趣模型,對(duì)這兩種微博進(jìn)行了統(tǒng)計(jì),選取詞頻最高的前50個(gè)詞語作為該用戶的興趣關(guān)鍵詞,并在此基礎(chǔ)上實(shí)現(xiàn)了個(gè)性化搜索。然后本文基于Lucene實(shí)現(xiàn)了基于微博平臺(tái)的個(gè)性化搜索功能,并對(duì)系統(tǒng)平臺(tái)的注冊(cè)/登錄模塊、建立索引模塊、興趣模型構(gòu)建模塊、個(gè)性化搜索模塊這四個(gè)關(guān)鍵部分的具體實(shí)現(xiàn)進(jìn)行了詳細(xì)分析。此外,還通過提交查詢?cè)~來對(duì)比系統(tǒng)返回的普通搜索結(jié)果以及個(gè)性化搜索結(jié)果,最后分析了本系統(tǒng)的優(yōu)缺點(diǎn)。綜上所述,本文抓住了當(dāng)前微博平臺(tái)這個(gè)熱點(diǎn)話題,并結(jié)合信息檢索和個(gè)性化領(lǐng)域相關(guān)的理論和技術(shù),設(shè)計(jì)了一個(gè)基于微博平臺(tái)的個(gè)性化搜索系統(tǒng)。
【關(guān)鍵詞】:個(gè)性化搜索 微博搜索 向量空間模型 用戶興趣模型
【學(xué)位授予單位】:湖南科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.3
【目錄】:
- 摘要5-6
- ABSTRACT6-9
- 第一章 緒論9-12
- 1.1 課題選取的背景及意義9-10
- 1.2 本文的研究?jī)?nèi)容10
- 1.3 本文的組織結(jié)構(gòu)10-12
- 第二章 背景知識(shí)12-20
- 2.1 信息檢索12-15
- 2.1.1 信息檢索的歷史12
- 2.1.2 信息檢索的常用術(shù)語12-13
- 2.1.3 信息檢索的常用評(píng)價(jià)方法13-14
- 2.1.4 常用檢索模型14-15
- 2.2 個(gè)性化搜索相關(guān)的過程15-20
- 2.2.1 數(shù)據(jù)獲取方式16
- 2.2.2 建模技術(shù)分類16-17
- 2.2.3 模型表示形式17-18
- 2.2.4 模型更新方法18-20
- 第三章 微博個(gè)性化搜索的研究現(xiàn)狀20-25
- 3.1 個(gè)性化搜索技術(shù)研究現(xiàn)狀20-21
- 3.2 個(gè)性化搜索系統(tǒng)研究現(xiàn)狀21-22
- 3.3 微博相關(guān)技術(shù)研究現(xiàn)狀22-24
- 3.4 微博搜索系統(tǒng)研究現(xiàn)狀24-25
- 第四章 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)25-40
- 4.1 系統(tǒng)總體概要25-26
- 4.2 系統(tǒng)MVC框架26-28
- 4.3 系統(tǒng)詳細(xì)設(shè)計(jì)28-40
- 4.3.1 分詞器的選擇和封裝30-32
- 4.3.2 用戶中心模塊32
- 4.3.3 建立索引模塊32-35
- 4.3.4 興趣模型構(gòu)建模塊35-37
- 4.3.5 普通搜索模塊37-38
- 4.3.6 個(gè)性化搜索模塊38-40
- 第五章 系統(tǒng)演示與測(cè)試40-50
- 5.1 測(cè)試準(zhǔn)備40
- 5.2 系統(tǒng)測(cè)試流程40-47
- 5.2.1 用戶的注冊(cè)和登錄40-43
- 5.2.2 提取用戶興趣關(guān)鍵詞43-45
- 5.2.3 顯示查詢搜索結(jié)果45-47
- 5.3 實(shí)驗(yàn)結(jié)果對(duì)比47-48
- 5.4 系統(tǒng)的不足與改進(jìn)48-50
- 第六章 總結(jié)與展望50-52
- 6.1 全文總結(jié)50
- 6.2 未來展望50-52
- 參考文獻(xiàn)52-54
- 致謝54
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 袁柳;張龍波;;個(gè)性化搜索中的用戶特征模型研究[J];計(jì)算機(jī)工程與應(yīng)用;2011年15期
2 陳晨;李敏波;;基于本地插件的個(gè)性化搜索研究[J];計(jì)算機(jī)應(yīng)用與軟件;2011年05期
3 申艷光;王敏;范永健;;個(gè)性化搜索在農(nóng)產(chǎn)品商務(wù)系統(tǒng)中的應(yīng)用研究[J];安徽農(nóng)業(yè)科學(xué);2011年26期
4 斯蒂芬·卡斯;;個(gè)性化搜索[J];科技創(chuàng)業(yè);2011年08期
5 桑艷艷;劉培剛;李勇;;擬合用戶偏好的個(gè)性化搜索[J];情報(bào)科學(xué);2008年08期
6 軒景泉;王瑋;安正鋒;;分布式教學(xué)資源的個(gè)性化搜索[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2008年05期
7 俞偉明;打造個(gè)性化搜索菜單[J];電腦知識(shí)與技術(shù);2004年16期
8 申艷光;王敏;范永健;;面向隱私保護(hù)的個(gè)性化搜索結(jié)果排序方法研究[J];數(shù)學(xué)的實(shí)踐與認(rèn)識(shí);2011年19期
9 楊軍;武秀川;郭艷燕;;基于跨系統(tǒng)的個(gè)性化搜索系統(tǒng)模型設(shè)計(jì)[J];微處理機(jī);2013年03期
10 帥劍平;周婭;;基于聚類算法的個(gè)性化搜索研究[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2009年01期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前2條
1 李家舒;曹守峰;范文慶;黃瑋;;基于移動(dòng)平臺(tái)的黃頁(yè)個(gè)性化搜索建模技術(shù)研究[A];第九屆中國(guó)通信學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C];2012年
2 陳援非;何哲;朱珍民;;基于普適計(jì)算的個(gè)性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第2屆中國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC'06)論文集[C];2006年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前4條
1 李遠(yuǎn);谷歌發(fā)布個(gè)性化搜索工具 可選屬性保護(hù)個(gè)人隱私權(quán)[N];中華新聞報(bào);2007年
2 Google(谷歌)中國(guó)研究院副院長(zhǎng) 張智威;社區(qū)個(gè)性化搜索漸熱 難在掌握用戶信息[N];中國(guó)電子報(bào);2008年
3 孫仲;傳統(tǒng)搜索遭遇巨大挑戰(zhàn) 個(gè)性化搜索將成趨勢(shì)[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2009年
4 本報(bào)記者 吳艷;眼球操控世界:遠(yuǎn)在天邊,近在眼前[N];中國(guó)知識(shí)產(chǎn)權(quán)報(bào);2012年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 靳婷;基于上下文與面向社會(huì)媒體的信息推薦方法研究[D];復(fù)旦大學(xué);2014年
2 陳冬玲;基于潛在語義的個(gè)性化搜索關(guān)鍵技術(shù)研究[D];東北大學(xué);2009年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 馬凌;基于微博的個(gè)性化搜索系統(tǒng)[D];湖南科技大學(xué);2015年
2 劉俊暉;企業(yè)內(nèi)部個(gè)性化搜索系統(tǒng)的研究與實(shí)現(xiàn)[D];復(fù)旦大學(xué);2008年
3 杜中國(guó);基于半監(jiān)督聚類的個(gè)性化搜索研究[D];青島理工大學(xué);2011年
4 李雪;旅游個(gè)性化搜索系統(tǒng)的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2013年
5 陳晨;基于興趣多邊形的個(gè)性化搜索系統(tǒng)的研究與實(shí)現(xiàn)[D];復(fù)旦大學(xué);2010年
6 陳琛;基于社會(huì)化標(biāo)簽的個(gè)性化搜索研究[D];揚(yáng)州大學(xué);2008年
7 范慧;以博客內(nèi)容為對(duì)象的個(gè)性化搜索研究[D];華中科技大學(xué);2010年
8 王敏;個(gè)性化搜索中隱私保護(hù)的問題研究[D];河北工程大學(xué);2012年
9 宋懿;電視節(jié)目的個(gè)性化搜索研究[D];上海交通大學(xué);2008年
10 舒平芬;個(gè)性化搜索中用戶語義意圖自動(dòng)識(shí)別技術(shù)研究[D];東北大學(xué);2008年
,本文編號(hào):1015806
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1015806.html