個(gè)性化新聞事件推薦系統(tǒng)的研究與實(shí)現(xiàn)
本文關(guān)鍵詞:個(gè)性化新聞事件推薦系統(tǒng)的研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:網(wǎng)絡(luò)普及帶動(dòng)了新聞產(chǎn)業(yè)的變革,網(wǎng)絡(luò)新聞成為公眾獲取實(shí)時(shí)資訊的重要方式之一?墒敲鎸(duì)海量的網(wǎng)絡(luò)新聞,公眾往往很難快速定位自己感興趣的新聞;诖,新聞事件發(fā)現(xiàn)技術(shù)應(yīng)運(yùn)而生,它能夠從互聯(lián)網(wǎng)中挖掘出熱點(diǎn)話題,幫助用戶了解當(dāng)前熱點(diǎn);個(gè)性化推薦技術(shù)可以根據(jù)用戶的行為習(xí)慣,挖掘其興趣點(diǎn),從而向用戶推薦其可能感興趣的新聞。當(dāng)前,事件發(fā)現(xiàn)技術(shù)及個(gè)性化推薦技術(shù)在信息領(lǐng)域均獲得普遍應(yīng)用,但是,事件發(fā)現(xiàn)技術(shù)挖掘出的熱點(diǎn)話題并不一定是每一個(gè)用戶都感興趣的;個(gè)性化推薦技術(shù)只能完成單一新聞的推薦功能,并不能把用戶感興趣的事件推薦給用戶;诖,本文提出一種個(gè)性化新聞事件推薦方法,將新聞事件發(fā)現(xiàn)技術(shù)與個(gè)性化推薦技術(shù)融為一體,該方法能夠挖掘出新聞事件,并為用戶進(jìn)行個(gè)性化推薦。本次課題研究的主要工作列述如下:(1)實(shí)現(xiàn)一種基于融合模型的改進(jìn)層次聚類算法。在計(jì)算新聞間相似度時(shí),該算法基于TF-IDF的VSM模型與基于LDA主題模型按一定比例加權(quán)求和的方式進(jìn)行相似度計(jì)算;在計(jì)算簇間距離時(shí),該算法引入簇中心距離與簇間新聞最遠(yuǎn)距離,使得這一算法在計(jì)算簇間距離時(shí)更加準(zhǔn)確。實(shí)證研究結(jié)果顯示,本文所提算法與傳統(tǒng)層次聚類算法相比,顯著提升了準(zhǔn)確率。(2)實(shí)現(xiàn)一種基于混合推薦的新聞事件推薦算法。該算法采用兩種方式建立用戶的興趣模型,其一根據(jù)事件的多重特征以及用戶的行為習(xí)慣構(gòu)建目標(biāo)用戶的興趣模型,其二根據(jù)用戶瀏覽的新聞標(biāo)題建立用戶基于LDA主題模型的興趣模型;然后,基于VSM模型與LDA主題模型按一定比例加權(quán)求和的方式計(jì)算不同用戶間的相似度,得到目標(biāo)用戶的鄰居用戶集合,以集合中用戶的共同偏好,來(lái)挖掘目標(biāo)用戶的興趣點(diǎn),最后,向目標(biāo)用戶推薦其可能感興趣的新聞事件。通過(guò)本文的實(shí)驗(yàn)證明,該算法具有較高的準(zhǔn)確率和召回率。(3)依據(jù)現(xiàn)實(shí)需求,本文開(kāi)發(fā)出個(gè)性化新聞事件推薦系統(tǒng)。實(shí)證研究表明,本系統(tǒng)基本可以實(shí)現(xiàn)新聞事件發(fā)現(xiàn)以及新聞事件推薦的預(yù)設(shè)功能目標(biāo),運(yùn)行穩(wěn)定、高效。
【關(guān)鍵詞】:LDA主題模型 層次聚類 新聞事件 用戶興趣模型 推薦系統(tǒng)
【學(xué)位授予單位】:北京工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.3
【目錄】:
- 摘要4-5
- Abstract5-10
- 第1章 緒論10-16
- 1.1 研究背景和意義10-11
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀11-13
- 1.2.1 事件發(fā)現(xiàn)技術(shù)的研究現(xiàn)狀11-12
- 1.2.2 個(gè)性化推薦技術(shù)的研究現(xiàn)狀12-13
- 1.3 論文的研究目標(biāo)和主要工作13-14
- 1.3.1 任務(wù)目標(biāo)13
- 1.3.2 難點(diǎn)分析13-14
- 1.3.3 解決方案14
- 1.4 論文的結(jié)構(gòu)安排14-16
- 第2章 關(guān)鍵技術(shù)介紹16-24
- 2.1 事件發(fā)現(xiàn)技術(shù)16-18
- 2.1.1 特征詞選擇16-17
- 2.1.2 聚類算法17-18
- 2.2 用戶興趣模型介紹18-19
- 2.3 個(gè)性化推薦方法19-23
- 2.3.1 基于內(nèi)容的推薦19-20
- 2.3.2 協(xié)同過(guò)濾推薦20-22
- 2.3.3 混合推薦22-23
- 2.4 本章小結(jié)23-24
- 第3章 基于融合模型的改進(jìn)層次聚類算法24-38
- 3.1 文本向量化24-29
- 3.1.1 基于TF-IDF的VSM模型24-25
- 3.1.2 LDA主題模型25-29
- 3.2 文本相似度計(jì)算29-32
- 3.2.1 常用距離計(jì)算方法29-30
- 3.2.2 本文使用的方法30-32
- 3.3 改進(jìn)的層次聚類算法32-36
- 3.3.1 傳統(tǒng)層次聚類算法存在的問(wèn)題33-34
- 3.3.2 改進(jìn)的層次聚類算法描述34-36
- 3.4 基于簇信息的事件特征計(jì)算36-37
- 3.5 本章小結(jié)37-38
- 第4章 基于混合推薦的新聞事件推薦算法38-48
- 4.1 新聞事件模型38
- 4.1.1 新聞事件模型的表示38
- 4.2 用戶興趣模型38-42
- 4.2.1 基于事件的用戶興趣模型39-41
- 4.2.2 基于LDA主題模型的用戶興趣模型41-42
- 4.3 個(gè)性化推薦算法42-47
- 4.3.1 傳統(tǒng)推薦算法現(xiàn)存問(wèn)題43
- 4.3.2 本文推薦算法的總體設(shè)計(jì)43-45
- 4.3.3 本文推薦策略的詳細(xì)方案45-47
- 4.4 本章小結(jié)47-48
- 第5章 個(gè)性化新聞事件推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)48-56
- 5.1 系統(tǒng)需求分析48
- 5.2 系統(tǒng)總體設(shè)計(jì)48-49
- 5.2.1 系統(tǒng)架構(gòu)圖48-49
- 5.3 系統(tǒng)詳細(xì)設(shè)計(jì)49-55
- 5.3.1 數(shù)據(jù)采集模塊50-51
- 5.3.2 數(shù)據(jù)存儲(chǔ)模塊51-52
- 5.3.3 數(shù)據(jù)預(yù)處理模塊52-53
- 5.3.4 新聞聚類模塊53-54
- 5.3.5 事件推薦模塊54-55
- 5.4 本章小結(jié)55-56
- 第6章 實(shí)驗(yàn)結(jié)果與分析56-66
- 6.1 實(shí)驗(yàn)運(yùn)行環(huán)境56
- 6.2 針對(duì)新聞聚類的功能測(cè)試56-60
- 6.2.1 實(shí)驗(yàn)數(shù)據(jù)56
- 6.2.2 評(píng)價(jià)指標(biāo)56-57
- 6.2.3 實(shí)驗(yàn)結(jié)果分析57-60
- 6.3 針對(duì)新聞推薦的功能測(cè)試60-65
- 6.3.1 實(shí)驗(yàn)數(shù)據(jù)60
- 6.3.2 評(píng)價(jià)指標(biāo)60-61
- 6.3.3 實(shí)驗(yàn)結(jié)果分析61-65
- 6.4 本章小結(jié)65-66
- 結(jié)論與展望66-68
- 參考文獻(xiàn)68-72
- 攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文72-74
- 致謝74
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 米可菲;張勇;邢春曉;蔚欣;;面向大數(shù)據(jù)的開(kāi)源推薦系統(tǒng)分析[J];計(jì)算機(jī)與數(shù)字工程;2013年10期
2 脫建勇;王嵩;李秀;劉文煌;;精品課共享中的推薦系統(tǒng)框架與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2006年17期
3 蘇冠賢;張麗霞;林丕源;劉吉平;;生物信息學(xué)推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用研究;2007年05期
4 王改芬;;推薦系統(tǒng)研究綜述[J];軟件導(dǎo)刊;2007年23期
5 葉群來(lái);;營(yíng)銷與網(wǎng)絡(luò)推薦系統(tǒng)[J];電子商務(wù);2007年10期
6 李媚;;個(gè)性化網(wǎng)絡(luò)學(xué)習(xí)資源推薦系統(tǒng)研究[J];福建電腦;2008年12期
7 潘冉;姜麗紅;;基于經(jīng)濟(jì)學(xué)模型的推薦系統(tǒng)的研究[J];計(jì)算機(jī)應(yīng)用與軟件;2008年03期
8 劉魯;任曉麗;;推薦系統(tǒng)研究進(jìn)展及展望[J];信息系統(tǒng)學(xué)報(bào);2008年01期
9 劉小燕;陳艷麗;賈宗璞;沈記全;;基于增強(qiáng)學(xué)習(xí)的旅行計(jì)劃推薦系統(tǒng)[J];計(jì)算機(jī)工程;2010年21期
10 曹畋;;智能推薦系統(tǒng)在知識(shí)瀏覽領(lǐng)域的應(yīng)用[J];硅谷;2011年21期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前8條
1 張燕;李燕萍;;基于內(nèi)容分析和點(diǎn)擊率記錄的混合音樂(lè)推薦系統(tǒng)[A];2009年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2009年
2 趙欣;寇綱;鄔文帥;盧艷群;;基于時(shí)間密集性的推薦系統(tǒng)攻擊檢測(cè)[A];第六屆(2011)中國(guó)管理學(xué)年會(huì)論文摘要集[C];2011年
3 張玉連;張波;張敏;;改進(jìn)的個(gè)性化信息推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年全國(guó)理論計(jì)算機(jī)科學(xué)學(xué)術(shù)年會(huì)論文集[C];2005年
4 王君;許潔萍;;層次音樂(lè)推薦系統(tǒng)的研究[A];第18屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2009)、第5屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2009)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2009)論文集[C];2009年
5 潘宇;林鴻飛;楊志豪;;基于用戶聚類的電子商務(wù)推薦系統(tǒng)[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
6 尤忠彬;陳越;張英;朱揚(yáng)勇;;基于Web服務(wù)的技術(shù)轉(zhuǎn)移平臺(tái)推薦系統(tǒng)研究[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
7 王國(guó)霞;劉賀平;李擎;;二部圖影射及其在推薦系統(tǒng)中的應(yīng)用[A];第25屆中國(guó)控制與決策會(huì)議論文集[C];2013年
8 王雪;董愛(ài)華;吳怡之;;基于RFID技術(shù)的智能服裝推薦系統(tǒng)設(shè)計(jì)[A];2011年全國(guó)電子信息技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2011年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前2條
1 ;大數(shù)據(jù)如何“落地”[N];中國(guó)新聞出版報(bào);2014年
2 本報(bào)記者 鄒大斌;大數(shù)據(jù):電商新武器[N];計(jì)算機(jī)世界;2012年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 周魏;推薦系統(tǒng)中基于目標(biāo)項(xiàng)目分析的托攻擊檢測(cè)研究[D];重慶大學(xué);2015年
2 田剛;融合維基知識(shí)的情境感知Web服務(wù)發(fā)現(xiàn)方法研究[D];武漢大學(xué);2015年
3 胡亮;集成多元信息的推薦系統(tǒng)建模方法的研究[D];上海交通大學(xué);2015年
4 王宏宇;商務(wù)推薦系統(tǒng)的設(shè)計(jì)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年
5 楊東輝;基于情感相似度的社會(huì)化推薦系統(tǒng)研究[D];哈爾濱工業(yè)大學(xué);2014年
6 曹渝昆;基于神經(jīng)網(wǎng)絡(luò)和模糊邏輯的智能推薦系統(tǒng)研究[D];重慶大學(xué);2006年
7 王立才;上下文感知推薦系統(tǒng)若干關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2012年
8 劉龍;一個(gè)能實(shí)現(xiàn)個(gè)性化實(shí)時(shí)路徑推薦服務(wù)的推薦系統(tǒng)框架[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年
9 李濤;推薦系統(tǒng)中若干關(guān)鍵問(wèn)題研究[D];南京航空航天大學(xué);2009年
10 劉士琛;面向推薦系統(tǒng)的關(guān)鍵問(wèn)題研究及應(yīng)用[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 朱孔真;基于云計(jì)算的電子商務(wù)智能推薦系統(tǒng)研究[D];武漢理工大學(xué);2014年
2 郭敬澤;基于賦權(quán)評(píng)分和Dpark的分布式推薦系統(tǒng)研究與實(shí)現(xiàn)[D];天津理工大學(xué);2015年
3 周俊宇;信息推薦系統(tǒng)的研究與設(shè)計(jì)[D];江南大學(xué);2015年
4 李煒;基于電子商務(wù)平臺(tái)的保險(xiǎn)推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];復(fù)旦大學(xué);2013年
5 車豐;基于排序主題模型的論文推薦系統(tǒng)[D];大連海事大學(xué);2015年
6 秦大路;基于因式分解機(jī)模型的上下文感知推薦系統(tǒng)研究[D];鄭州大學(xué);2015年
7 徐霞婷;動(dòng)態(tài)路網(wǎng)監(jiān)控與導(dǎo)航推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];蘇州大學(xué);2015年
8 黃學(xué)峰;基于Hadoop的電影推薦系統(tǒng)研究與實(shí)現(xiàn)[D];南京師范大學(xué);2015年
9 路小瑞;基于Hadoop平臺(tái)的職位推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];上海交通大學(xué);2015年
10 李愛(ài)寶;基于組合消費(fèi)行為分析的團(tuán)購(gòu)?fù)扑]系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2015年
本文關(guān)鍵詞:個(gè)性化新聞事件推薦系統(tǒng)的研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號(hào):270523
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/270523.html