天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于短文本處理算法優(yōu)化的文本信息推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2018-01-02 08:45

  本文關(guān)鍵詞:基于短文本處理算法優(yōu)化的文本信息推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 出處:《北京交通大學(xué)》2017年碩士論文 論文類(lèi)型:學(xué)位論文


  更多相關(guān)文章: 短文本 特征詞 K-means聚類(lèi)算法 用戶興趣模型 文本推薦系統(tǒng)


【摘要】:"麥圈"作為推薦聚合類(lèi)資訊產(chǎn)品,以"微博"用戶行為數(shù)據(jù)包括發(fā)布、分享、轉(zhuǎn)發(fā)等數(shù)據(jù)為基礎(chǔ),構(gòu)建用戶興趣模型,并依賴于該模型向用戶定向推薦資訊類(lèi)內(nèi)容。如何為用戶精準(zhǔn)的推薦信息成為了平臺(tái)新的研究方向,因此,用戶興趣模型的構(gòu)建是推薦系統(tǒng)中最重要的環(huán)節(jié),而微博所蘊(yùn)含的海量文本信息為個(gè)性化推薦提供了分析用戶興趣模型的信息數(shù)據(jù)源。然而由于微博文本數(shù)據(jù)長(zhǎng)度較短,用戶的興趣多樣化,系統(tǒng)推薦的效果不太理想,因此,對(duì)短文本處理算法的優(yōu)化是提升系統(tǒng)推薦準(zhǔn)確度和穩(wěn)定性的關(guān)鍵點(diǎn)。本文設(shè)計(jì)的基于短文本的文本信息推薦系統(tǒng),首先依據(jù)用戶的微博行為數(shù)據(jù)構(gòu)建用戶興趣模型,其次將待推薦的文本信息進(jìn)行聚類(lèi)分析,并與興趣模型進(jìn)行相似性計(jì)算,最后將結(jié)果推薦給用戶瀏覽,同時(shí)將用戶的評(píng)分?jǐn)?shù)據(jù)反饋推薦系統(tǒng),用于用戶興趣模型的更新優(yōu)化。其中,向量空間模型是文本結(jié)構(gòu)化表示、用戶興趣模型構(gòu)建以及相似度計(jì)算的基礎(chǔ)模型。本文的文本推薦系統(tǒng)基于短文本處理算法的優(yōu)化以及用戶興趣模型的構(gòu)建實(shí)現(xiàn)。首先針對(duì)微博短文本數(shù)據(jù)特點(diǎn),在短文本預(yù)處理階段,為了提升文本特征詞的表征能力,在詞項(xiàng)TF-IDF加權(quán)計(jì)算的基礎(chǔ)上提出基于語(yǔ)義相關(guān)聯(lián)的短文本特征詞提取算法。然后,在短文本的聚類(lèi)算法中,本文針對(duì)K-means算法對(duì)噪聲敏感以及對(duì)初始中心選取存在依賴性問(wèn)題,提出了將相似性度量作為初始中心計(jì)算的依據(jù)思路,并實(shí)現(xiàn)了基于相似中心的cK-means短文本聚類(lèi)算法的設(shè)計(jì)方案,同時(shí)基于短文本算法的優(yōu)化構(gòu)建了用戶興趣模型。最后,本文將優(yōu)化后的用戶興趣模型應(yīng)用到具體的文本推薦系統(tǒng)中,給出了系統(tǒng)的整體框架,并詳細(xì)敘述了推薦系統(tǒng)核心模塊的實(shí)現(xiàn)細(xì)節(jié)以及系統(tǒng)測(cè)試分析。對(duì)短文本處理算優(yōu)化的驗(yàn)證結(jié)果表明,本文提出的基于語(yǔ)義相關(guān)的文本特征詞提取算法以及cK-means文本聚類(lèi)算法準(zhǔn)確度均有所提升,同時(shí)基于短文本處理算法優(yōu)化的用戶興趣模型更適用于對(duì)短文本的興趣聚合。對(duì)文本推薦系統(tǒng)的橫向測(cè)試和縱向測(cè)試顯示,基于短文本處理算法優(yōu)化的用戶興趣模型應(yīng)用到文本推薦系統(tǒng)之后,推薦系統(tǒng)的準(zhǔn)確度和穩(wěn)定性相比之前均有所提升。
[Abstract]:In this paper , based on the user ' s micro blog behavior data , this paper proposes a design scheme of user interest model based on the user ' s micro blog behavior data .

【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:TP391.3

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 黃賢英;陳紅陽(yáng);劉英濤;熊李媛;;一種新的微博短文本特征詞選擇算法[J];計(jì)算機(jī)工程與科學(xué);2015年09期

2 劉海峰;姚澤清;蘇展;;基于詞頻的優(yōu)化互信息文本特征選擇方法[J];計(jì)算機(jī)工程;2014年07期

3 程傳鵬;蘇安婕;;一種短文本特征詞提取的方法[J];計(jì)算機(jī)應(yīng)用與軟件;2014年06期

4 詹志建;楊小平;;基于語(yǔ)言網(wǎng)絡(luò)和語(yǔ)義信息的文本相似度計(jì)算[J];計(jì)算機(jī)工程與應(yīng)用;2014年05期

5 成衛(wèi)青;唐旋;;一種基于改進(jìn)互信息和信息熵的文本特征選擇方法[J];南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年05期

6 朱國(guó)瑋;周利;;基于遺忘函數(shù)和領(lǐng)域最近鄰的混合推薦研究[J];管理科學(xué)學(xué)報(bào);2012年05期

7 于洪;李轉(zhuǎn)運(yùn);;基于遺忘曲線的協(xié)同過(guò)濾推薦算法[J];南京大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年05期

8 伊雯雯;何福男;;基于用戶瀏覽行為的用戶興趣模型的表示及更新[J];常州信息職業(yè)技術(shù)學(xué)院學(xué)報(bào);2010年04期

9 王剛;邱玉輝;;基于本體及相似度的文本聚類(lèi)研究[J];計(jì)算機(jī)應(yīng)用研究;2010年07期

10 黃國(guó)言;李有超;高建培;常旭亮;;基于項(xiàng)目屬性的用戶聚類(lèi)協(xié)同過(guò)濾推薦算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2010年05期

相關(guān)碩士學(xué)位論文 前1條

1 倪衛(wèi)杰;基于用戶興趣模型的個(gè)性化論文推薦系統(tǒng)研究[D];天津大學(xué);2010年

,

本文編號(hào):1368518

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1368518.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶085ae***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com