基于內(nèi)容和社交網(wǎng)絡(luò)的文本推薦系統(tǒng)的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-06-18 00:04
推薦模型是近年來(lái)互聯(lián)網(wǎng)技術(shù)研究的一個(gè)熱門(mén)趨勢(shì)。但是傳統(tǒng)的基于內(nèi)容的推薦、基于社交網(wǎng)絡(luò)的推薦和協(xié)同過(guò)濾的推薦都有各自的不足。為此,我們提出了基于內(nèi)容和社交網(wǎng)絡(luò)的推薦模型(RMBCS)。本文的主要內(nèi)容有:(一)長(zhǎng)-短文本間相似度的計(jì)算。目前長(zhǎng)-短文本間沒(méi)有計(jì)算相似度的公式,故本文提出了一個(gè)生成距離。本文通過(guò)對(duì)文本的分類(lèi)、預(yù)處理、特征抽取,用特征計(jì)算生成距離得到長(zhǎng)短文本間的相似度。(二)社交網(wǎng)絡(luò)中用戶(hù)最近鄰群的選取。在用戶(hù)數(shù)量巨大的系統(tǒng)中,用戶(hù)最近鄰群的選取耗時(shí)很多,為能快速便捷的選取用戶(hù)的最近鄰群,本文提出了從用戶(hù)的社交網(wǎng)絡(luò)中尋找最近鄰群的新方法。(三)基于內(nèi)容和社交網(wǎng)絡(luò)的文本推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)。將以上兩點(diǎn)內(nèi)容嵌入推薦系統(tǒng)中,通過(guò)說(shuō)明基于內(nèi)容和社交網(wǎng)絡(luò)的文本推薦系統(tǒng)的推薦方式,對(duì)系統(tǒng)進(jìn)行需求分析、總體設(shè)計(jì),并對(duì)系統(tǒng)的各模塊進(jìn)行詳細(xì)設(shè)計(jì),完成了該系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)。最后對(duì)系統(tǒng)進(jìn)行了測(cè)試。
【文章來(lái)源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1社交網(wǎng)絡(luò)中用戶(hù)的入度??8??
于社區(qū)的社交網(wǎng)絡(luò)數(shù)據(jù)[35]。??社交網(wǎng)絡(luò)數(shù)據(jù)中存在長(zhǎng)尾分布,主要根據(jù)用戶(hù)的入度和出度,用戶(hù)的入度反??映了用戶(hù)的社會(huì)影響力,而用戶(hù)的出度代表了一個(gè)用戶(hù)關(guān)注的用戶(hù)數(shù)[36:。從圖2-??1和圖2-2可以看出,一個(gè)社交網(wǎng)絡(luò)中影響力大的用戶(hù)總是占少數(shù),同時(shí)關(guān)注很??多人的用戶(hù)占少數(shù),而絕大多數(shù)只關(guān)注很少的人[37]。??in?degree??10000000??????一????一?????—?—-??1000000???畢??100000??????10000??-—...???1〇〇〇??????100?--?-??10"??i?—-?—.^“-?--?—?---了—.—????1?10?100?1000?10000?丨?00000??圖2-1社交網(wǎng)絡(luò)中用戶(hù)的入度??8??
濾詞等操作,得到處理好的分詞結(jié)果,同時(shí)對(duì)這些分詞結(jié)果使用LDA主題模型,??得到文本的主題分布,再使用w〇rd2VeC進(jìn)行詞向量轉(zhuǎn)化,得到文本的主題特征。??具體的文本主題特征向量的提取過(guò)程如圖2-3所示。??11??
本文編號(hào):3236172
【文章來(lái)源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1社交網(wǎng)絡(luò)中用戶(hù)的入度??8??
于社區(qū)的社交網(wǎng)絡(luò)數(shù)據(jù)[35]。??社交網(wǎng)絡(luò)數(shù)據(jù)中存在長(zhǎng)尾分布,主要根據(jù)用戶(hù)的入度和出度,用戶(hù)的入度反??映了用戶(hù)的社會(huì)影響力,而用戶(hù)的出度代表了一個(gè)用戶(hù)關(guān)注的用戶(hù)數(shù)[36:。從圖2-??1和圖2-2可以看出,一個(gè)社交網(wǎng)絡(luò)中影響力大的用戶(hù)總是占少數(shù),同時(shí)關(guān)注很??多人的用戶(hù)占少數(shù),而絕大多數(shù)只關(guān)注很少的人[37]。??in?degree??10000000??????一????一?????—?—-??1000000???畢??100000??????10000??-—...???1〇〇〇??????100?--?-??10"??i?—-?—.^“-?--?—?---了—.—????1?10?100?1000?10000?丨?00000??圖2-1社交網(wǎng)絡(luò)中用戶(hù)的入度??8??
濾詞等操作,得到處理好的分詞結(jié)果,同時(shí)對(duì)這些分詞結(jié)果使用LDA主題模型,??得到文本的主題分布,再使用w〇rd2VeC進(jìn)行詞向量轉(zhuǎn)化,得到文本的主題特征。??具體的文本主題特征向量的提取過(guò)程如圖2-3所示。??11??
本文編號(hào):3236172
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3236172.html
最近更新
教材專(zhuān)著