面向社會化媒體的內(nèi)容推薦若干關(guān)鍵技術(shù)研究
本文關(guān)鍵詞:面向社會化媒體的內(nèi)容推薦若干關(guān)鍵技術(shù)研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著以Web2.0技術(shù)為基礎(chǔ)的社會化媒體的興起,個體用戶具備了雙重角色,既是內(nèi)容的生產(chǎn)者,又是內(nèi)容的消費者。社會化媒體逐漸成為人們獲取信息、擴展交際的有力工具,同時其影響也逐步擴散到社會、文化、經(jīng)濟和政治等方面,成為信息傳播和增值的杠桿。但是由于在社會化媒體中內(nèi)容呈現(xiàn)規(guī)模性、多樣性、時效性、冪律特性、爆發(fā)性和長尾等特性,導(dǎo)致用戶十分容易陷入到內(nèi)容信息過載、內(nèi)容價值各異的困境中,從而給用戶選擇內(nèi)容、瀏覽內(nèi)容造成困擾。傳統(tǒng)推薦系統(tǒng)中,通常使用的技術(shù)為協(xié)同過濾技術(shù),該技術(shù)基于已有的用戶和項目之間的歷史評分,挖掘用戶偏好以尋找到偏好相似的鄰居用戶,以此來進行相應(yīng)的評分預(yù)測和推薦。但是該類算法面臨著數(shù)據(jù)稀疏性、冷啟動等問題,造成算法精度不夠和覆蓋率低。本文以面向社會化媒體推薦為最終目的,研究多場景下如何利用社會化和上下文信息來克服傳統(tǒng)推薦技術(shù)中的數(shù)據(jù)稀疏性和冷啟動問題,并用于實際的圖書館推薦中。本文研究的場景分為以下四種:只具備用戶和物品評分信息、只具備用戶行為信息、具備用戶物品評分和用戶社交關(guān)系、具備用戶物品評分及物品用戶屬性。在上述四種場景中分別從基于融合的推薦、基于社區(qū)發(fā)現(xiàn)的推薦、社區(qū)發(fā)現(xiàn)與協(xié)同過濾結(jié)合以及基于上下文信息推薦的四個方面出發(fā),形成從單個推薦技術(shù)到多個推薦技術(shù)融合,并與實際應(yīng)用場景相結(jié)合的綜合推薦引擎。本文主要的創(chuàng)新點為:1)在只具備用戶對物品評分數(shù)據(jù)的場景下,針對社會化媒體中單個協(xié)同過濾算法由于噪聲較大而無法取得較好的性能和效果的問題,提出兩種模型融合方法即建模融合和預(yù)測融合,以此對傳統(tǒng)的單個協(xié)同過濾方法進行融合,兩者融合的時間不同,一個是在建模階段,一個則是在預(yù)測階段。其中建模融合方法將基于鄰居協(xié)同過濾中的局部相似性和基于模型協(xié)同過濾中的全局相似性進行融合,對基于模型協(xié)同過濾中的最小化目標函數(shù)進行修訂;預(yù)測融合方法則是將基于多個預(yù)測結(jié)果的融合問題轉(zhuǎn)換為監(jiān)督學(xué)習(xí)問題,從而可以將已有的多種監(jiān)督學(xué)習(xí)方法用于其中,該方法首先基于單個預(yù)測模型進行預(yù)測,然后將多個預(yù)測結(jié)果通過線性回歸(Linear Regreesion, LR)、分箱線性回歸 (Binned Linear Regression, BLR)和神經(jīng)網(wǎng)絡(luò)(Neural Network,NN)進行融合,以最小化誤差值為目標函數(shù),求解相應(yīng)的模型參數(shù)。對實際圖書館數(shù)據(jù)集的實驗結(jié)果表明,兩種融合方法在圖書借閱周期的預(yù)測中均較單個傳統(tǒng)預(yù)測算法更有效果,最好的預(yù)測為RSVD-3+RSVD2-3 (NN),其預(yù)測的借閱周期誤差只有11天,基于此可以制定個性化的圖書借閱周期,調(diào)整圖書庫存保證圖書資源數(shù)量。(第二章,學(xué)術(shù)論文成果[3])2)在只具備用戶行為信息的場景下,針對當(dāng)前面向社會化媒體的內(nèi)容推薦中未能較好考慮通過用戶行為的群體性發(fā)現(xiàn)群體興趣的問題,提出了基于社區(qū)發(fā)現(xiàn)的圖書推薦算法,該算法基于社區(qū)核心的擴張來進行社區(qū)發(fā)現(xiàn)從而實現(xiàn)內(nèi)容推薦;谏鐓^(qū)核心的社區(qū)發(fā)現(xiàn)算法LDK(Local community Detection based on community Kernels),充分考慮具備影響力節(jié)點的作用,尋找一定數(shù)量且互相不聯(lián)通的影響力節(jié)點作為社區(qū)核心,同時在社區(qū)發(fā)現(xiàn)中采用適應(yīng)度進行擴張以保證新加入節(jié)點與社區(qū)核心的緊密度;贚DK形成了相應(yīng)的圖書推薦方法RoL(Recommendation based on LDK);趯嶋H的真實數(shù)據(jù)仿真結(jié)果表明,社區(qū)核心的選取大小和個數(shù)會對社區(qū)發(fā)現(xiàn)有一定影響;在基于RoL進行推薦中,RoL因為具備影響力核心社區(qū)的作用以及圖書流行度時間維度的考慮,RoL(3)較已有的Heats在HR(Hit Rate)指標上平均提升6.58%,在ARHR(Average Reciprocal Hit-Rank)指標上平均提升5.69%,具備較好的實際應(yīng)用價值。(第三章,學(xué)術(shù)論文成果[1])3)在具備評分數(shù)據(jù)和用戶社交關(guān)系的場景下,針對傳統(tǒng)協(xié)同過濾算法中未能較好利用社會化關(guān)系來解決流行物品對預(yù)測的負面影響和數(shù)據(jù)稀疏性對推薦準確性影響的問題,本文考慮將社會化因素作為重要的考慮因子與現(xiàn)有的評分預(yù)測和推薦算法結(jié)合,以提升算法的準確性,提出了相應(yīng)的基于社區(qū)發(fā)現(xiàn)的鄰居協(xié)同過濾算法NCFC (Neighborhood Collaborative Filtering based on Community Detection)和基于社區(qū)發(fā)現(xiàn)的模型協(xié)同過濾算法SCR(Socialized-community-based Regularization)。為了在有向加權(quán)網(wǎng)絡(luò)中進行社區(qū)發(fā)現(xiàn),對相應(yīng)的LDK算法在節(jié)點影響力評估和適應(yīng)度函數(shù)上進行了修正。NCFC基于社區(qū)發(fā)現(xiàn)結(jié)果來計算用戶全局相似度,結(jié)合傳統(tǒng)的相似度來克服稀疏性問題,該算法可以適用于點擊型推薦和連續(xù)型評分預(yù)測中,其中在點擊型推薦中,NCFC在HR上的平均性能較RoL(3)高6.82%,且其性能波動較RoL(3)降低了17.43%,說明NCFC算法的性能高于RoL(3),且具備更好的穩(wěn)定性;連續(xù)型評分預(yù)測中,NCFC較ICF在MAE (Mean Absolute Error)和RMSE (Root Mean Square Error)上分別提升3.87%、2.79%。SCR則是通過社區(qū)發(fā)現(xiàn)對正則鄰居做了限定,較已有的ASR(Average-social-based Regularization)在MAE指標方面提升可達5.83%;在RMSE方面性能提升可達6.01%。(第四章,學(xué)術(shù)論文成果[2,5])4)在具備評分數(shù)據(jù)和物品用戶屬性信息的場景下,針對當(dāng)前推薦算法未能較好利用物品與用戶屬性上下文信息進行內(nèi)容推薦的問題,本文充分考慮上下文特征,將上下文特征信息與傳統(tǒng)的協(xié)同過濾結(jié)合,提出了基于上下文的鄰居協(xié)同過濾算法PLHS (Prediction based on Linear Hybrid Similarity)和CPHS(Cascade Prediction based on Hybrid Similarity),和基于上下文的模型協(xié)同過濾算法SLUC(Sparse Linear based on User Context)。其中PLHS和CPHS均將基于評分的相似度和基于上下文的相似度進行合并,然后用于預(yù)測和推薦中,CPHS對鄰居數(shù)進行了一定限定;趯嶋H數(shù)據(jù)集的實驗表明,CPHS較已有的RPBC (Rating-personality based Cascade Hybrid Approach)算法在HR指標方面提升了5.4%,在ARHR(上提升了3%。SLUC是對已有算法SLIM (Sparse Linear Method)的拓展,在目標求解函數(shù)中添加對用戶上下文特征的正則項,并設(shè)定相應(yīng)的正則因子,基于實際數(shù)據(jù)的仿真表明,該算法較已有的SLIM有更好的性能,在數(shù)據(jù)集ML100K和圖書館數(shù)據(jù)集上,SLUC較SLIM在HR和ARHR上都有明顯提升。(對第五章,對應(yīng)學(xué)術(shù)論文成果[4])
【關(guān)鍵詞】:社會化媒體 協(xié)同過濾 社會化推薦 社區(qū)發(fā)現(xiàn) 推薦融合 上下文推薦
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:TP391.3
【目錄】:
- 摘要4-7
- ABSTRACT7-15
- 第一章 緒論15-33
- 1.1 論文研究背景15-23
- 1.1.1 社會化媒體的現(xiàn)狀、分類與發(fā)展16-19
- 1.1.2 社會化媒體內(nèi)容特征分析19-21
- 1.1.3 面向社會化媒體的內(nèi)容推薦研究現(xiàn)狀21-23
- 1.1.4 面向社會化媒體的內(nèi)容推薦面臨的挑戰(zhàn)23
- 1.2 論文研究內(nèi)容23-24
- 1.3 論文主要創(chuàng)新點24-26
- 1.4 攻讀博士期間主要工作26-27
- 1.5 本文的組織結(jié)構(gòu)27
- 參考文獻27-33
- 第二章 融合的協(xié)同過濾推薦33-53
- 2.1 引言33
- 2.2 相關(guān)研究工作33-35
- 2.2.1 研究現(xiàn)狀33-34
- 2.2.2 當(dāng)前研究存在的問題34-35
- 2.3 已有協(xié)同過濾算法35-38
- 2.3.1 符號表示35
- 2.3.2 KNNuser35-36
- 2.3.3 KNNitem36
- 2.3.4 SVD36-37
- 2.3.5 算法時間復(fù)雜度分析37-38
- 2.4 協(xié)同過濾技術(shù)的融合38-43
- 2.4.1 建模融合38-39
- 2.4.2 預(yù)測融合39-43
- 2.5 仿真實驗分析43-50
- 2.5.1 仿真場景建立43-45
- 2.5.2 仿真性能指標45
- 2.5.3 仿真結(jié)果與分析45-50
- 2.6 本章小結(jié)50
- 參考文獻50-53
- 第三章 基于社區(qū)發(fā)現(xiàn)的推薦技術(shù)研究53-73
- 3.1 引言53
- 3.2 相關(guān)研究工作53-57
- 3.2.1 網(wǎng)絡(luò)中的社區(qū)發(fā)現(xiàn)53-56
- 3.2.2 社區(qū)發(fā)現(xiàn)與推薦56-57
- 3.2.3 當(dāng)前研究存在的問題57
- 3.3 加權(quán)用戶相似網(wǎng)絡(luò)的形成57-60
- 3.3.1 相似度的計算57-58
- 3.3.2 網(wǎng)絡(luò)的形成58-60
- 3.4 基于社區(qū)核心的局部化社區(qū)發(fā)現(xiàn)60-63
- 3.4.1 算法概述60
- 3.4.2 社區(qū)核心的發(fā)現(xiàn)60-62
- 3.4.3 核心社區(qū)的擴張62-63
- 3.5 基于社區(qū)發(fā)現(xiàn)的推薦返回63
- 3.6 相關(guān)數(shù)據(jù)集說明63-65
- 3.7 仿真實驗分析65-68
- 3.7.1 仿真場景建立65-66
- 3.7.2 仿真性能指標66
- 3.7.3 仿真結(jié)果與分析66-68
- 3.8 本章小結(jié)68-69
- 參考文獻69-73
- 第四章 基于社區(qū)發(fā)現(xiàn)的協(xié)同過濾技術(shù)的研究73-97
- 4.1 引言73
- 4.2 相關(guān)研究工作73-77
- 4.2.1 研究現(xiàn)狀73-77
- 4.2.2 當(dāng)前研究存在的問題77
- 4.3 基于社區(qū)發(fā)現(xiàn)的鄰居協(xié)同過濾算法77-85
- 4.3.1 算法整體流程77-78
- 4.3.2 相似度的計算78
- 4.3.3 用戶相似網(wǎng)絡(luò)的形成78-79
- 4.3.4 社區(qū)的發(fā)現(xiàn)79-81
- 4.3.5 基于社區(qū)的節(jié)點全局相似度計算81-82
- 4.3.6 局部相似度與全局相似度的融合82-83
- 4.3.7 評分預(yù)測和項目推薦83-85
- 4.4 基于社區(qū)發(fā)現(xiàn)的模型協(xié)同過濾算法85-87
- 4.4.1 基于社會化社區(qū)的正則及參數(shù)求解86-87
- 4.4.2 評分預(yù)測87
- 4.5 仿真實驗分析87-92
- 4.5.1 仿真場景建立87-89
- 4.5.2 仿真性能指標89
- 4.5.3 仿真結(jié)果與分析89-92
- 4.6 本章小結(jié)92-93
- 參考文獻93-97
- 第五章 基于上下文信息協(xié)同過濾技術(shù)的研究97-115
- 5.1 引言97
- 5.2 相關(guān)研究工作97-100
- 5.2.1 研究現(xiàn)狀97-100
- 5.2.2 當(dāng)前研究存在的問題100
- 5.3 基于上下文的鄰居協(xié)同過濾算法100-104
- 5.3.1 算法整體流程100-101
- 5.3.2 相似度的計算101-103
- 5.3.3 評分的預(yù)測103-104
- 5.4 基于上下文的模型協(xié)同過濾算法104-106
- 5.4.1 SLIM方法104-105
- 5.4.2 基于上下文的模型協(xié)同過濾105-106
- 5.5 仿真實驗分析106-111
- 5.5.1 仿真場景建立106-107
- 5.5.2 仿真結(jié)果與分析107-111
- 5.6 本章小結(jié)111
- 參考文獻111-115
- 第六章 總結(jié)和展望115-117
- 6.1 論文總結(jié)115-116
- 6.2 進一步工作116-117
- 附錄 縮略語117-119
- 致謝119-120
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文120-121
- 攻讀學(xué)位期間參與撰寫的標準、研究報告和專利121-122
- 攻讀學(xué)位期間參與的科研項目122
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 宋安;;不要對社會化媒體危機望而卻步[J];廣告大觀(綜合版);2011年03期
2 吳劍敏;;社會化媒體在政府中的應(yīng)用[J];企業(yè)導(dǎo)報;2011年08期
3 趙苑君;;社會化媒體的品牌營銷[J];信息通信;2011年03期
4 肖瑞;;淺談社會化媒體的作用[J];教育理論與實踐;2011年30期
5 付玉輝;;社會化媒體:未來的確定性和不確定性[J];互聯(lián)網(wǎng)天地;2011年09期
6 鄧煜;唐大麟;于夢;;社會化媒體時代的品牌營銷之道[J];現(xiàn)代營銷(學(xué)苑版);2011年11期
7 ;探尋社會化媒體的價值[J];廣告大觀(綜合版);2012年01期
8 王莉莉;;社會化媒體:廣告主的雙刃劍[J];廣告大觀(綜合版);2012年01期
9 陳東;;社會化媒體孵化“微博營銷公司”?[J];廣告大觀(綜合版);2012年01期
10 楊光;黃玉榮;;社會化媒體對教育的影響[J];科技視界;2012年04期
中國重要會議論文全文數(shù)據(jù)庫 前6條
1 王嵐;;利用社會化媒體進行新媒體內(nèi)容傳播[A];中國新聞技術(shù)工作者聯(lián)合會2013年學(xué)術(shù)年會、五屆五次理事會暨第六屆“王選新聞科學(xué)技術(shù)獎”和優(yōu)秀論文獎頒獎大會論文集(廣電篇)[C];2013年
2 呂天鶴;;論社會化媒體對科層制的沖擊——以微博為例[A];“傳播與中國·復(fù)旦論壇”(2013)——網(wǎng)絡(luò)化關(guān)系:新傳播與當(dāng)下中國論文集[C];2013年
3 李艷麗;;社會化媒體在體育產(chǎn)業(yè)中的應(yīng)用現(xiàn)狀與發(fā)展策略研究[A];2013體育計算機應(yīng)用論文集[C];2013年
4 華迎;王永貴;李兵;;社會化媒體中用戶創(chuàng)造內(nèi)容(UGC)采納行為影響因素研究[A];2013中國信息經(jīng)濟學(xué)會學(xué)術(shù)年會暨博士生論壇論文集[C];2013年
5 劉濤;楊有慶;;社會化媒體與都市空間的社會化表征[A];“傳播與中國·復(fù)旦論壇”(2012)——可溝通城市:理論建構(gòu)與中國實踐論文集[C];2012年
6 信莉麗;莊嚴;;美聯(lián)社微博新聞本土化研究[A];2014中國傳播論壇:“國際話語體系與國際傳播能力建設(shè)”研討會會議論文集[C];2014年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 本報記者 胡海波 編譯;社會化媒體:危機公關(guān)的利器[N];中國民航報;2011年
2 楊吉;社會化媒體對企業(yè)意味著什么[N];上海證券報;2013年
3 楊吉;社會化媒體對企業(yè)意味著什么[N];中華讀書報;2013年
4 楊吉 法學(xué)博士 浙江傳媒學(xué)院互聯(lián)網(wǎng)與社會研究中心秘書長;社會化媒體企業(yè)意味著什么[N];中國圖書商報;2013年
5 本報記者 周婷;社會化媒體掀起營銷浪潮[N];中國證券報;2010年
6 祝華新;社會化媒體:社會管理新挑戰(zhàn)[N];人民政協(xié)報;2011年
7 本報記者 李延生;借力社會化媒體[N];中國企業(yè)報;2011年
8 記者 李思;社會化媒體“遍地開花”[N];上海金融報;2011年
9 任沁沁 胡雅婷;夢想成真,社會化媒體正在融入生活[N];新華每日電訊;2012年
10 上海社科院信息研究所知識管理研究中心主任、副研究員 王興全;“數(shù)字化野火”:風(fēng)險與治理[N];文匯報;2013年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 趙宇翔;社會化媒體中用戶生成內(nèi)容的動因與激勵設(shè)計研究[D];南京大學(xué);2011年
2 丁方舟;中國網(wǎng)絡(luò)行動的動因、過程與影響[D];浙江大學(xué);2015年
3 姚遠;面向社會化媒體的用戶生成內(nèi)容推薦技術(shù)研究[D];南京大學(xué);2015年
4 朱文龍;社會化媒體調(diào)查的適用性與模式效果研究[D];電子科技大學(xué);2014年
5 劉欣;面向社會化媒體的內(nèi)容推薦若干關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2015年
6 瞿旭晟;互聯(lián)網(wǎng)平臺上的知識生產(chǎn)[D];復(fù)旦大學(xué);2010年
7 陰紅志;社會化媒體中若干時空相關(guān)的推薦問題研究[D];北京大學(xué);2014年
8 田野;基于社會化媒體的話題檢測與傳播關(guān)鍵問題研究[D];北京郵電大學(xué);2013年
9 李春山;面向社會化媒體內(nèi)容的若干聚類算法研究[D];哈爾濱工業(yè)大學(xué);2014年
10 楊銘;社會化媒體的環(huán)境掃描與情報分析[D];哈爾濱工業(yè)大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 龐華;社會化媒體的植入式廣告研究[D];鄭州大學(xué);2011年
2 游恒振;社會化媒體的演進研究[D];北京郵電大學(xué);2012年
3 許海濤;社會化媒體對我國實體政治的影響及對策分析[D];河北師范大學(xué);2012年
4 宋笛;社會化媒體的信息流研究[D];山東師范大學(xué);2013年
5 朱紅燕;試論社會化媒體時代的品牌營銷之道[D];蘇州大學(xué);2013年
6 郭磊;社會化媒體環(huán)境下中小企業(yè)營銷模式研究[D];北京郵電大學(xué);2012年
7 高靈溪;基于社會化媒體的圖書館閱讀推廣研究[D];東北師范大學(xué);2013年
8 許璇;移動社會化媒體使用對用戶社會資本的影響研究[D];上海外國語大學(xué);2014年
9 盧國祥;霍耐特“承認理論”視域下的社會化媒體研究[D];福建師范大學(xué);2014年
10 于濤;基于社會化媒體的企業(yè)內(nèi)容傳播策略研究[D];中國社會科學(xué)院研究生院;2015年
本文關(guān)鍵詞:面向社會化媒體的內(nèi)容推薦若干關(guān)鍵技術(shù)研究,由筆耕文化傳播整理發(fā)布。
本文編號:253752
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/253752.html