高效率用戶群體興趣趨勢(shì)發(fā)現(xiàn)的推薦方法研究
發(fā)布時(shí)間:2017-12-31 11:26
本文關(guān)鍵詞:高效率用戶群體興趣趨勢(shì)發(fā)現(xiàn)的推薦方法研究 出處:《山東大學(xué)》2016年博士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 推薦系統(tǒng) 活躍度 信任度 隱私分享 高效率用戶群體
【摘要】:隨著互聯(lián)網(wǎng)及電子商務(wù)技術(shù)的迅速發(fā)展,用戶獲得的信息呈爆炸式的增長(zhǎng)。電子商務(wù)在給用戶帶來豐富產(chǎn)品和快捷方便的同時(shí),也帶來了諸如數(shù)據(jù)海量、品種多樣、真假難辨等問題的困擾,形成了所謂的“信息過載”,推薦系統(tǒng)就是為應(yīng)對(duì)這一問題而產(chǎn)生的。與搜索引擎和門戶網(wǎng)站不同,推薦系統(tǒng)可以通過分析用戶與其他用戶的關(guān)聯(lián)和歷史消費(fèi)等數(shù)據(jù),預(yù)測(cè)用戶尚未購(gòu)買而符合用戶需求的商品,促進(jìn)用戶從觀望向購(gòu)買的轉(zhuǎn)化,有效提升用戶對(duì)電子商務(wù)網(wǎng)站的信賴并提高商品的銷量。然而,用戶數(shù)量和企業(yè)規(guī)模的不斷增長(zhǎng)導(dǎo)致把握每個(gè)用戶的興趣趨勢(shì)十分困難,主要體現(xiàn)在三個(gè)方面。首先,多用戶群體中能夠積極參與系統(tǒng)交互的人數(shù)比較少,推薦方法難以將反映多用戶真實(shí)需求的數(shù)據(jù)準(zhǔn)確地提取出來;其次,用戶對(duì)其他用戶和推薦系統(tǒng)的信任度比較低,不利于提取用戶的有價(jià)值數(shù)據(jù),妨礙對(duì)用戶個(gè)性化需求的了解和提升用戶對(duì)系統(tǒng)的滿意度;第三,推薦系統(tǒng)通過獲取用戶的個(gè)人數(shù)據(jù)來進(jìn)行更加準(zhǔn)確的推薦,這就產(chǎn)生了用戶對(duì)個(gè)人隱私的擔(dān)憂,導(dǎo)致用戶的分享行為變得保守,使推薦系統(tǒng)中隱私收集策略無(wú)法充分考慮所有用戶的信息分享偏好。這些問題的存在都不利于推薦系統(tǒng)充分了解用戶的個(gè)性化需求,降低了推薦系統(tǒng)的準(zhǔn)確率和用戶的滿意度。本文以上述三個(gè)方面為研究目標(biāo),從高活躍度、高信任度、高隱私分享量共三類高效率用戶群體中預(yù)測(cè)和挖掘出用戶的興趣趨勢(shì),進(jìn)而做出更準(zhǔn)確的個(gè)性化推薦,使用戶對(duì)電子商務(wù)中的推薦系統(tǒng)具有較高的信賴度和滿意度。本文的主要貢獻(xiàn)如下:(1)提出一種新的推薦算法Div-clustering,實(shí)現(xiàn)了電子商務(wù)中用戶實(shí)體的數(shù)據(jù)建模,在此基礎(chǔ)上利用改進(jìn)的k-means聚類算法完成了高活躍度用戶的識(shí)別,以識(shí)別的高活躍度用戶群體的數(shù)據(jù)優(yōu)化了推薦項(xiàng)目,使推薦系統(tǒng)的推薦準(zhǔn)確率更高。Div-clustering通過分析實(shí)體數(shù)據(jù)結(jié)構(gòu),建立了多用戶群體的圖模型,研究了高活躍度的用戶群體和推薦項(xiàng)目的特征。實(shí)驗(yàn)中的論文數(shù)據(jù)主要從Elsevier和IEEE等學(xué)術(shù)網(wǎng)站通過網(wǎng)絡(luò)爬蟲Websphinx爬取,電影數(shù)據(jù)來自于兩個(gè)著名電影網(wǎng)站MovieLens和IMDB。實(shí)驗(yàn)結(jié)果表明Div-clustering推薦算法在學(xué)術(shù)論文和電影的推薦中體現(xiàn)出更高的準(zhǔn)確率,與傳統(tǒng)基于普通用戶的推薦算法相比,Div-clustering在實(shí)時(shí)評(píng)估和線下分析中表現(xiàn)出更好的穩(wěn)定性,也說明來源于高活躍度用戶群體數(shù)據(jù)產(chǎn)生的推薦比普通用戶群體數(shù)據(jù)產(chǎn)生的推薦,更容易被其它用戶接受和信任。(2)針對(duì)推薦系統(tǒng)中信任關(guān)聯(lián)的稀疏性問題,以高活躍度用戶群體更容易被信任為出發(fā)點(diǎn),提出挖掘用戶間隱性信任關(guān)聯(lián)的推薦算法PointBurst,所挖掘的隱性信任關(guān)聯(lián)為用戶間已知的顯性信任關(guān)聯(lián)提供了有力的補(bǔ)充,緩解了協(xié)同過濾等傳統(tǒng)算法在電子商務(wù)環(huán)境中面臨的信任關(guān)聯(lián)稀疏性問題。PointBurst算法在多用戶圖模型的基礎(chǔ)上著重分析用戶間的信任關(guān)聯(lián)特征和關(guān)聯(lián)強(qiáng)度,優(yōu)化了同類型實(shí)體之間的分類和不同類型實(shí)體之間的關(guān)聯(lián)標(biāo)記,從已經(jīng)識(shí)別為高活躍度用戶群體中,進(jìn)一步挖掘高信任度的用戶群體和隱性的信任關(guān)聯(lián),最終利用已知的顯性信任關(guān)聯(lián)和挖掘的隱性信任關(guān)聯(lián)共同作為推薦系統(tǒng)的輸入而生成推薦項(xiàng)目。通過在del.icio.us, Myspace和MovieLens等數(shù)據(jù)集中分別運(yùn)行PointBurst算法和傳統(tǒng)推薦算法進(jìn)行比較,結(jié)果表明PointBurst算法產(chǎn)生的推薦項(xiàng)目更加準(zhǔn)確和穩(wěn)定。(3)在用戶的隱私分享量與信任關(guān)聯(lián)強(qiáng)度成正比的發(fā)現(xiàn)基礎(chǔ)上,提出一種基于用戶隱私分享因素的學(xué)習(xí)模型ISBP,探索用戶在信任關(guān)聯(lián)中分享個(gè)人隱私的潛在因素,識(shí)別出高隱私分享量的用戶群體,使推薦系統(tǒng)可以通過收集該用戶群體的數(shù)據(jù)而增加推薦的準(zhǔn)確率。ISBP在近期有關(guān)隱私分享的研究中歸納了影響用戶在各類電子商務(wù)場(chǎng)景中的潛在因素,制定了因素假設(shè),改進(jìn)了決策樹分類器、K近鄰分類器和樸素貝葉斯分類器,使其能夠檢測(cè)出影響用戶在信任關(guān)聯(lián)中隱私分享量的潛在因素。將ISBP學(xué)習(xí)模型運(yùn)行在從多組實(shí)時(shí)數(shù)據(jù)平臺(tái)SOJUMP收集的數(shù)據(jù)集中后發(fā)現(xiàn),隱私分享量最高的用戶特征是年輕、非計(jì)算機(jī)類的群體,而與性別無(wú)關(guān)。在不引起所有用戶隱私擔(dān)憂的前提下,該類高隱私分享量的用戶群體可以分享比其它用戶群體更多的個(gè)人隱私信息,有利于推薦系統(tǒng)更好地了解用戶需求并產(chǎn)生更準(zhǔn)確的推薦。(4)發(fā)現(xiàn)了導(dǎo)致高隱私分享量用戶群體流失的溢出現(xiàn)象,并提出了緩解溢出現(xiàn)象的決策支持機(jī)制DSS。所謂溢出現(xiàn)象是指,高隱私分享量的用戶群體在受到不良的隱私收集順序影響時(shí),降低了后續(xù)的隱私分享量,使推薦系統(tǒng)不能夠持續(xù)地獲得用戶的準(zhǔn)確信息,引起了推薦準(zhǔn)確率的下降。在分析多個(gè)數(shù)據(jù)集后發(fā)現(xiàn),溢出現(xiàn)象是廣泛存在的,主要體現(xiàn)在向用戶收集高敏感度的隱私項(xiàng)目會(huì)使其后續(xù)的隱私分享量下降,而高隱私分享量用戶受到的負(fù)面影響最大。本文對(duì)k-means聚類算法進(jìn)行改進(jìn),使其可以檢測(cè)出用戶改變隱私分享量時(shí)對(duì)應(yīng)的心理認(rèn)知因素的改變,證實(shí)了用戶的認(rèn)知能力會(huì)引起溢出現(xiàn)象的產(chǎn)生,根本原因在于沒有足夠的儲(chǔ)備知識(shí)來支持自己的隱私分享決策。本文提出了為用戶提供隱私分享的決策支持機(jī)制,幫助用戶理解推薦的機(jī)理和增加用戶的儲(chǔ)備知識(shí)。實(shí)驗(yàn)證明了決策支持機(jī)制可以將溢出現(xiàn)象的負(fù)面效果降低,保持高隱私分享量的用戶群體繼續(xù)為推薦系統(tǒng)提供充足的用戶信息,維持較高的推薦準(zhǔn)確率
[Abstract]:With the rapid development of Internet and e - commerce technology , the information obtained by users is exploding .
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.3
,
本文編號(hào):1359573
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1359573.html
最近更新
教材專著