社交網(wǎng)絡(luò)用戶(hù)人格特質(zhì)挖掘及其在個(gè)性化推薦領(lǐng)域的應(yīng)用研究
發(fā)布時(shí)間:2018-06-14 13:29
本文選題:人格特質(zhì) + 特質(zhì)識(shí)別。 參考:《合肥工業(yè)大學(xué)》2017年博士論文
【摘要】:社交網(wǎng)絡(luò)的快速發(fā)展為分析用戶(hù)行為規(guī)律提供了絕佳的機(jī)會(huì)和平臺(tái)。其中基于用戶(hù)生成內(nèi)容(User-generated Content, UGC)的主題偏好挖掘吸引了來(lái)自各個(gè)領(lǐng)域和學(xué)科的研究學(xué)者。然而,當(dāng)前的研究過(guò)多地關(guān)注于用戶(hù)主題偏好的精確挖掘,忽視了從用戶(hù)內(nèi)在因子的角度研究用戶(hù)主題偏好的形成原理,即用戶(hù)為什么會(huì)具有這樣的主題興趣偏好?人格特質(zhì)作為一種典型的用戶(hù)內(nèi)在因素,已經(jīng)被廣泛應(yīng)用于解釋人類(lèi)社會(huì)的真實(shí)行為。因此,如何從人格特質(zhì)的角度理解社交網(wǎng)絡(luò)用戶(hù)的主題偏好將具有重要的理論意義和實(shí)際價(jià)值。本文研究社交網(wǎng)絡(luò)用戶(hù)人格特質(zhì)挖掘及其在個(gè)性化推薦領(lǐng)域的應(yīng)用。具體地來(lái)說(shuō),通過(guò)將人格特質(zhì)界定為用戶(hù)的大五人格特質(zhì)(也稱(chēng)五因子模型),本文研究三個(gè)相互遞進(jìn)的科學(xué)問(wèn)題:基于非參數(shù)層次貝葉斯主題模型的用戶(hù)人格特質(zhì)與主題偏好關(guān)系分析;基于二者之間的關(guān)系,構(gòu)建社交網(wǎng)絡(luò)用戶(hù)大五人格特質(zhì)的識(shí)別模型;在社交網(wǎng)絡(luò)用戶(hù)人格特質(zhì)可以合理識(shí)別出來(lái)的基礎(chǔ)上,研究用戶(hù)人格特質(zhì)在具體場(chǎng)景下的應(yīng)用,即是否有助于提高個(gè)性化推薦的精度。具體的研究?jī)?nèi)容和創(chuàng)新點(diǎn)主要包括:(1)社交網(wǎng)絡(luò)用戶(hù)人格特質(zhì)與主題偏好關(guān)系分析。考慮到用戶(hù)的主題偏好是用戶(hù)多種內(nèi)在人格特質(zhì)導(dǎo)致的輸出結(jié)果,本文提出了一種新穎的非參數(shù)層次貝葉斯主題模型NHBT,構(gòu)建三層的生成框架研究用戶(hù)內(nèi)在人格特質(zhì)與主題偏好之間的關(guān)聯(lián)關(guān)系。具體地來(lái)說(shuō),NHBT模型能夠?qū)崿F(xiàn)數(shù)據(jù)驅(qū)動(dòng)的主題挖掘任務(wù),將主題挖掘與關(guān)系發(fā)現(xiàn)融入一個(gè)統(tǒng)一模型中,同時(shí)考慮了人格特質(zhì)“生成”主題偏好的假設(shè)以及人格特質(zhì)與主題偏好之間的多對(duì)多關(guān)系假設(shè)。該模型摒棄了傳統(tǒng)的LIWC詞典以及兩階段挖掘任務(wù)。本文首先基于三層中餐館過(guò)程求解NHBT模型,此外基于最短路徑假設(shè)提出一種直接抽樣方法。在Facebook數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明NHBT模型能夠從開(kāi)放的社交媒體環(huán)境中挖掘出有趣的潛在主題,例如樂(lè)隊(duì)、化學(xué)生物學(xué)、動(dòng)漫真人秀等,并且能夠解釋用戶(hù)主題選擇行為的內(nèi)在混合機(jī)制,例如低盡責(zé)性以及高開(kāi)放性的用戶(hù)偏好于發(fā)表與校園生活類(lèi)相關(guān)的主題。(2)基于主題偏好的社交網(wǎng)絡(luò)用戶(hù)人格特質(zhì)識(shí)別;谏缃痪W(wǎng)絡(luò)用戶(hù)人格特質(zhì)與主題偏好之間的關(guān)聯(lián)關(guān)系,提出一種新穎的PT-LDA主題模型解決未知用戶(hù)的人格特質(zhì)識(shí)別問(wèn)題。PT-LDA擴(kuò)展了潛在狄利克雷分布,再將N-grams特征降維成若干潛在主題的同時(shí)假設(shè)每個(gè)主題不僅對(duì)應(yīng)一個(gè)在詞匯表上的多項(xiàng)式分布,而且還對(duì)應(yīng)五個(gè)在人格特質(zhì)值上的高斯分布。因?yàn)槟P洼^為復(fù)雜,難以實(shí)現(xiàn)精確推理和參數(shù)估計(jì),所以本文提出了一種Gibbs-EM算法迭代求解PT-LDA模型,即交替執(zhí)行吉布斯抽樣和期望最大化算法。定量評(píng)價(jià)結(jié)果表明,所提的PT-LDA模型要比若干基準(zhǔn)算法更加精確、高效和健壯。此外,即使不使用人格特質(zhì)“指導(dǎo)”主題挖掘過(guò)程,只使用標(biāo)準(zhǔn)LDA模型挖掘得到的主題特征集給出的識(shí)別結(jié)果也要明顯優(yōu)于LIWC特征集,從而進(jìn)一步驗(yàn)證了數(shù)據(jù)驅(qū)動(dòng)的主題挖掘方式的有效性。(3)集成人格特質(zhì)的個(gè)性化推薦方法。鑒于人格特質(zhì)與用戶(hù)主題偏好具有緊密關(guān)系的堅(jiān)實(shí)理論基礎(chǔ),以及擁有基于二者關(guān)系識(shí)別出用戶(hù)人格特質(zhì)的現(xiàn)實(shí)條件,本文從人格特質(zhì)的角度研究其是否有助于提高個(gè)性化推薦的精度,進(jìn)而提出融合用戶(hù)人格特質(zhì)的矩陣分解模型。具體地來(lái)說(shuō),本文構(gòu)建用戶(hù)-物品和人格特質(zhì)組合-物品兩個(gè)關(guān)系矩陣,并通過(guò)聯(lián)合分解的方式使得人格特質(zhì)可以協(xié)助獲得更加精確的用戶(hù)和物品隱因子矩陣,從而解決用戶(hù)-物品矩陣的數(shù)據(jù)稀疏性問(wèn)題。在音樂(lè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,人格特質(zhì)信息能夠有效地解決數(shù)據(jù)稀疏性的問(wèn)題。本文擴(kuò)展了社交網(wǎng)絡(luò)用戶(hù)人格特質(zhì)與主題偏好之間關(guān)系分析的研究思路,豐富了人格特質(zhì)識(shí)別的方法體系,為人格特質(zhì)信息應(yīng)用于各種實(shí)際場(chǎng)景中提供了堅(jiān)實(shí)的理論基礎(chǔ)。
[Abstract]:This paper studies the relationship between personality traits and subject preference of social network users . ( 3 ) The personalized recommendation method of personality traits is integrated . In view of the strong theoretical foundation of the close relationship between personality traits and user ' s theme preferences , and the realistic conditions for identifying the personality traits of users based on the relationship between personality traits and personality traits , this paper studies whether it can help to improve the accuracy of personalized recommendation based on the relationship between personality traits and personality traits . In particular , this paper studies the relationship between personality traits and theme preferences of social network users , enriches the methods of personality traits recognition , and provides a solid theoretical basis for the application of personality traits information in various practical scenes .
【學(xué)位授予單位】:合肥工業(yè)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 楊善林;王佳佳;代寶;李旭軍;姜元春;劉業(yè)政;;在線(xiàn)社交網(wǎng)絡(luò)用戶(hù)行為研究現(xiàn)狀與展望[J];中國(guó)科學(xué)院院刊;2015年02期
2 張磊;陳貞翔;楊波;;社交網(wǎng)絡(luò)用戶(hù)的人格分析與預(yù)測(cè)[J];計(jì)算機(jī)學(xué)報(bào);2014年08期
3 鄧愛(ài)林,朱揚(yáng)勇,施伯樂(lè);基于項(xiàng)目評(píng)分預(yù)測(cè)的協(xié)同過(guò)濾推薦算法[J];軟件學(xué)報(bào);2003年09期
,本文編號(hào):2017547
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2017547.html
最近更新
教材專(zhuān)著