在線用戶興趣演化研究
發(fā)布時間:2020-12-12 01:15
用戶在網(wǎng)絡(luò)中的點擊和跳轉(zhuǎn)可以看作是在虛擬空間中的移動,該行為往往受到興趣的驅(qū)使,盡管人們在人類時空行為動力學(xué)的研究中取得了諸多突破性進(jìn)展,但是對于虛擬空間中人類興趣的動態(tài)演變卻知之甚少,部分原因來自人類興趣具有抽象內(nèi)隱性,難以從觀察中獲得內(nèi)心所想,難以獲得足夠的展現(xiàn)人類興趣的行為數(shù)據(jù)。本文基于中國互聯(lián)網(wǎng)信息中心提供的海量在線用戶行為數(shù)據(jù),將在線用戶點擊的每個網(wǎng)站當(dāng)作是一個興趣點,研究了虛擬空間中用戶的興趣演化模式。主要研究工作總結(jié)為以下三個方面:1、針對在線用戶興趣難以量化的問題,本文提出了興趣粘性度量算法。從連續(xù)移動步長,返回步長,停駐時間等多個方面對在線用戶興趣行為進(jìn)行實證分析,揭示出人類在線行為存在冪律的無標(biāo)度特征。基于分析結(jié)果,提出了衡量興趣點對用戶吸引程度的興趣粘性度量算法,通過與PageRank算法、注意力流模型實驗對比,驗證變量和算法的有效性。2、為了度量網(wǎng)絡(luò)空間中興趣點的相似性,研究興趣點之間的跳轉(zhuǎn)規(guī)律,本文提出了基于空間位置的興趣點相似性算法。優(yōu)化SPA模型,由節(jié)點的入度推導(dǎo)出節(jié)點產(chǎn)生時間和影響范圍半徑兩個變量,引入興趣粘性這一行為變量,使網(wǎng)絡(luò)中的興趣節(jié)點可以由這三個...
【文章來源】:西北師范大學(xué)甘肅省
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
在線用戶點擊日志樣例
西北師范大學(xué)碩士學(xué)位論文13入概念穩(wěn)定性。定義5穩(wěn)定性:是對一個網(wǎng)站連續(xù)移動步長變化的銳度的估計,由式(2-8)給出:1()()tnipipilog==(2-8)其中,n表示不同移動步長的個數(shù),t表示點擊數(shù)據(jù)所覆蓋的天數(shù),這個公式利用了熵的特性,如果p(i)的值越相似,則穩(wěn)定性的值就越大,如果p(i)的值比較跌宕,穩(wěn)定性的值就越小[47]。如圖2-4所示:橫坐標(biāo)表示穩(wěn)定性,縱坐標(biāo)表示平均移動步長EL,每個觀測的點代表了一個興趣點,通過數(shù)據(jù)曲線擬合得到y(tǒng)=0.65exp(3.36x)。興趣點的平均移動步長隨穩(wěn)定性的增加而呈現(xiàn)指數(shù)增長,即興趣點的穩(wěn)定性越大,其平均移動步長就越大,停留在該興趣點中的時間也相應(yīng)越長。圖2-4穩(wěn)定性和平均連續(xù)移動步長相關(guān)關(guān)系擬合函數(shù)圖像2.2.3停駐時間分析停駐時間是衡量興趣點的重要指標(biāo)之一,實時分析停駐時間對研究人類在網(wǎng)絡(luò)中興趣行為來說具有重要意義。在點擊流數(shù)據(jù)中,點擊移動步長和真實停駐時間是不能完全割裂開來的,點擊停駐時間可以用移動步長來衡量,值得深入探討的是它和真實停駐時間有怎樣的關(guān)系呢?文獻(xiàn)[1]通過繪制真實停留時間和對應(yīng)的平均點擊駐留時間l的關(guān)系,比較得出l和t的平均正相關(guān)。為了進(jìn)一步說明點擊停駐時間和實際停留時間的等價性,實驗
第2章在線用戶興趣行為量化分析14比較了兩者的概率分布,如圖2-5所示,把騰訊網(wǎng)站當(dāng)作興趣點,消除了步長l和時間t之間數(shù)量級之間的差異,研究點擊停駐時間(紅色表示)和實際停駐時間(藍(lán)色表示)的相關(guān)性,可以發(fā)現(xiàn)人類興趣動力學(xué)的冪律標(biāo)度:在兩端具有偏差,但在一般情況下,點擊停駐時間的統(tǒng)計數(shù)據(jù)更加穩(wěn)健,整體上點擊停駐時間和實際停駐時間存在等價性。圖2-5點擊停駐時間和實際停駐時間對比分布圖(a)baidu.com返回步長分布(b)qq.com返回步長分布圖2-6返回步長分布特征2.2.4返回步長的冪律特征在真實生活空間中,人們的出行受到記憶效應(yīng)和空間距離的影響,會選擇近期去過的一些地方,對較短時間和較近距離能夠到達(dá)的位置有更強(qiáng)烈的偏好[48]。記憶性作為人類自身的一種關(guān)鍵屬性,在過去已經(jīng)被廣泛地進(jìn)行了研究[1,4849]。在網(wǎng)絡(luò)空間中用戶是否也受到記憶效應(yīng)的影響對近期訪問過的興趣表現(xiàn)出更強(qiáng)的
本文編號:2911577
【文章來源】:西北師范大學(xué)甘肅省
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
在線用戶點擊日志樣例
西北師范大學(xué)碩士學(xué)位論文13入概念穩(wěn)定性。定義5穩(wěn)定性:是對一個網(wǎng)站連續(xù)移動步長變化的銳度的估計,由式(2-8)給出:1()()tnipipilog==(2-8)其中,n表示不同移動步長的個數(shù),t表示點擊數(shù)據(jù)所覆蓋的天數(shù),這個公式利用了熵的特性,如果p(i)的值越相似,則穩(wěn)定性的值就越大,如果p(i)的值比較跌宕,穩(wěn)定性的值就越小[47]。如圖2-4所示:橫坐標(biāo)表示穩(wěn)定性,縱坐標(biāo)表示平均移動步長EL,每個觀測的點代表了一個興趣點,通過數(shù)據(jù)曲線擬合得到y(tǒng)=0.65exp(3.36x)。興趣點的平均移動步長隨穩(wěn)定性的增加而呈現(xiàn)指數(shù)增長,即興趣點的穩(wěn)定性越大,其平均移動步長就越大,停留在該興趣點中的時間也相應(yīng)越長。圖2-4穩(wěn)定性和平均連續(xù)移動步長相關(guān)關(guān)系擬合函數(shù)圖像2.2.3停駐時間分析停駐時間是衡量興趣點的重要指標(biāo)之一,實時分析停駐時間對研究人類在網(wǎng)絡(luò)中興趣行為來說具有重要意義。在點擊流數(shù)據(jù)中,點擊移動步長和真實停駐時間是不能完全割裂開來的,點擊停駐時間可以用移動步長來衡量,值得深入探討的是它和真實停駐時間有怎樣的關(guān)系呢?文獻(xiàn)[1]通過繪制真實停留時間和對應(yīng)的平均點擊駐留時間l的關(guān)系,比較得出l和t的平均正相關(guān)。為了進(jìn)一步說明點擊停駐時間和實際停留時間的等價性,實驗
第2章在線用戶興趣行為量化分析14比較了兩者的概率分布,如圖2-5所示,把騰訊網(wǎng)站當(dāng)作興趣點,消除了步長l和時間t之間數(shù)量級之間的差異,研究點擊停駐時間(紅色表示)和實際停駐時間(藍(lán)色表示)的相關(guān)性,可以發(fā)現(xiàn)人類興趣動力學(xué)的冪律標(biāo)度:在兩端具有偏差,但在一般情況下,點擊停駐時間的統(tǒng)計數(shù)據(jù)更加穩(wěn)健,整體上點擊停駐時間和實際停駐時間存在等價性。圖2-5點擊停駐時間和實際停駐時間對比分布圖(a)baidu.com返回步長分布(b)qq.com返回步長分布圖2-6返回步長分布特征2.2.4返回步長的冪律特征在真實生活空間中,人們的出行受到記憶效應(yīng)和空間距離的影響,會選擇近期去過的一些地方,對較短時間和較近距離能夠到達(dá)的位置有更強(qiáng)烈的偏好[48]。記憶性作為人類自身的一種關(guān)鍵屬性,在過去已經(jīng)被廣泛地進(jìn)行了研究[1,4849]。在網(wǎng)絡(luò)空間中用戶是否也受到記憶效應(yīng)的影響對近期訪問過的興趣表現(xiàn)出更強(qiáng)的
本文編號:2911577
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2911577.html
最近更新
教材專著