在線點(diǎn)擊流指紋識別算法研究與應(yīng)用
發(fā)布時間:2021-12-23 05:41
隨著大數(shù)據(jù)時代的到來,互聯(lián)網(wǎng)技術(shù)的日趨成熟,尤其是大數(shù)據(jù)、物聯(lián)網(wǎng)和云計(jì)算技術(shù)在各個領(lǐng)域的普及、應(yīng)用和發(fā)展,人類信息的獲取不僅僅局限于實(shí)體空間;ヂ(lián)網(wǎng)正在構(gòu)造一個全新的社會形態(tài),人們每天在網(wǎng)上瀏覽信息、購物、娛樂、辦公等活動已成為生活不可或缺的一部分,互聯(lián)網(wǎng)空間已然成為平行于現(xiàn)實(shí)空間的虛擬空間,研究互聯(lián)網(wǎng)空間中人類在線行為具有豐富的科研意義和應(yīng)用價值。本文基于中國互聯(lián)網(wǎng)絡(luò)信息中心提供的在線行為數(shù)據(jù),在數(shù)據(jù)科學(xué)的視角下,研究了人類在線點(diǎn)擊流指紋識別算法,并基于提出的在線點(diǎn)擊流指紋算法對用戶異質(zhì)種群類別進(jìn)行分類,進(jìn)一步,提出了一種基于在線點(diǎn)擊流指紋進(jìn)行異常用戶檢測的方法。主要研究內(nèi)容包括以下三個方面:(1)在線點(diǎn)擊流指紋識別算法研究。基于用戶在線行為數(shù)據(jù)對網(wǎng)絡(luò)空間中人類點(diǎn)擊行為展開量化研究,應(yīng)用機(jī)器學(xué)習(xí)算法并通過大量實(shí)驗(yàn)發(fā)現(xiàn),虛擬空間確實(shí)存在能夠識別用戶個體身份的點(diǎn)擊流指紋。本文對在線點(diǎn)擊流指紋進(jìn)行建模分析,提出了一種基于在線點(diǎn)擊流數(shù)據(jù)構(gòu)造的在線用戶個體身份的識別算法,根據(jù)用戶在線點(diǎn)擊流數(shù)據(jù)中的在線時間信息、點(diǎn)擊軟件信息和點(diǎn)擊內(nèi)容信息構(gòu)造行為特征標(biāo)簽,基于行為特征標(biāo)簽并結(jié)合機(jī)器學(xué)習(xí)算法對用戶...
【文章來源】:西北師范大學(xué)甘肅省
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文的內(nèi)容組織結(jié)構(gòu)圖
第2章在線點(diǎn)擊流指紋識別算法研究9第2章在線點(diǎn)擊流指紋識別算法研究本章基于人類在線點(diǎn)擊行為數(shù)據(jù)提出在線點(diǎn)擊流指紋,并對在線用戶個體身份進(jìn)行識別研究。利用在線點(diǎn)擊行為數(shù)據(jù)中提取的行為特征標(biāo)簽構(gòu)造在線點(diǎn)擊流指紋,通過機(jī)器學(xué)習(xí)方法并結(jié)合數(shù)據(jù)降維在數(shù)據(jù)科學(xué)的視角下驗(yàn)證在線點(diǎn)擊流指紋的存在,給出在線點(diǎn)擊流指紋的定義,并科學(xué)地分析其在網(wǎng)絡(luò)空間的特征。2.1研究思路本章基于用戶在線行為特征構(gòu)造在線點(diǎn)擊流指紋,識別在線用戶個體身份。在本章的數(shù)據(jù)樣本中,在線用戶行為特征由在線時間信息、點(diǎn)擊軟件信息和點(diǎn)擊內(nèi)容信息組成,在線點(diǎn)擊流指紋識別流程如圖2-1所示。圖2-1在線點(diǎn)擊流指紋識別流程2.2構(gòu)建在線點(diǎn)擊流指紋為分析方便,首先隨機(jī)抽取200個用戶一個月內(nèi)(31天)共計(jì)5690個日志文檔數(shù)據(jù)樣本進(jìn)行識別研究,其中前20天數(shù)據(jù)為訓(xùn)練集(共3869個日志文檔數(shù)據(jù)),剩余11天數(shù)據(jù)為測試集(共1821個日志文檔數(shù)據(jù))。假設(shè)用戶個體的數(shù)量為m,用戶由D21idididI},...,,{m來標(biāo)識,數(shù)據(jù)集整體表示為S,21SSSS},...,,{m,且21DDDSi},...,,{n表示用戶i的n天內(nèi)行為數(shù)據(jù)日志集,其中nmi,31。對于每個日志文件Di,考慮可能存在一組能夠唯一標(biāo)識用戶的行為特征,對于每個特征,派生出一個標(biāo)簽,用日志文件中的特征值表征該標(biāo)簽值。抽取在線時間信息、點(diǎn)擊軟件信息和點(diǎn)擊內(nèi)容信息三個行為特征組成特征集合,并在在線時間信息特征中提取四個子特征,即開機(jī)時間、持續(xù)時間、頁面數(shù)和每頁瀏覽時
第2章在線點(diǎn)擊流指紋識別算法研究15U表示基于瀏覽內(nèi)容信息的識別算法*/4.Foralgorithminalgorithms:5.Returnnofusers6.Endfor7.Integratealgorithms8.Returnone_of_users#maximumprobability9.Ifone_of_usersmatchid:10.i=i+111.Endif12.Endfor14.Accuracy=i/number(D測試)15.Returnaccuracy表2-1識別算法識別效果表用戶個數(shù)5075100125150175200平均值在線時間67.59%68.92%63.86%61.56%60.72%54.21%58.35%62.17%點(diǎn)擊軟件86.53%84.49%83.75%81.67%79.64%78.26%75.43%81.40%點(diǎn)擊內(nèi)容90.59%89.86%85.23%86.57%82.56%83.43%79.48%85.39%集成算法91.36%90.52%87.87%86.96%83.78%81.35%81.26%86.16%圖2-2識別算法識別效果圖
【參考文獻(xiàn)】:
期刊論文
[1]知識圖譜研究綜述及其在醫(yī)療領(lǐng)域的應(yīng)用[J]. 侯夢薇,衛(wèi)榮,陸亮,蘭欣,蔡宏偉. 計(jì)算機(jī)研究與發(fā)展. 2018(12)
[2]機(jī)器學(xué)習(xí)在網(wǎng)絡(luò)空間安全研究中的應(yīng)用[J]. 張蕾,崔勇,劉靜,江勇,吳建平. 計(jì)算機(jī)學(xué)報. 2018(09)
[3]針對行為特征的社交網(wǎng)絡(luò)異常用戶檢測方法[J]. 王鵬,宋艷紅,李松江,楊華民,邱寧佳. 計(jì)算機(jī)應(yīng)用. 2017(S2)
[4]軟件與網(wǎng)絡(luò)安全研究綜述[J]. 劉劍,蘇璞睿,楊珉,和亮,張?jiān)?朱雪陽,林惠民. 軟件學(xué)報. 2018(01)
[5]基于Makov鏈狀態(tài)轉(zhuǎn)移概率矩陣的網(wǎng)絡(luò)入侵檢測[J]. 韓紅光,周改云. 控制工程. 2017(03)
[6]教育大數(shù)據(jù)研究綜述[J]. 杜婧敏,方海光,李維楊,仝賽賽. 中國教育信息化. 2016(19)
[7]利用加權(quán)用戶關(guān)系圖的譜分析探測大規(guī)模電子商務(wù)水軍團(tuán)體[J]. 韓忠明,楊珂,譚旭升. 計(jì)算機(jī)學(xué)報. 2017(04)
[8]面向網(wǎng)絡(luò)輿情數(shù)據(jù)的異常行為識別[J]. 郝亞洲,鄭慶華,陳艷平,閆彩霞. 計(jì)算機(jī)研究與發(fā)展. 2016(03)
[9]一種融合Kmeans和KNN的網(wǎng)絡(luò)入侵檢測算法[J]. 華輝有,陳啟買,劉海,張陽,袁沛權(quán). 計(jì)算機(jī)科學(xué). 2016(03)
[10]基于模式挖掘的用戶行為異常檢測算法[J]. 宋海濤,韋大偉,湯光明,孫怡峰. 小型微型計(jì)算機(jī)系統(tǒng). 2016(02)
本文編號:3547898
【文章來源】:西北師范大學(xué)甘肅省
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文的內(nèi)容組織結(jié)構(gòu)圖
第2章在線點(diǎn)擊流指紋識別算法研究9第2章在線點(diǎn)擊流指紋識別算法研究本章基于人類在線點(diǎn)擊行為數(shù)據(jù)提出在線點(diǎn)擊流指紋,并對在線用戶個體身份進(jìn)行識別研究。利用在線點(diǎn)擊行為數(shù)據(jù)中提取的行為特征標(biāo)簽構(gòu)造在線點(diǎn)擊流指紋,通過機(jī)器學(xué)習(xí)方法并結(jié)合數(shù)據(jù)降維在數(shù)據(jù)科學(xué)的視角下驗(yàn)證在線點(diǎn)擊流指紋的存在,給出在線點(diǎn)擊流指紋的定義,并科學(xué)地分析其在網(wǎng)絡(luò)空間的特征。2.1研究思路本章基于用戶在線行為特征構(gòu)造在線點(diǎn)擊流指紋,識別在線用戶個體身份。在本章的數(shù)據(jù)樣本中,在線用戶行為特征由在線時間信息、點(diǎn)擊軟件信息和點(diǎn)擊內(nèi)容信息組成,在線點(diǎn)擊流指紋識別流程如圖2-1所示。圖2-1在線點(diǎn)擊流指紋識別流程2.2構(gòu)建在線點(diǎn)擊流指紋為分析方便,首先隨機(jī)抽取200個用戶一個月內(nèi)(31天)共計(jì)5690個日志文檔數(shù)據(jù)樣本進(jìn)行識別研究,其中前20天數(shù)據(jù)為訓(xùn)練集(共3869個日志文檔數(shù)據(jù)),剩余11天數(shù)據(jù)為測試集(共1821個日志文檔數(shù)據(jù))。假設(shè)用戶個體的數(shù)量為m,用戶由D21idididI},...,,{m來標(biāo)識,數(shù)據(jù)集整體表示為S,21SSSS},...,,{m,且21DDDSi},...,,{n表示用戶i的n天內(nèi)行為數(shù)據(jù)日志集,其中nmi,31。對于每個日志文件Di,考慮可能存在一組能夠唯一標(biāo)識用戶的行為特征,對于每個特征,派生出一個標(biāo)簽,用日志文件中的特征值表征該標(biāo)簽值。抽取在線時間信息、點(diǎn)擊軟件信息和點(diǎn)擊內(nèi)容信息三個行為特征組成特征集合,并在在線時間信息特征中提取四個子特征,即開機(jī)時間、持續(xù)時間、頁面數(shù)和每頁瀏覽時
第2章在線點(diǎn)擊流指紋識別算法研究15U表示基于瀏覽內(nèi)容信息的識別算法*/4.Foralgorithminalgorithms:5.Returnnofusers6.Endfor7.Integratealgorithms8.Returnone_of_users#maximumprobability9.Ifone_of_usersmatchid:10.i=i+111.Endif12.Endfor14.Accuracy=i/number(D測試)15.Returnaccuracy表2-1識別算法識別效果表用戶個數(shù)5075100125150175200平均值在線時間67.59%68.92%63.86%61.56%60.72%54.21%58.35%62.17%點(diǎn)擊軟件86.53%84.49%83.75%81.67%79.64%78.26%75.43%81.40%點(diǎn)擊內(nèi)容90.59%89.86%85.23%86.57%82.56%83.43%79.48%85.39%集成算法91.36%90.52%87.87%86.96%83.78%81.35%81.26%86.16%圖2-2識別算法識別效果圖
【參考文獻(xiàn)】:
期刊論文
[1]知識圖譜研究綜述及其在醫(yī)療領(lǐng)域的應(yīng)用[J]. 侯夢薇,衛(wèi)榮,陸亮,蘭欣,蔡宏偉. 計(jì)算機(jī)研究與發(fā)展. 2018(12)
[2]機(jī)器學(xué)習(xí)在網(wǎng)絡(luò)空間安全研究中的應(yīng)用[J]. 張蕾,崔勇,劉靜,江勇,吳建平. 計(jì)算機(jī)學(xué)報. 2018(09)
[3]針對行為特征的社交網(wǎng)絡(luò)異常用戶檢測方法[J]. 王鵬,宋艷紅,李松江,楊華民,邱寧佳. 計(jì)算機(jī)應(yīng)用. 2017(S2)
[4]軟件與網(wǎng)絡(luò)安全研究綜述[J]. 劉劍,蘇璞睿,楊珉,和亮,張?jiān)?朱雪陽,林惠民. 軟件學(xué)報. 2018(01)
[5]基于Makov鏈狀態(tài)轉(zhuǎn)移概率矩陣的網(wǎng)絡(luò)入侵檢測[J]. 韓紅光,周改云. 控制工程. 2017(03)
[6]教育大數(shù)據(jù)研究綜述[J]. 杜婧敏,方海光,李維楊,仝賽賽. 中國教育信息化. 2016(19)
[7]利用加權(quán)用戶關(guān)系圖的譜分析探測大規(guī)模電子商務(wù)水軍團(tuán)體[J]. 韓忠明,楊珂,譚旭升. 計(jì)算機(jī)學(xué)報. 2017(04)
[8]面向網(wǎng)絡(luò)輿情數(shù)據(jù)的異常行為識別[J]. 郝亞洲,鄭慶華,陳艷平,閆彩霞. 計(jì)算機(jī)研究與發(fā)展. 2016(03)
[9]一種融合Kmeans和KNN的網(wǎng)絡(luò)入侵檢測算法[J]. 華輝有,陳啟買,劉海,張陽,袁沛權(quán). 計(jì)算機(jī)科學(xué). 2016(03)
[10]基于模式挖掘的用戶行為異常檢測算法[J]. 宋海濤,韋大偉,湯光明,孫怡峰. 小型微型計(jì)算機(jī)系統(tǒng). 2016(02)
本文編號:3547898
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3547898.html
最近更新
教材專著