天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于用戶行為時序的聚類研究與實現(xiàn)

發(fā)布時間:2022-10-15 14:57
  網(wǎng)絡用戶隨時間變化的行為分析是近年來用戶行為分析的熱點,通常為了發(fā)現(xiàn)用戶行為的特征需要對用戶做聚類處理。針對用戶時序數(shù)據(jù)的聚類問題,現(xiàn)有研究方法存在計算性能差,距離度量不準確的缺點,無法處理大規(guī)模數(shù)據(jù)。為了解決上述問題,本文研究了基于對稱KL距離的用戶行為時序聚類方法,同時采用分布式計算和MapReduce編程模型進一步提高聚類運算的計算效率,最終實現(xiàn)用戶行為時序的自動聚類。本文主要的研究內(nèi)容包括:(1)在現(xiàn)有時序聚類研究基礎上,針對網(wǎng)絡用戶時序數(shù)據(jù)的特點,提出基于對稱KL距離的用戶行為時序聚類方法。KL距離描述的是對象在概率分布上的差異,能適應數(shù)據(jù)的平移縮放等變形,擺脫傳統(tǒng)距離定義在幾何空間上的局限性,提高時間分布差異性描述的準確性,實驗結(jié)果證明,該算法相比采用歐式距離和DTW(Dynamic Time Warping,動態(tài)時間歸整)距離度量的聚類算法能提高4%的準確度,與采用medoids聚類質(zhì)心的聚類算法相比計算時間減少一個量級;(2)面向?qū)嵕W(wǎng)環(huán)境,實現(xiàn)了海量用戶行為時序的分布式聚類;诜植际狡脚_,設計并實現(xiàn)了網(wǎng)絡用戶行為數(shù)據(jù)時序化,最優(yōu)聚類數(shù)量自動尋參,聚類映射關(guān)系特征化等關(guān)... 

【文章頁數(shù)】:73 頁

【學位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 課題研究背景與意義
    1.2 本文主要研究內(nèi)容
    1.3 研究生期間工作
    1.4 論文組織結(jié)構(gòu)
    1.5 本章小結(jié)
第二章 時序聚類技術(shù)及大數(shù)據(jù)平臺綜述
    2.1 引言
    2.2 時序聚類技術(shù)綜述
        2.2.1 國內(nèi)外研究現(xiàn)狀
        2.2.2 時間序列聚類
    2.3 大數(shù)據(jù)平臺相關(guān)技術(shù)
        2.3.1 HDFS
        2.3.2 Hadoop Streaming
        2.3.3 MapReduce抽象編程
    2.4 本章小結(jié)
第三章 基于對稱KL距離的用戶行為時序聚類方法
    3.1 引言
    3.2 用戶時序概率模型
        3.2.1 時序概率模型表示
        3.2.2 對稱KL距離度量
    3.3 基于對稱KL距離的用戶行為時序聚類方法
        3.3.1 確定聚類質(zhì)心
        3.3.2 算法加速
        3.3.3 聚類算法
    3.4 仿真結(jié)果與討論
        3.4.1 評價指標
        3.4.2 人工數(shù)據(jù)仿真結(jié)果與討論
        3.4.3 實際數(shù)據(jù)仿真結(jié)果與討論
    3.5 本章小結(jié)
第四章 基于用戶行為時序的分布式聚類實現(xiàn)
    4.1 引言
    4.2 基于用戶行為時序的分布式聚類實現(xiàn)框架
    4.3 模塊功能實現(xiàn)
        4.3.1 數(shù)據(jù)獲取與存儲
        4.3.2 預處理模塊
        4.3.3 聚類模塊
        4.3.4 聚類后處理模塊
    4.4 實例評估
        4.4.1 系統(tǒng)環(huán)境搭建
        4.4.2 系統(tǒng)運行評估
        4.4.3 運行效率評估
    4.5 本章小結(jié)
第五章 結(jié)束語
    5.1 論文總結(jié)
    5.2 未來的研究工作
參考文獻
致謝
攻讀學位期間發(fā)表的論文及專利


【參考文獻】:
期刊論文
[1]手機用戶上網(wǎng)時段的混合Markov預測方法[J]. 方志祥,于沖,張韜,馮明翔,倪雅倩.  地球信息科學學報. 2017(08)
[2]基于用戶行為的微博用戶社會影響力分析[J]. 毛佳昕,劉奕群,張敏,馬少平.  計算機學報. 2014(04)
[3]大數(shù)據(jù)平臺技術(shù)綜述[J]. 宮夏屹,李伯虎,柴旭東,谷牧.  系統(tǒng)仿真學報. 2014(03)

博士論文
[1]基于流量監(jiān)測的網(wǎng)絡用戶行為分析[D]. 延皓.北京郵電大學 2011



本文編號:3691512

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3691512.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f5f56***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com