基于時段-時長耦合LDA的用戶收視行為挖掘
【文章頁數(shù)】:9 頁
【部分圖文】:
圖1LDA概率圖模型
LDA是Blei等學(xué)者于2003年提出的一種基于概率模型的文本主題建模方法,可以識別龐大文檔集或語料庫中的隱藏主題信息,被廣泛應(yīng)用于信息檢索、自然語言處理等領(lǐng)域[13~15]。LDA的圖模型如圖1所示,該模型假設(shè)文章是由多個主題以不同比例混合而成,每個主題可以用多個詞的概率分布表....
圖2用戶收視記錄的周期性變化
(4)用戶對某個節(jié)目的觀看時長越長,則對這個節(jié)目的喜愛程度越高;谏鲜龇治,本文將LDA模型中的興趣主題分布θm擴(kuò)展為表示用戶收視興趣、時段與時長的行為模式分布,建立TDC-LDA模型。表2是LDA模型推廣到TDC-LDA模型后θm的變化。在LDA模型中,每個IPTV用戶的興....
圖3TDC-LDA概率圖模型
TDC-LDA模型是一個概率生成模型,它是對LDA模型的拓展,模型如圖3所示。假設(shè)有K個興趣主題,Vm個不同的電視節(jié)目,興趣主題對應(yīng)的電視節(jié)目多項(xiàng)式分布描述成K×Vm維的矩陣Φ,φk,vw是節(jié)目vm屬于主題k的概率。同樣,假設(shè)有L個時段(時段指一些特定的時間區(qū)間,例如,工作日17....
圖6用戶M觀看最多的5個節(jié)目的觀看次數(shù)與時長
表9用戶M的興趣主題概率分布模型興趣主題動畫I類動畫II類古裝愛情類cLDA0.7585140.05804950.003096TDC-LDA0.5554180.06037150.212454分析圖6可知用戶M是一個以兒童與家庭主婦主導(dǎo)收....
本文編號:3994509
本文鏈接:http://sikaile.net/kejilunwen/wltx/3994509.html