基于時(shí)段-時(shí)長(zhǎng)耦合LDA的用戶(hù)收視行為挖掘
【文章頁(yè)數(shù)】:9 頁(yè)
【部分圖文】:
圖1LDA概率圖模型
LDA是Blei等學(xué)者于2003年提出的一種基于概率模型的文本主題建模方法,可以識(shí)別龐大文檔集或語(yǔ)料庫(kù)中的隱藏主題信息,被廣泛應(yīng)用于信息檢索、自然語(yǔ)言處理等領(lǐng)域[13~15]。LDA的圖模型如圖1所示,該模型假設(shè)文章是由多個(gè)主題以不同比例混合而成,每個(gè)主題可以用多個(gè)詞的概率分布表....
圖2用戶(hù)收視記錄的周期性變化
(4)用戶(hù)對(duì)某個(gè)節(jié)目的觀看時(shí)長(zhǎng)越長(zhǎng),則對(duì)這個(gè)節(jié)目的喜愛(ài)程度越高;谏鲜龇治,本文將LDA模型中的興趣主題分布θm擴(kuò)展為表示用戶(hù)收視興趣、時(shí)段與時(shí)長(zhǎng)的行為模式分布,建立TDC-LDA模型。表2是LDA模型推廣到TDC-LDA模型后θm的變化。在LDA模型中,每個(gè)IPTV用戶(hù)的興....
圖3TDC-LDA概率圖模型
TDC-LDA模型是一個(gè)概率生成模型,它是對(duì)LDA模型的拓展,模型如圖3所示。假設(shè)有K個(gè)興趣主題,Vm個(gè)不同的電視節(jié)目,興趣主題對(duì)應(yīng)的電視節(jié)目多項(xiàng)式分布描述成K×Vm維的矩陣Φ,φk,vw是節(jié)目vm屬于主題k的概率。同樣,假設(shè)有L個(gè)時(shí)段(時(shí)段指一些特定的時(shí)間區(qū)間,例如,工作日17....
圖6用戶(hù)M觀看最多的5個(gè)節(jié)目的觀看次數(shù)與時(shí)長(zhǎng)
表9用戶(hù)M的興趣主題概率分布模型興趣主題動(dòng)畫(huà)I類(lèi)動(dòng)畫(huà)II類(lèi)古裝愛(ài)情類(lèi)cLDA0.7585140.05804950.003096TDC-LDA0.5554180.06037150.212454分析圖6可知用戶(hù)M是一個(gè)以?xún)和c家庭主婦主導(dǎo)收....
本文編號(hào):3994509
本文鏈接:http://sikaile.net/kejilunwen/wltx/3994509.html