天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于區(qū)間半監(jiān)督LDA的協(xié)同過(guò)濾推薦算法

發(fā)布時(shí)間:2024-02-22 15:16
  協(xié)同過(guò)濾推薦算法是最常用的推薦算法之一,其利用大量相關(guān)數(shù)據(jù)對(duì)用戶行為相似性進(jìn)行分析并為用戶提供個(gè)性化推薦。在大數(shù)據(jù)時(shí)代,大量的數(shù)據(jù)呈現(xiàn)在人們面前,而個(gè)性化推薦的實(shí)現(xiàn)需要挖掘數(shù)據(jù)中的隱含信息。LDA主題模型通常用于獲取文檔的主題分布信息,因此,許多學(xué)者嘗試將LDA主題模型應(yīng)用于協(xié)同過(guò)濾推薦算法之中,并且不斷地進(jìn)行探索優(yōu)化。傳統(tǒng)的LDA主題模型是無(wú)監(jiān)督主題模型,在實(shí)際的文本挖掘應(yīng)用中,整個(gè)數(shù)據(jù)集經(jīng)常需要處理大量的主題,而用戶實(shí)際上只對(duì)其中小部分主題感興趣。在這種情況下,直接應(yīng)用LDA模型存在明顯的缺點(diǎn)。即LDA模型在處理大量主題的過(guò)程中,往往會(huì)生成很多的局部極大值;這使得模型可能會(huì)給出許多“垃圾”主題,最終生成不穩(wěn)定的結(jié)果。但是,在多數(shù)情況下數(shù)據(jù)集中相關(guān)主題存在的數(shù)量太少,所以需要使用大量的主題以無(wú)監(jiān)督的方式來(lái)捕獲它們。本文在LDA主題模型的基礎(chǔ)上,固定相關(guān)主題關(guān)鍵詞對(duì)應(yīng)的主題區(qū)間,提出了區(qū)間半監(jiān)督LDA主題模型。區(qū)間半監(jiān)督LDA主題模型能有效規(guī)避在傳統(tǒng)LDA主題模型構(gòu)建過(guò)程中生成“垃圾”主題的風(fēng)險(xiǎn),提高了模型主題分布計(jì)算的準(zhǔn)確率。已知協(xié)同過(guò)濾推薦算法可以利用LDA主題模型計(jì)算文檔的主題分...

【文章頁(yè)數(shù)】:42 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖3-1概率模型:(a)LDA;(b)半監(jiān)督LDA;(c)區(qū)間半監(jiān)督LDA

圖3-1概率模型:(a)LDA;(b)半監(jiān)督LDA;(c)區(qū)間半監(jiān)督LDA

分系統(tǒng)地介紹了吉布斯采樣地計(jì)算過(guò)程),因?yàn)樗菀淄茝V到以下考慮的區(qū)間半監(jiān)督LDA。在簡(jiǎn)單變化之后,吉布斯采樣減少到折疊吉布斯采樣:pz=tz,j,α,β∝qz,t,z,j,α,β=,()∑(,())∈,()∑(,)∈(3-1)其中z是一定分....


圖5-1用戶準(zhǔn)確率對(duì)比

圖5-1用戶準(zhǔn)確率對(duì)比

表5-5基于區(qū)間半監(jiān)督LDA用戶推薦準(zhǔn)確率用戶名稱推薦數(shù)1020304050用戶10.310.350.230.320.38用戶20.320.370.350.400.39用戶30.380.420.370.400.44用戶40.....


圖5-2用戶準(zhǔn)確率對(duì)比

圖5-2用戶準(zhǔn)確率對(duì)比

可以發(fā)現(xiàn)這類用戶對(duì)我們預(yù)定義的娛樂(lè)新聞并不感興趣;仡檯^(qū)間半監(jiān)督LDA主題的建模過(guò)程可以發(fā)現(xiàn),當(dāng)詞并不包含在預(yù)定義關(guān)鍵詞集中時(shí),我們?nèi)允褂脗鹘y(tǒng)LDA主題模型的公式進(jìn)行計(jì)算。因此,我們可以得出結(jié)論,當(dāng)用戶對(duì)預(yù)定義關(guān)鍵詞集所屬領(lǐng)域的新聞文檔不敢興趣時(shí),使用區(qū)間半監(jiān)督LDA....


圖1由圖5-1可以看出,對(duì)于第一類用戶來(lái)說(shuō),使用傳統(tǒng)的LDA主題模型或是使用區(qū)間半監(jiān)督LDA主題模型進(jìn)行建模測(cè)評(píng)結(jié)果并沒(méi)有發(fā)生改變

圖1由圖5-1可以看出,對(duì)于第一類用戶來(lái)說(shuō),使用傳統(tǒng)的LDA主題模型或是使用區(qū)間半監(jiān)督LDA主題模型進(jìn)行建模測(cè)評(píng)結(jié)果并沒(méi)有發(fā)生改變

表5-5基于區(qū)間半監(jiān)督LDA用戶推薦準(zhǔn)確率用戶名稱推薦數(shù)1020304050用戶10.310.350.230.320.38用戶20.320.370.350.400.39用戶30.380.420.370.400.44用戶40.....



本文編號(hào):3906868

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3906868.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4827c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com