天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 經濟論文 > 電子商務論文 >

基于正則化樸素貝葉斯的用戶分類算法的研究

發(fā)布時間:2020-02-06 01:22
【摘要】:推薦系統(tǒng)在電子商務和信息推送等場合有十分重要的應用,它把訓練數(shù)據(jù)中的用戶進行預分類,然后根據(jù)用戶預分類結果,判斷一個具體用戶的個人偏好并推送個性化服務信息,提高了用戶的體驗滿意度。樸素貝葉斯分類器具有優(yōu)良的分類性能,已被應用在推薦系統(tǒng)的用戶分類中,但由于推薦系統(tǒng)的訓練數(shù)據(jù)集存在高維度、不完備等問題,導致用戶分類的精度、計算時間、抗噪音干擾等性能不佳。針對這些問題,本文研究使用Shrinkage正則化技術改進樸素貝葉斯分類算法,提出正則化樸素貝葉斯用戶分類算法,主要研究內容如下:高斯樸素貝葉斯相當于一個對角協(xié)方差的樸素貝葉斯分類器,一定程度上減弱樣本屬性條件獨立假設對分類結果的負面影響,但數(shù)據(jù)樣本聯(lián)合概率估計誤差大的問題仍存在。在訓練數(shù)據(jù)時,在高斯密度函數(shù)中引入罰因子和Shrinkage正則化方法,自動調整屬性條件的權重,將非關鍵屬性的權重降低,使協(xié)方差估計值接近原矩陣向量,避免過擬合,減小樣本聯(lián)合概率估計的誤差,從而改善算法的分類效果,提高了分類精度。應用Adaptive Boosting(Ada Boost)自適應提升算法改進正則化樸素貝葉斯用戶分類器的精度。首先設定初始弱分類器權重,然后通過迭代方法,獲取弱分類器的最優(yōu)組合權重系統(tǒng),把弱分類器組合成強分類器,提升了分類器的精度。最后將所提的算法應用于用戶分類問題,在Movie-leans和UCI數(shù)據(jù)集上驗證算法的可行性,并與傳統(tǒng)樸素貝葉斯、核函數(shù)貝葉斯、支持向量機、決策樹等分類算法進行比較,實驗結果表明:所提算法的分類精度優(yōu)于相比較的其他算法,計算時間比傳統(tǒng)樸素貝葉斯算法有數(shù)倍的提高,本文引入Shrinkage正則化方法和Ada Boost提升技術對減少高斯貝葉斯聯(lián)合概率密度誤差和優(yōu)化計算時間是可行的。
【圖文】:

高斯分布


fW邋=邋expf^M£ZL^l邐(3-8)逡逑I邋。邋J逡逑上式為高斯分布的密度函數(shù)標準形態(tài),高斯分布圖3-1中,左側線條均值是-4,標準差逡逑是1,右側線條均值是6,標準差是1.5,很明顯看到高斯函數(shù)被分為兩部分,此刻分類逡逑出現(xiàn),如果一個點出現(xiàn)在偏左側區(qū)域,則該點歸類為左側類,反之則歸類為右側類。逡逑曲逡逑挺應&3?^^-.1.,么'幫於泌成.:》'?化'‘’--.、-;巧。-,?;'邋*-/邋<邋>.邋'sr->WH?sssSa??邋'逡逑圖3-1高斯分布度逡逑Figure邋3-1邋Gaussian邋distributio打出agram逡逑由上述分析可得,如果建立了良好的高斯分布函數(shù)模型,即知道訓練數(shù)據(jù)集的均但、逡逑方差,那么就可找到分類的臨界點。對于樸素貝葉斯中p(x|c)可理解為C類中,X逡逑特征發(fā)生的概率一X的概率密度。那么整個高斯貝葉斯分類器架構就是:逡逑1)選取輸入樣本的屬性特征,并采用高斯密度函數(shù)對各個類別的概率密度函數(shù)進行創(chuàng)逡逑建,將創(chuàng)建的密度函數(shù)作為先驗概率;逡逑巧在預測時

對比圖,準確率,對比圖,算法


邐邐0.0024邐0.0072邐0.1440邐0.0017逡逑準確率邐0.5314邐0.7196邐0.9119邐0.9341逡逑soybean邐AUC邐0.9169邐0.9783邐0.9969邐0.9965逡逑-邋時間邐0.0464邐0.4950邐2.6872邐0.0092逡逑準確率邐0.9045邐0.9125邐0.9168邐0.9069逡逑balance邐AUC邐0.9570邐0.9468邐0.9845邐0.9776逡逑時間邐0.0023邐0.0076邐0.3227邐0.0020逡逑準確率邐0.9301邐0.7207邐-邐0.9416逡逑dna邐AUC邐0.W89邐0.9161邐-邐0.9920逡逑^邐0.1304邐0.3409邐-邐0.0451逡逑準確率邐0.6428邐0.7053邐-邐0.8822逡逑letter邐AUC邐0.9506邐0.9769邐-邐0.9961逡逑^邐0.0522邐0.2528邐-邐0.1712逡逑表3-3是本文算法在五個數(shù)據(jù)集情況下與其他算法在不同評價指標下的比較。逡逑
【學位授予單位】:廣西大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.3

【相似文獻】

相關期刊論文 前10條

1 錢穎能;胡運發(fā);;用樸素貝葉斯分類法選股[J];計算機應用與軟件;2007年06期

2 歐陽澤華;郭華平;范明;;在逐漸縮小的空間上漸進學習樸素貝葉斯參數(shù)[J];計算機應用;2012年01期

3 裴亞輝;熊盛武;;樸素貝葉斯及其擴展模型[J];網(wǎng)絡安全技術與應用;2007年08期

4 趙彥琦;謝小西;荀宇暢;;樸素貝葉斯分類法的應用[J];電子制作;2013年07期

5 菅小艷;崔彩霞;;基于樸素貝葉斯的文本分類[J];電腦開發(fā)與應用;2013年12期

6 王實;高文;;增強型樸素貝葉斯學習[J];計算機科學;2000年04期

7 楊忠強;秦亮曦;;一種基于屬性加權的樸素貝葉斯改進算法[J];廣西大學學報(自然科學版);2013年05期

8 張彩麗;楊帆;張玉杰;;柴油機供油系統(tǒng)狀態(tài)的樸素貝葉斯診斷方法研究[J];計算機測量與控制;2008年08期

9 白耀輝;陳明;王舉群;;利用樸素貝葉斯方法實現(xiàn)異常檢測[J];計算機工程與應用;2005年34期

10 王雙成;冷翠平;侯彩虹;;操作風險等級預測的樸素貝葉斯方法研究[J];計算機工程與應用;2008年12期

相關會議論文 前2條

1 石志偉;吳功宜;;改善樸素貝葉斯在文本分類中的穩(wěn)定性[A];NCIRCS2004第一屆全國信息檢索與內容安全學術會議論文集[C];2004年

2 李海軍;王鉦旋;王利民;苑森淼;;基于主成分分析提升樸素貝葉斯[A];中國儀器儀表學會第六屆青年學術會議論文集[C];2004年

相關碩士學位論文 前10條

1 李Pr;基于樸素貝葉斯的文本分類研究及其在微博分類中的應用[D];北京理工大學;2015年

2 李冬梅;樸素貝葉斯與決策樹混合分類方法的研究[D];大連海事大學;2016年

3 張帆;貝葉斯算法在校園留言板垃圾過濾中的應用研究[D];鄭州大學;2016年

4 石剛;一種基于知識圖譜的用戶搜索意圖挖掘方法的研究[D];國際關系學院;2016年

5 張予瑤;基于正則化樸素貝葉斯的用戶分類算法的研究[D];廣西大學;2016年

6 胡為成;基于遺傳算法的樸素貝葉斯分類研究[D];合肥工業(yè)大學;2006年

7 劉勇華;基于樸素貝葉斯的中文段落情感分析[D];太原理工大學;2015年

8 周龍;基于樸素貝葉斯的分類方法研究[D];安徽大學;2006年

9 王翔;基于樸素貝葉斯和One-R的入侵檢測問題研究[D];合肥工業(yè)大學;2008年

10 周遠陽;基于樸素貝葉斯方法的新聞分類系統(tǒng)的實現(xiàn)[D];暨南大學;2012年

,

本文編號:2576770

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/2576770.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶e75a8***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com