兩步聚類和關聯(lián)規(guī)則結合的推薦算法在醫(yī)藥電商中的應用
發(fā)布時間:2021-03-10 20:16
隨著互聯(lián)網(wǎng)時代的到來,電子商務迅猛發(fā)展,電商平臺上的商品越來越豐富,從剛開始興起的日用百貨、食品,到現(xiàn)在生鮮水果、醫(yī)藥產(chǎn)品、保險等。對于消費者而言,如何在數(shù)以萬計的產(chǎn)品中挑選自己喜歡的產(chǎn)品?對于商家而言,如何將自己的產(chǎn)品推薦給消費者?為了解決這些問題,個性化推薦系統(tǒng)運用而生,并且隨著不斷的研究發(fā)展,個性化推薦算法的精準性得到很大的提高。本文主要以關聯(lián)規(guī)則為基礎研究推薦算法,為提高關聯(lián)規(guī)則推薦有效性,從兩個方面著手解決問題:第一,在使用關聯(lián)規(guī)則挖掘之前,用兩步聚類對數(shù)據(jù)進行預處理,針對數(shù)據(jù)的稀疏性導致項目無法出現(xiàn)在關聯(lián)規(guī)則的關聯(lián)關系中的問題,采用兩步聚類將消費行為相似的用戶聚為一類,可改善用戶行為數(shù)據(jù)稀疏的問題,提高項目出現(xiàn)在關聯(lián)關系中的可能性;第二,提出了調(diào)整加權Apriori算法,該算法根據(jù)項目的重要程度對項目加權,并在NewApriori算法的基礎上對加權支持度和加權置信度計算公式進行調(diào)整,改善了 NewApriori算法中加權置信度計算時權重抵消的問題。本文結合醫(yī)藥電商平臺數(shù)據(jù)實現(xiàn)了兩步聚類與關聯(lián)規(guī)則結合的個性化推薦,通過聚類分析將消費...
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:58 頁
【學位級別】:碩士
【部分圖文】:
圖2.2?CF插入過程??2.?2.?2聚類階段??
科學位論文??MASTER'S?THESIS??篩選強關聯(lián)規(guī)則,關聯(lián)規(guī)則{103卜>{101}、{104}=>{101}、U03,104}=>{101}、??{103}=>{101,104}、{104}=>{101,103丨滿足大于等于加權最小置信度0.?2和加權最??小支持度1/15,成為強關聯(lián)規(guī)則。??3.?7基于關聯(lián)規(guī)則算法的推薦??3.?7.1基于關聯(lián)規(guī)則算法推薦流程??如圖3.1所示,關聯(lián)規(guī)則的推薦以用戶歷史交易數(shù)據(jù)集為基礎,用關聯(lián)規(guī)則算??法產(chǎn)生頻繁項集,根據(jù)頻繁項集生成關聯(lián)規(guī)則,最終產(chǎn)生推薦關系。在推薦過程中??采用不同的關聯(lián)規(guī)則算法,推薦的效果也不同,本文主要研宄在事務數(shù)據(jù)集中項目??重要性不等的情況,提出采用加權關聯(lián)規(guī)則進行推薦,旨提高重要的項目在關聯(lián)規(guī)??則中的出現(xiàn)的可能性。??/*???\?-V?,?■?1?、?A??用戶交易數(shù)據(jù)集發(fā)現(xiàn)頡f頂集?_?生成關聯(lián)規(guī)則??產(chǎn)生推薦關系???/??/??/?V????圖3.1關聯(lián)規(guī)則推薦流程圖??3.?7.?2推薦測評指標??測評指標可用于評價推薦系統(tǒng)各個方面的性能,通常不同類型的推薦系統(tǒng)推薦??測評指標也略有不同,在電商推薦系統(tǒng)中常用的指標有:??(1)準確率準確率是反映在所有的推薦列表中用戶實際交互的??項目所占的比例。設推薦項的集合為Lt/,用戶實際交互項的集合為加〇?的??值越接近1,代表該推薦模型的準確率越高。推薦準確率()計算公式3.?10??如下所示:??Precision?=?\LbnBU\.?公式?3.?10??丨叫??(2)召回率(辦ca//)。召回率反映的是在用戶實際交互的項目中推薦列表的??推
領士學位論文??MASTER'S?THESIS??數(shù)據(jù)和購買藥品類型數(shù)據(jù)為基礎,通過兩步聚類算法將用戶分類,最終每個用戶都??有自己的類別標簽。??在SPSS中對21588位會員進行兩步聚類,聚類結果如圖4.?1所示,輸入17個??特征變量,將用戶聚為6類,聚類質(zhì)量顯示聚類分析尚可,聚類結果記為r義:,??7'5〇{7^,<^},其中7^?=〈/,氣〉,/?=?1,2,..-,21588,)=?1,2廣-,6。4表示第/位會員,?表??示兩步聚類得到的類,rc表示兩步聚類將會員聚到哪個類別。cp=<c7,a>,??A-?=?1,2,...,W,表示會員購買的醫(yī)藥產(chǎn)品,CP表示每個類&與醫(yī)藥產(chǎn)品之間的關??系。??模型概要??箅法兩歩??輸入17??聚類6??聚類質(zhì)量???????-1.0?-0.5?0.0?0.5?1.0??凝聚和分轉(zhuǎn)的輪抱測絕??圖4.?1兩步聚類模型概要??聚類分布如表4.5所示,第一類用戶^數(shù)量較少,僅占用戶量的2.7%,c6類別??用戶量次之,占總用戶的9.?6%,其余4類用戶數(shù)量較均勻。??表4.?5兩步聚類分布??聚類分布??占組合的踩分?占S計的鋝分??個案數(shù)?比?比??1?590?2.7%?2.7%??2?4263??19.7%?_?1^9.7%??3?3357?15.6%?15.6%??4?601?6?27.9%?27.9%??5?__5294??24.5%?24.5%??6?_2068?9.6%?9.6%??組合?_21588?100.0%?__?100.0%??一??21568?10
【參考文獻】:
期刊論文
[1]一種多層多維的關聯(lián)規(guī)則挖掘算法在推薦系統(tǒng)中的應用[J]. 黎丹雨,陳怡華. 計算機與現(xiàn)代化. 2019(06)
[2]DBSCAN算法研究及并行化實現(xiàn)[J]. 宋董飛,徐華. 計算機工程與應用. 2018(24)
[3]基于深度學習的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計算機學報. 2018(07)
[4]大數(shù)據(jù)挖掘在高校圖書館個性化服務中應用研究[J]. 柳益君,何勝,馮新翎,武群輝,熊太純. 圖書館工作與研究. 2017(05)
[5]基于改進的SOM聚類連續(xù)屬性離散化算法[J]. 陶剛,閆永剛,劉俊,鄒嬌. 計算機應用. 2015(S1)
[6]混合屬性數(shù)據(jù)k-prototypes聚類算法[J]. 余文利,余建軍,方建文. 計算機系統(tǒng)應用. 2015(06)
[7]協(xié)同過濾推薦技術綜述[J]. 冷亞軍,陸青,梁昌勇. 模式識別與人工智能. 2014(08)
[8]基于用戶相似度的協(xié)同過濾推薦算法[J]. 榮輝桂,火生旭,胡春華,莫進俠. 通信學報. 2014(02)
[9]基于Apriori算法的水平加權關聯(lián)規(guī)則挖掘[J]. 張智軍,方穎,許云濤. 計算機工程與應用. 2003(14)
[10]加權關聯(lián)規(guī)則挖掘算法的研究[J]. 陸建江. 計算機研究與發(fā)展. 2002(10)
博士論文
[1]協(xié)同過濾推薦算法的關鍵性問題研究[D]. 黃山山.山東大學 2016
[2]模糊聚類算法研究[D]. 曾山.華中科技大學 2012
碩士論文
[1]基于鏈接改進的BIRCH算法的研究與應用[D]. 陳婧文.吉林大學 2019
[2]基于關聯(lián)規(guī)則和聚類分析的個性化推薦系統(tǒng)的研究與實現(xiàn)[D]. 孫世文.吉林大學 2015
[3]基于數(shù)據(jù)挖掘的視頻推薦系統(tǒng)建模研究[D]. 謝發(fā)川.電子科技大學 2012
本文編號:3075224
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:58 頁
【學位級別】:碩士
【部分圖文】:
圖2.2?CF插入過程??2.?2.?2聚類階段??
科學位論文??MASTER'S?THESIS??篩選強關聯(lián)規(guī)則,關聯(lián)規(guī)則{103卜>{101}、{104}=>{101}、U03,104}=>{101}、??{103}=>{101,104}、{104}=>{101,103丨滿足大于等于加權最小置信度0.?2和加權最??小支持度1/15,成為強關聯(lián)規(guī)則。??3.?7基于關聯(lián)規(guī)則算法的推薦??3.?7.1基于關聯(lián)規(guī)則算法推薦流程??如圖3.1所示,關聯(lián)規(guī)則的推薦以用戶歷史交易數(shù)據(jù)集為基礎,用關聯(lián)規(guī)則算??法產(chǎn)生頻繁項集,根據(jù)頻繁項集生成關聯(lián)規(guī)則,最終產(chǎn)生推薦關系。在推薦過程中??采用不同的關聯(lián)規(guī)則算法,推薦的效果也不同,本文主要研宄在事務數(shù)據(jù)集中項目??重要性不等的情況,提出采用加權關聯(lián)規(guī)則進行推薦,旨提高重要的項目在關聯(lián)規(guī)??則中的出現(xiàn)的可能性。??/*???\?-V?,?■?1?、?A??用戶交易數(shù)據(jù)集發(fā)現(xiàn)頡f頂集?_?生成關聯(lián)規(guī)則??產(chǎn)生推薦關系???/??/??/?V????圖3.1關聯(lián)規(guī)則推薦流程圖??3.?7.?2推薦測評指標??測評指標可用于評價推薦系統(tǒng)各個方面的性能,通常不同類型的推薦系統(tǒng)推薦??測評指標也略有不同,在電商推薦系統(tǒng)中常用的指標有:??(1)準確率準確率是反映在所有的推薦列表中用戶實際交互的??項目所占的比例。設推薦項的集合為Lt/,用戶實際交互項的集合為加〇?的??值越接近1,代表該推薦模型的準確率越高。推薦準確率()計算公式3.?10??如下所示:??Precision?=?\LbnBU\.?公式?3.?10??丨叫??(2)召回率(辦ca//)。召回率反映的是在用戶實際交互的項目中推薦列表的??推
領士學位論文??MASTER'S?THESIS??數(shù)據(jù)和購買藥品類型數(shù)據(jù)為基礎,通過兩步聚類算法將用戶分類,最終每個用戶都??有自己的類別標簽。??在SPSS中對21588位會員進行兩步聚類,聚類結果如圖4.?1所示,輸入17個??特征變量,將用戶聚為6類,聚類質(zhì)量顯示聚類分析尚可,聚類結果記為r義:,??7'5〇{7^,<^},其中7^?=〈/,氣〉,/?=?1,2,..-,21588,)=?1,2廣-,6。4表示第/位會員,?表??示兩步聚類得到的類,rc表示兩步聚類將會員聚到哪個類別。cp=<c7,a>,??A-?=?1,2,...,W,表示會員購買的醫(yī)藥產(chǎn)品,CP表示每個類&與醫(yī)藥產(chǎn)品之間的關??系。??模型概要??箅法兩歩??輸入17??聚類6??聚類質(zhì)量???????-1.0?-0.5?0.0?0.5?1.0??凝聚和分轉(zhuǎn)的輪抱測絕??圖4.?1兩步聚類模型概要??聚類分布如表4.5所示,第一類用戶^數(shù)量較少,僅占用戶量的2.7%,c6類別??用戶量次之,占總用戶的9.?6%,其余4類用戶數(shù)量較均勻。??表4.?5兩步聚類分布??聚類分布??占組合的踩分?占S計的鋝分??個案數(shù)?比?比??1?590?2.7%?2.7%??2?4263??19.7%?_?1^9.7%??3?3357?15.6%?15.6%??4?601?6?27.9%?27.9%??5?__5294??24.5%?24.5%??6?_2068?9.6%?9.6%??組合?_21588?100.0%?__?100.0%??一??21568?10
【參考文獻】:
期刊論文
[1]一種多層多維的關聯(lián)規(guī)則挖掘算法在推薦系統(tǒng)中的應用[J]. 黎丹雨,陳怡華. 計算機與現(xiàn)代化. 2019(06)
[2]DBSCAN算法研究及并行化實現(xiàn)[J]. 宋董飛,徐華. 計算機工程與應用. 2018(24)
[3]基于深度學習的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計算機學報. 2018(07)
[4]大數(shù)據(jù)挖掘在高校圖書館個性化服務中應用研究[J]. 柳益君,何勝,馮新翎,武群輝,熊太純. 圖書館工作與研究. 2017(05)
[5]基于改進的SOM聚類連續(xù)屬性離散化算法[J]. 陶剛,閆永剛,劉俊,鄒嬌. 計算機應用. 2015(S1)
[6]混合屬性數(shù)據(jù)k-prototypes聚類算法[J]. 余文利,余建軍,方建文. 計算機系統(tǒng)應用. 2015(06)
[7]協(xié)同過濾推薦技術綜述[J]. 冷亞軍,陸青,梁昌勇. 模式識別與人工智能. 2014(08)
[8]基于用戶相似度的協(xié)同過濾推薦算法[J]. 榮輝桂,火生旭,胡春華,莫進俠. 通信學報. 2014(02)
[9]基于Apriori算法的水平加權關聯(lián)規(guī)則挖掘[J]. 張智軍,方穎,許云濤. 計算機工程與應用. 2003(14)
[10]加權關聯(lián)規(guī)則挖掘算法的研究[J]. 陸建江. 計算機研究與發(fā)展. 2002(10)
博士論文
[1]協(xié)同過濾推薦算法的關鍵性問題研究[D]. 黃山山.山東大學 2016
[2]模糊聚類算法研究[D]. 曾山.華中科技大學 2012
碩士論文
[1]基于鏈接改進的BIRCH算法的研究與應用[D]. 陳婧文.吉林大學 2019
[2]基于關聯(lián)規(guī)則和聚類分析的個性化推薦系統(tǒng)的研究與實現(xiàn)[D]. 孫世文.吉林大學 2015
[3]基于數(shù)據(jù)挖掘的視頻推薦系統(tǒng)建模研究[D]. 謝發(fā)川.電子科技大學 2012
本文編號:3075224
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3075224.html
最近更新
教材專著