電子商務(wù)數(shù)據(jù)挖掘中的若干關(guān)鍵技術(shù)的研究
發(fā)布時間:2017-05-17 06:14
本文關(guān)鍵詞:電子商務(wù)數(shù)據(jù)挖掘中的若干關(guān)鍵技術(shù)的研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:目前,眾多的實際應(yīng)用已證明,數(shù)據(jù)挖掘在電子商務(wù)等方面具有著極高的商業(yè)價值和重要研究意義,并且已經(jīng)被廣泛的應(yīng)用到各個領(lǐng)域。而針對數(shù)據(jù)挖掘的算法也層出不窮,尤其是關(guān)聯(lián)規(guī)則挖掘算法。在挖掘關(guān)聯(lián)規(guī)則時,比較常用的經(jīng)典挖掘算法是Apriori算法。對于Apriori算法,其關(guān)鍵步驟是根據(jù)最小支持度獲取頻繁項集,且在目前大多數(shù)算法中,最小支持度的確定一般是根據(jù)用戶的挖掘經(jīng)驗而被人為進(jìn)行設(shè)定。該做法無疑會給挖掘的結(jié)果帶來比較大的偏差。有時,該誤差甚至是致命性的。因此,如何使最小支持度因被人為設(shè)定而產(chǎn)生的誤差及其影響最小呢?于是,針對在電子商務(wù)應(yīng)用的過程中所產(chǎn)生的有關(guān)問題,本文展開了較為詳細(xì)的研討,并通過充分利用各數(shù)據(jù)挖掘技術(shù)等方法加以解決,其具體工作目的、研究思路及結(jié)果分為如下幾方面: (1)算法設(shè)計模式方面。為有效提高算法設(shè)計的可擴(kuò)展性和可維護(hù)性,避免算法設(shè)計混亂,減少算法設(shè)計上的誤差因素影響,通過探討了裝飾模式與策略模式及適配器模式的結(jié)合,文中提出了三個方案,并對其可行性及性能進(jìn)行了詳細(xì)分析與比較。最后,本文選用了效率相對較高的方案三應(yīng)用到所開發(fā)的系統(tǒng)中,并分析實驗結(jié)果。 (2)軟件復(fù)雜度及AOP (Aspect Oriented Program)方面。為有力控制系統(tǒng)復(fù)雜度水平過高,使系統(tǒng)中模塊間保持高內(nèi)聚、低耦合,避免算法的冗余度過高,減輕其他誤差因素對算法的影響,本項工作據(jù)課題的特點及其需求情況,研討了軟件復(fù)雜度的幾項重要指標(biāo),并希望用AOP達(dá)到該部分預(yù)期目標(biāo)。通過使用經(jīng)濟(jì)學(xué)中的層次分析法,本部分定量分析了AOP對軟件復(fù)雜度水平降低的重要作用。實驗證明,AOP己使系統(tǒng)達(dá)到了預(yù)期效果。 (3)挖掘關(guān)聯(lián)規(guī)則算法方面。在挖掘關(guān)聯(lián)規(guī)則時,最小支持度的重新確定問題已有通過采用牛頓插值算法進(jìn)行逆向自學(xué)習(xí)解決,但因牛頓插值算法在確定點值時需多次對整個事務(wù)數(shù)據(jù)庫進(jìn)行掃描,其所產(chǎn)生的掃描數(shù)據(jù)量是巨大的。所以,該算法直接影響了整個關(guān)聯(lián)規(guī)則挖掘算法的時間復(fù)雜度。因此,本部分的主要工作是利用分塊算法解決支持度逆向自學(xué)習(xí)時的高時間復(fù)雜度問題,并就點值誤差所引起的凸點問題通過借用哈希表沖突處理方法的思想進(jìn)行解決,使實驗結(jié)果屬于誤差可控范圍,減小挖掘算法的時間復(fù)雜度。實驗證明,該改善方案是可行的,有效的。 (4)系統(tǒng)開發(fā)。為了證明上述各項研討成果能達(dá)到預(yù)期水平,本文開發(fā)了一個電子商務(wù)實驗系統(tǒng)。通過實驗過程及實驗結(jié)果數(shù)據(jù)的對比、分析與繪圖,與目前現(xiàn)有方法相比,上述各項改善工作是切實可行的,富有成效的。 文尾之處對本論文開展的各項工作加以歸納、總結(jié),對其中的優(yōu)點希望繼續(xù)進(jìn)行優(yōu)化、完善,而對其中的缺點提出了相應(yīng)的解決建議或構(gòu)想,這為下一步的研討工作提供了很好的方向與動力。
【關(guān)鍵詞】:電子商務(wù) 設(shè)計模式 軟件復(fù)雜度 AOP 關(guān)聯(lián)規(guī)則 牛頓插值算法 分塊
【學(xué)位授予單位】:南昌大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP311.13
【目錄】:
- 摘要3-5
- ABSTRACT5-7
- 目錄7-9
- 第1章 引言9-12
- 1.1 論文背景及意義9-10
- 1.2 研究內(nèi)容10-11
- 1.3 論文安排結(jié)構(gòu)11
- 1.4 本文所做的主要工作11-12
- 第2章 軟件設(shè)計模式12-21
- 2.1 裝飾模式概述12-14
- 2.2 裝飾模式的改進(jìn)14-17
- 2.2.1 裝飾模式與策略模式、適配器模式的多模式融合14-16
- 2.2.2 裝飾模式的反模式16-17
- 2.3 改進(jìn)后裝飾模式的應(yīng)用實例17-20
- 2.3.1 應(yīng)用場景17-18
- 2.3.2 應(yīng)用實踐18-20
- 2.4 本章小結(jié)20-21
- 第3章 軟件復(fù)雜度與AOP21-30
- 3.1 軟件復(fù)雜度21-22
- 3.2 AOP22-23
- 3.3 解決方案及實驗結(jié)果分析23-29
- 3.3.1 解決方案23-27
- 3.3.2 實驗結(jié)果分析27-29
- 3.4 本章小結(jié)29-30
- 第4章 數(shù)據(jù)挖掘30-44
- 4.1 關(guān)聯(lián)規(guī)則算法分析31-36
- 4.1.1 算法思想介紹31-34
- 4.1.2 算法性能分析34-35
- 4.1.3 已有的改進(jìn)方法35-36
- 4.2 算法改進(jìn)36-43
- 4.2.1 算法Apriori的優(yōu)化及性能分析37-39
- 4.2.2 對分布式算法優(yōu)化構(gòu)想及性能分析39-40
- 4.2.3 改進(jìn)算法的示例分析40-43
- 4.3 本章小結(jié)43-44
- 第5章 改進(jìn)后的算法在電子商務(wù)中的應(yīng)用44-55
- 5.1 背景描述44-45
- 5.2 改進(jìn)算法在系統(tǒng)中的應(yīng)用45-49
- 5.2.1 數(shù)據(jù)來源描述及生成過程45-46
- 5.2.2 系統(tǒng)開發(fā)說明46-49
- 5.3 實驗結(jié)果分析49-54
- 5.4 本章小結(jié)54-55
- 第6章 總結(jié)與展望55-58
- 6.1 總結(jié)55-56
- 6.2 展望56-58
- 致謝58-59
- 攻讀學(xué)位期間的研究成果59-60
- 附錄A60-65
- 參考文獻(xiàn)65-67
【引證文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 趙穎;;分布式圖聚類及其在電子商務(wù)數(shù)據(jù)挖掘中的應(yīng)用[J];電腦知識與技術(shù);2015年02期
本文關(guān)鍵詞:電子商務(wù)數(shù)據(jù)挖掘中的若干關(guān)鍵技術(shù)的研究,由筆耕文化傳播整理發(fā)布。
本文編號:372698
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/372698.html
最近更新
教材專著