若干密度聚類算法改進及電商網(wǎng)站評價應(yīng)用
本文選題:聚類分析 + DBSCAN ; 參考:《吉林財經(jīng)大學(xué)》2016年碩士論文
【摘要】:聚類分析是數(shù)據(jù)挖掘的重要技術(shù),是獲取知識的重要方法和手段。DBSCAN算法作為一種基于密度的聚類分析方法,可以在包含噪音點的數(shù)據(jù)中發(fā)現(xiàn)任意形狀的聚類且不受噪音點的影響。但該算法也存在以下缺點:(1)輸入?yún)?shù)需要先驗知識人工設(shè)置;(2)對輸入?yún)?shù)敏感,特別是處理密度不均的數(shù)據(jù)時,得到的聚類結(jié)果不佳。針對DBSCAN算法的參數(shù)敏感性問題,本文提出基于數(shù)據(jù)劃分的DBSCAN算法。該聚類算法的基本思想:首先采用人工魚群算法和k-means劃分相結(jié)合的方法實現(xiàn)數(shù)據(jù)集的劃分;然后在數(shù)據(jù)劃分的基礎(chǔ)上,引入變異系數(shù)優(yōu)化參數(shù)Eps取值,使用DBSCAN算法分別聚類;最后得到最終的聚類結(jié)果。為了驗證算法的有效性和有用性,本文將改進的DBSCAN算法應(yīng)用于企業(yè)電子商務(wù)網(wǎng)站的評價。隨著互聯(lián)網(wǎng)和電子商務(wù)的迅速普及和發(fā)展,大多數(shù)企業(yè)在互聯(lián)網(wǎng)上建立自己的電子商務(wù)網(wǎng)站,提升企業(yè)競爭力。然而,由于沒有統(tǒng)一的衡量評價標(biāo)準(zhǔn),企業(yè)對電子商務(wù)網(wǎng)站缺乏正確的認(rèn)識,需要對企業(yè)電子商務(wù)網(wǎng)站進行合理分析和評價,幫助企業(yè)提高電子商務(wù)網(wǎng)站建設(shè)水平。另外,電子商務(wù)網(wǎng)站的數(shù)據(jù)具有密度不均的分布特性,因此,適合用改進的DBSCAN聚類算法對企業(yè)電子商務(wù)網(wǎng)站進行聚類分析和評價。企業(yè)電子商務(wù)網(wǎng)站評價問題的成功解決,也將有助于DBSCAN算法在實際應(yīng)用方面進行更加深入的研究。
[Abstract]:Clustering analysis is an important technology of data mining. It is an important method and means of acquiring knowledge. DBSCAN algorithm is a density-based clustering analysis method.Clusters of arbitrary shapes can be found in data containing noise points and are not affected by noise points.However, the algorithm also has the following disadvantages: 1) the input parameters need to be manually set by a prior knowledge) and the algorithm is sensitive to the input parameters, especially when dealing with data with uneven density, the clustering results obtained are not good.Aiming at the parameter sensitivity of DBSCAN algorithm, this paper proposes a DBSCAN algorithm based on data partitioning.The basic idea of this clustering algorithm is: firstly, the method of combining artificial fish swarm algorithm and k-means partition is used to realize the partition of data sets, and then, on the basis of the data partition, the variation coefficient is introduced to optimize the parameter Eps, and the DBSCAN algorithm is used to cluster the data separately.Finally, the final clustering results are obtained.In order to verify the validity and usefulness of the algorithm, this paper applies the improved DBSCAN algorithm to the evaluation of enterprise e-commerce websites.With the rapid popularization and development of the Internet and e-commerce, most enterprises set up their own e-commerce websites on the Internet to enhance the competitiveness of enterprises.However, due to the lack of a unified evaluation standard and lack of correct understanding of e-commerce websites, it is necessary to analyze and evaluate them reasonably to help them improve the level of construction of e-commerce websites.In addition, the data of E-commerce website is distributed unevenly, so it is suitable to use the improved DBSCAN clustering algorithm to analyze and evaluate the E-commerce website.The successful solution of the evaluation problem of enterprise e-commerce website will also be helpful for the further study of DBSCAN algorithm in practical application.
【學(xué)位授予單位】:吉林財經(jīng)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.13;F724.6
【相似文獻】
相關(guān)期刊論文 前10條
1 周世兵;徐振源;唐旭清;;新的K-均值算法最佳聚類數(shù)確定方法[J];計算機工程與應(yīng)用;2010年16期
2 周世兵;徐振源;唐旭清;;基于近鄰傳播算法的最佳聚類數(shù)確定方法比較研究[J];計算機科學(xué);2011年02期
3 周世兵;徐振源;唐旭清;;一種基于近鄰傳播算法的最佳聚類數(shù)確定方法[J];控制與決策;2011年08期
4 李旭;林偉;溫金環(huán);史彩云;;基于圖譜理論的圖像聚類數(shù)的確定及應(yīng)用[J];工程數(shù)學(xué)學(xué)報;2012年05期
5 秦振濤;楊武年;;一種新的最佳聚類數(shù)確定方法[J];電子技術(shù)應(yīng)用;2013年01期
6 宋銘利;高新科;;基于距離的最大聚類數(shù)探索算法的探討[J];礦山機械;2006年09期
7 普運偉;朱明;金煒東;胡來招;;核聚類算法最佳聚類數(shù)的自適應(yīng)確定方法[J];計算機工程;2007年04期
8 楊欣斌,孫京誥,黃道;一種進化聚類學(xué)習(xí)新方法[J];計算機工程與應(yīng)用;2003年15期
9 田彥山;;基于山峰聚類的聚類上限確定方法[J];江西師范大學(xué)學(xué)報(自然科學(xué)版);2007年02期
10 褚娜;馬利莊;王彥;;聚類趨勢問題的研究綜述[J];計算機應(yīng)用研究;2009年03期
相關(guān)會議論文 前9條
1 高翠芳;吳小俊;;基于二階差分的聚類數(shù)自動確定方法[A];江蘇省系統(tǒng)工程學(xué)會第十一屆學(xué)術(shù)年會論文集[C];2009年
2 劉洋;江志綱;丁增喜;王大玲;鮑玉斌;于戈;;一種基于圖的聚類算法GB-Cluster[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2002年
3 李浪波;傅彥;劉紅;;基于范例推理的網(wǎng)格和密度聚類算法[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
4 婁冬梅;陳明;朱有娜;;一種基于密度的無參數(shù)聚類算法[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2006年
5 魏昕路;洪志令;姜青山;;一種基于樣本縮減策略的新窗口式聚類算法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2007年
6 程尊平;周鼎;王晨;周皓峰;汪衛(wèi);施伯樂;;SDPHC——基于密度的分割和分層的自校聚類算法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年
7 張曉峰;王麗珍;陸葉;;一種基于屬性加權(quán)的不確定K-means聚類算法[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
8 蔡軍;袁華鵬;陳金海;施伯樂;;一種基于相似性分析的聚類新算法:PDS算法[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2001年
9 胡仲義;郭超;王永炎;劉勝航;王宏安;;基于時間衰減和特征變量的數(shù)據(jù)流聚類算法[A];第29屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)(NDBC2012)[C];2012年
相關(guān)博士學(xué)位論文 前10條
1 王振佳;基于基因表達數(shù)據(jù)的雙聚類算法研究[D];山東大學(xué);2016年
2 胡雅婷;可能性聚類方法研究及應(yīng)用[D];吉林大學(xué);2012年
3 王縱虎;聚類分析優(yōu)化關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2012年
4 周世兵;聚類分析中的最佳聚類數(shù)確定方法研究及應(yīng)用[D];江南大學(xué);2011年
5 楊燕;基于計算智能的聚類組合算法研究[D];西南交通大學(xué);2006年
6 馮永;基于計算智能的聚類技術(shù)及其應(yīng)用研究[D];重慶大學(xué);2006年
7 劉晨;高伸縮性聚類分析方法研究[D];哈爾濱工程大學(xué);2013年
8 王強;局部疊加基因表達模式聚類分析方法研究[D];哈爾濱工業(yè)大學(xué);2012年
9 姜磊;混合演化聚類算法研究及其應(yīng)用[D];武漢大學(xué);2012年
10 尹學(xué)松;半監(jiān)督聚類分析策略設(shè)計及其拓展性研究[D];南京航空航天大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 魏建東;K-means初始化算法研究[D];南京理工大學(xué);2015年
2 張依;基于MapReduce的k-means聚類算法并行化研究[D];中央民族大學(xué);2015年
3 劉嬋;蟻群與K均值聚類算法融合研究及其在用戶分群中的應(yīng)用[D];西南科技大學(xué);2015年
4 朱琪;基于減法聚類的混合算法研究[D];湖南科技大學(xué);2015年
5 韓偉森;聚類集成研究與應(yīng)用[D];貴州大學(xué);2015年
6 譚浩;K-Means算法改進及其在森林健康評價中的應(yīng)用[D];中南林業(yè)科技大學(xué);2015年
7 嚴(yán)巍;以KPCA為核心的FCM算法改進[D];成都理工大學(xué);2015年
8 汪娟;基于權(quán)重設(shè)計的聚類集成算法研究[D];重慶大學(xué);2015年
9 牛品菽;基于圖模型的高效聚類算法研究[D];北京交通大學(xué);2016年
10 蔡洪山;大數(shù)據(jù)分析中的聚類算法研究[D];安徽理工大學(xué);2016年
,本文編號:1738005
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1738005.html