面向電子商務(wù)的WEB數(shù)據(jù)挖掘研究
本文關(guān)鍵詞:面向電子商務(wù)的WEB數(shù)據(jù)挖掘研究 出處:《中南大學(xué)》2011年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 電子商務(wù) Web數(shù)據(jù)挖掘 關(guān)聯(lián)規(guī)則分析 模糊聚類分析
【摘要】:隨著互聯(lián)網(wǎng)的迅速發(fā)展,互聯(lián)網(wǎng)上的信息量快速增長。大多數(shù)用戶無法從龐大的互聯(lián)網(wǎng)上獲得自己想要的信息,很多電子商務(wù)網(wǎng)站也無法針對目標(biāo)用戶提供用戶感興趣的內(nèi)容。當(dāng)前,在電子商務(wù)領(lǐng)域,數(shù)據(jù)挖掘技術(shù)與Web技術(shù)正不斷融合,利用Web挖掘技術(shù),企業(yè)決策者能為用戶提供更有效的資源,為企業(yè)獲得更高的收益。 Web挖掘的研究已經(jīng)建立了較好的理論體系,也取得了一些應(yīng)用成果,但是,在針對Web數(shù)據(jù)的挖掘智能化與站點設(shè)計基于商業(yè)知識發(fā)現(xiàn)的總體規(guī)劃方面存在較多的問題,還需繼續(xù)研究。本文是針對這一方面進(jìn)行一些嘗試性的研究工作,主要工作內(nèi)容如下: 理解了數(shù)據(jù)挖掘、Web挖掘相關(guān)的基本理論和主要技術(shù);研究了在電子商務(wù)領(lǐng)域Web數(shù)據(jù)挖掘的主要應(yīng)用以及面臨的關(guān)鍵問題;具體分析了在電子商務(wù)領(lǐng)域數(shù)據(jù)挖掘的主要內(nèi)容和數(shù)據(jù)源;設(shè)計了面向電子商務(wù)Web數(shù)據(jù)挖掘總體模型。 詳細(xì)闡述了基于電子商務(wù)Web數(shù)據(jù)挖掘預(yù)處理過程;運(yùn)用算法描述了數(shù)據(jù)清洗與凈化、用戶識別、會話識別和事務(wù)識別等過程;研究在電子商務(wù)領(lǐng)域運(yùn)用關(guān)聯(lián)規(guī)則技術(shù)進(jìn)行挖掘模式發(fā)現(xiàn),通過實例分析詳細(xì)探討了Apriori經(jīng)典關(guān)聯(lián)規(guī)則挖掘算法的具體運(yùn)用;提出了Apriori算法的不足并對其進(jìn)行了算法優(yōu)化;探討了基于用戶瀏覽興趣進(jìn)行用戶模糊聚類分析;研究了聚類常用方法,分析了模糊聚類的步驟,研究了用戶瀏覽興趣的度量及其方法,通過實例分析研究實現(xiàn)了基于用戶訪問頻繁頁面次數(shù)和耗時的模糊聚類過程。
[Abstract]:With the rapid development of the Internet, the amount of information on the Internet is growing rapidly. Most users can not get the information they want from the huge Internet. At present, in the field of electronic commerce, data mining technology and Web technology are constantly merging, using Web mining technology. Enterprise decision-makers can provide users with more effective resources and obtain higher profits for enterprises. The research of Web mining has established a good theoretical system, and has also made some application results, but. There are many problems in intelligent mining of Web data and overall planning of site design based on business knowledge discovery. This paper is to carry out some tentative research work in this field, the main work is as follows: The basic theory and main technology of data mining related to Web mining are understood. The main applications and key problems of Web data mining in the field of electronic commerce are studied. The main contents and data sources of data mining in the field of electronic commerce are analyzed in detail. A general model of Web data mining oriented to e-commerce is designed. The preprocessing process of data mining based on e-commerce Web is described in detail. The processes of data cleaning and purification, user identification, session identification and transaction identification are described by the algorithm. This paper studies the application of association rules technology to mining patterns in the field of electronic commerce, and discusses the application of Apriori classic association rules mining algorithm in detail through the analysis of examples. The deficiency of Apriori algorithm is put forward and the algorithm is optimized. The user fuzzy clustering analysis based on user's browsing interest is discussed. The common methods of clustering are studied, the steps of fuzzy clustering are analyzed, and the measurement and method of users' browsing interest are studied. The fuzzy clustering process based on the number of frequent page visits and the time consuming is realized through the case study.
【學(xué)位授予單位】:中南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2011
【分類號】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 席景科;閆大順;;Web數(shù)據(jù)挖掘中數(shù)據(jù)集成問題的研究[J];計算機(jī)工程與設(shè)計;2006年08期
2 孫鑒亮;;智能型搜索引擎[J];科技咨詢導(dǎo)報;2007年15期
3 李仕楊;;數(shù)據(jù)挖掘技術(shù)在Web中的應(yīng)用問題探討[J];中國新技術(shù)新產(chǎn)品;2009年08期
4 尹海麗,劉慧;用一種數(shù)據(jù)挖掘的方法解決網(wǎng)絡(luò)擁擠的問題[J];青島理工大學(xué)學(xué)報;2005年05期
5 馬秋菊;李小芳;李杰;;基于WEB和數(shù)據(jù)倉庫的商業(yè)營銷決策支持系統(tǒng)的設(shè)計[J];商場現(xiàn)代化;2007年05期
6 趙春燕;;數(shù)據(jù)挖掘技術(shù)及其在高校圖書館的應(yīng)用[J];北京政法職業(yè)學(xué)院學(xué)報;2007年03期
7 董宇;劉富強(qiáng);;基于web的數(shù)據(jù)挖掘系統(tǒng)的研究與設(shè)計[J];電子技術(shù);2008年11期
8 周賢善;謝婷婷;;基于Web的數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用[J];孝感學(xué)院學(xué)報;2010年03期
9 劉忠沁;;Web數(shù)據(jù)挖掘在高校網(wǎng)站建設(shè)中的運(yùn)用[J];電腦知識與技術(shù);2011年25期
10 彭曙蓉;王耀南;楊文忠;;基于馬爾可夫鏈的Web訪問序列挖掘算法[J];計算機(jī)工程與設(shè)計;2006年02期
相關(guān)會議論文 前10條
1 徐慧;;基于Web的文獻(xiàn)數(shù)據(jù)挖掘[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2000年
2 代廣珍;徐超;;基于Web的數(shù)據(jù)挖掘研究綜述[A];2005年“數(shù)字安徽”博士科技論壇論文集[C];2005年
3 薛魯華;張楠;;聚類分析在Web數(shù)據(jù)挖掘中的應(yīng)用[A];北京市第十三次統(tǒng)計科學(xué)討論會論文選編[C];2006年
4 何英煒;陳志祥;;基于Web的制造企業(yè)需求管理系統(tǒng)研究[A];全國先進(jìn)制造技術(shù)高層論壇暨制造業(yè)自動化、信息化技術(shù)研討會論文集[C];2005年
5 殷華蓓;李通;唐常杰;張?zhí)鞈c;左志松;;從Web文件中挖掘個性化導(dǎo)航知識[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2000年
6 石晶;龔震宇;裘杭萍;;基于Web挖掘的個性化服務(wù)技術(shù)[A];第十九屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2002年
7 王洪肖;劉威;于賀玲;;基于XML技術(shù)的WEB數(shù)據(jù)收集模型的研究[A];低碳經(jīng)濟(jì)與科學(xué)發(fā)展——吉林省第六屆科學(xué)技術(shù)學(xué)術(shù)年會論文集[C];2010年
8 劉建偉;于守健;樂嘉錦;;基于Web服務(wù)資源框架的流數(shù)據(jù)查詢處理系統(tǒng)[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
9 李利波;劉明利;;一種改進(jìn)的無回溯反向Web服務(wù)動態(tài)組合方法[A];2011年全國通信安全學(xué)術(shù)會議論文集[C];2011年
10 游爭光;劉建勛;唐明董;;分布式Web服務(wù)測試系統(tǒng)的設(shè)計與實現(xiàn)[A];CCF NCSC 2011——第二屆中國計算機(jī)學(xué)會服務(wù)計算學(xué)術(shù)會議論文集[C];2011年
相關(guān)重要報紙文章 前10條
1 張承東;Web智能考核廣告[N];網(wǎng)絡(luò)世界;2009年
2 趙曉濤;Web安全 服務(wù)為王[N];網(wǎng)絡(luò)世界;2008年
3 本報記者 趙曉濤;Web安全:歷史的命題[N];網(wǎng)絡(luò)世界;2008年
4 彭敏;企業(yè)級Web2.0迎來應(yīng)用高潮[N];電腦商報;2009年
5 本報記者 毛江華;安啟華聯(lián)手賽門鐵克 掘金Web安全[N];計算機(jī)世界;2009年
6 閆冰;“推”出Web交付新天地[N];網(wǎng)絡(luò)世界;2009年
7 趙曉濤;中國成全球Web安全新看點[N];網(wǎng)絡(luò)世界;2009年
8 邊歆;動態(tài)阻斷Web2.0威脅[N];網(wǎng)絡(luò)世界;2009年
9 泰樂公司首席技術(shù)官兼執(zhí)行副總裁Vikram Saksena;學(xué)習(xí)Web 3.0 做聰明的“管道工”[N];通信產(chǎn)業(yè)報;2009年
10 ;Web2.0工具使用須謹(jǐn)慎[N];網(wǎng)絡(luò)世界;2009年
相關(guān)博士學(xué)位論文 前10條
1 陳世展;服務(wù)網(wǎng)絡(luò):基于語義和社會化關(guān)系的Web服務(wù)計算基礎(chǔ)設(shè)施[D];天津大學(xué);2010年
2 孫麗;工藝知識管理及其若干關(guān)鍵技術(shù)研究[D];大連交通大學(xué);2005年
3 胡志坤;復(fù)雜有色金屬熔煉過程操作模式智能優(yōu)化方法研究[D];中南大學(xué);2005年
4 劉革平;基于數(shù)據(jù)挖掘的遠(yuǎn)程學(xué)習(xí)評價研究[D];西南師范大學(xué);2005年
5 劉寨華;基于臨床數(shù)據(jù)分析的病毒性心肌炎證候演變規(guī)律研究[D];黑龍江中醫(yī)藥大學(xué);2006年
6 王川;基因芯片數(shù)據(jù)管理及數(shù)據(jù)挖掘[D];中國科學(xué)院研究生院(上海生命科學(xué)研究院);2004年
7 王濤;挖掘序列模式和結(jié)構(gòu)化模式的精簡集[D];華中科技大學(xué);2006年
8 郭斯羽;動態(tài)數(shù)據(jù)中的數(shù)據(jù)挖掘研究[D];浙江大學(xué);2002年
9 李旭升;貝葉斯網(wǎng)絡(luò)分類模型研究及其在信用評估中的應(yīng)用[D];西南交通大學(xué);2007年
10 劉東升;面向連鎖零售企業(yè)的客戶關(guān)系管理模型(R-CRM)研究[D];浙江工商大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 李雪妍;基于Web數(shù)據(jù)挖掘在個性化遠(yuǎn)程教學(xué)系統(tǒng)中的應(yīng)用研究[D];電子科技大學(xué);2010年
2 孫學(xué)軍;面向電子商務(wù)的Web數(shù)據(jù)挖掘應(yīng)用研究[D];山東大學(xué);2011年
3 周緒倩;基于電子商務(wù)的Web數(shù)據(jù)挖掘系統(tǒng)架構(gòu)研究[D];河北工程大學(xué);2010年
4 崔廣治;Web數(shù)據(jù)挖掘在個性化服務(wù)中的應(yīng)用研究[D];河北大學(xué);2010年
5 王世云;Web數(shù)據(jù)挖掘在網(wǎng)上書店個性化推薦系統(tǒng)中的應(yīng)用研究[D];遼寧工程技術(shù)大學(xué);2011年
6 胡峰;Web數(shù)據(jù)挖掘及其在網(wǎng)絡(luò)新聞文本數(shù)據(jù)中的應(yīng)用[D];電子科技大學(xué);2010年
7 馬全明;基于Web日志的數(shù)據(jù)挖掘研究與實現(xiàn)[D];解放軍信息工程大學(xué);2009年
8 王朝陽;基于數(shù)據(jù)挖掘的自適應(yīng)Web站點的設(shè)計與實現(xiàn)[D];西安電子科技大學(xué);2009年
9 高偉華;基于BP神經(jīng)網(wǎng)絡(luò)的WEB數(shù)據(jù)挖掘[D];中南民族大學(xué);2010年
10 董倩;Web潛在用戶挖掘研究[D];河北農(nóng)業(yè)大學(xué);2011年
,本文編號:1360478
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/1360478.html