基于Cookie的數(shù)字標(biāo)簽的制作與應(yīng)用
發(fā)布時(shí)間:2017-11-12 00:02
本文關(guān)鍵詞:基于Cookie的數(shù)字標(biāo)簽的制作與應(yīng)用
更多相關(guān)文章: Web 數(shù)據(jù)挖掘 Cookie Apriori算法 標(biāo)簽
【摘要】:隨著社會(huì)的信息化發(fā)展,互聯(lián)網(wǎng)越來越受到世界各地的所有類型的用戶的歡迎,他們經(jīng)常登錄互聯(lián)網(wǎng),在互聯(lián)網(wǎng)搜索,找到感興趣的主題和信息,從事一系列的網(wǎng)絡(luò)互動(dòng)活動(dòng),由于互聯(lián)網(wǎng)用戶數(shù)量眾多并且復(fù)雜,互聯(lián)網(wǎng)的海量數(shù)據(jù)和網(wǎng)絡(luò)處理數(shù)據(jù)的形式也更加廣泛,所以迫切的需要一個(gè)強(qiáng)大的數(shù)據(jù)處理技術(shù)的誕生,為了提供更高質(zhì)量的web服務(wù)、web信息挖掘網(wǎng)絡(luò)信息處理技術(shù)的一種重要手段,web挖掘應(yīng)運(yùn)而生。在客戶機(jī)和服務(wù)器之間傳送信息的數(shù)據(jù)流,存儲(chǔ)大量的潛在的有價(jià)值的web日志信息,以此數(shù)據(jù)來分析網(wǎng)絡(luò)用戶行為和習(xí)慣,提高網(wǎng)站的系統(tǒng)性能,為用戶提供個(gè)性化的服務(wù)。本文以京東商城的瀏覽購物數(shù)據(jù)包作為本次數(shù)據(jù)挖掘處理以及分析的數(shù)據(jù)源,主要從以下幾個(gè)方面進(jìn)行了闡述。首先詳細(xì)介紹了本次研究課題的背景和意義以及國內(nèi)外研究現(xiàn)狀,再次詳細(xì)概述了數(shù)據(jù)挖掘與web挖掘的定義,介紹了關(guān)聯(lián)規(guī)則算法和Cookie的概念和應(yīng)用。詳細(xì)介紹了web挖掘的分類及關(guān)鍵技術(shù)。其次重點(diǎn)介紹了web數(shù)據(jù)自動(dòng)抽取的過程及方法,在抽取web日志信息時(shí)及時(shí)抽取cookie所能識(shí)別的唯一用戶名稱。緊接著分析了數(shù)據(jù)清洗的需求及方法。最后詳細(xì)介紹了關(guān)聯(lián)規(guī)則的理論概念和關(guān)聯(lián)規(guī)則挖掘的經(jīng)典算法-Apriori算法,并且詳細(xì)介紹了Apriori算法的思想,處理步驟以及算法實(shí)施過程,將算法實(shí)施在已經(jīng)處理好的數(shù)據(jù)中,得出分析結(jié)果,為了讓挖掘結(jié)果更加明晰化,我們根據(jù)URL的組成方法,研究了京東商城的網(wǎng)址參數(shù),在得出用戶最終行為模式之前,給用戶的行為加上標(biāo)簽,讓營銷決策者以及網(wǎng)站管理者能夠更明確的分析各個(gè)用戶的行為習(xí)慣是什么。理解客戶的行為和需求是業(yè)務(wù)領(lǐng)域內(nèi)一個(gè)非常重要的工作。由于電子商務(wù)網(wǎng)站的操作不受時(shí)間和地理因素的影響,通過一個(gè)網(wǎng)站可以收集大量的客戶行為數(shù)據(jù)。數(shù)據(jù)包含許多會(huì)影響網(wǎng)站商業(yè)決策用戶行為信息。由于大量的數(shù)據(jù),手動(dòng)分析幾乎是一個(gè)不可能完成的任務(wù)。適合處理大量數(shù)據(jù)的Web數(shù)據(jù)挖掘技術(shù)在這里反映了它的商業(yè)價(jià)值,它可以幫助企業(yè)快速找到和業(yè)務(wù)決策相關(guān)的信息,提高應(yīng)變能力。
【學(xué)位授予單位】:西安工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP311.13
,
本文編號(hào):1173423
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/1173423.html
最近更新
教材專著