基于網(wǎng)絡(luò)日志挖掘技術(shù)數(shù)據(jù)信息分析的研究
本文關(guān)鍵詞:基于網(wǎng)絡(luò)日志挖掘技術(shù)數(shù)據(jù)信息分析的研究,由筆耕文化傳播整理發(fā)布。
龍?jiān)雌诳W(wǎng) 基于網(wǎng)絡(luò)日志挖掘技術(shù)數(shù)據(jù)信息分析的研究 作者:付生 來(lái)源:《科技與創(chuàng)新》2015 年第 06 期 摘 要:對(duì)網(wǎng)絡(luò)日志挖掘技術(shù)數(shù)據(jù)信息分析的研究,是動(dòng)態(tài)交互網(wǎng)絡(luò)使用數(shù)據(jù)挖掘的一種 技術(shù)實(shí)現(xiàn)。通過(guò)挖掘動(dòng)態(tài)交互網(wǎng)絡(luò)日志,可以查找用戶訪問(wèn)動(dòng)態(tài)交互網(wǎng)絡(luò)的瀏覽方式和習(xí)慣性 行為,并依據(jù)數(shù)據(jù)挖掘分析和研究動(dòng)態(tài)交互網(wǎng)絡(luò)日志記錄中的規(guī)
律,判斷數(shù)據(jù)價(jià)值鏈與組織結(jié) 構(gòu)的適應(yīng)性問(wèn)題,從而提高信息查找的快速指向性和信息檢索的高效性,,并利用統(tǒng)計(jì)和關(guān)聯(lián)的 分析找出特定用戶與特定地域、特定時(shí)間、特定頁(yè)面等要素之間的內(nèi)在聯(lián)系。 關(guān)鍵詞:日志挖掘;數(shù)據(jù)分析;信息檢索;網(wǎng)絡(luò)日志 中圖分類號(hào):TP311.13 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.15913/j.cnki.kjycx.2015.06.068 1 日志數(shù)據(jù)挖掘 動(dòng)態(tài)交互網(wǎng)絡(luò)獲取信息的過(guò)程存在站點(diǎn)訪問(wèn)的跳躍性和無(wú)序性,數(shù)據(jù)信息指向是呈布朗運(yùn) 動(dòng)分布的。超文本鏈接的跳轉(zhuǎn)過(guò)程具有一定的普遍性,并且還有數(shù)據(jù)存量大、數(shù)據(jù)更替快等大 數(shù)據(jù) 4V 特點(diǎn)。挖掘規(guī)律即是動(dòng)態(tài)交互網(wǎng)絡(luò)用戶訪問(wèn)信息發(fā)現(xiàn)的重要研究?jī)?nèi)容。動(dòng)態(tài)交互網(wǎng)絡(luò) 日志挖掘是對(duì)大量用戶行為和數(shù)據(jù)價(jià)值有效性的判斷,該判斷是經(jīng)過(guò)數(shù)據(jù)的預(yù)處理、數(shù)據(jù)模式 識(shí)別和模式分析 3 個(gè)過(guò)程實(shí)現(xiàn)的。 2 動(dòng)態(tài)交互網(wǎng)絡(luò)日志挖掘的過(guò)程 對(duì)于動(dòng)態(tài)交互網(wǎng)絡(luò)日志挖掘,首先要研究和分析網(wǎng)絡(luò)日志記錄信息存在的變化和特點(diǎn),進(jìn) 而實(shí)現(xiàn)數(shù)據(jù)的預(yù)處理過(guò)程。另外,要識(shí)別用戶信息,提高對(duì)用戶價(jià)值信息的服務(wù)質(zhì)量,改進(jìn)動(dòng) 態(tài)交互網(wǎng)絡(luò)服務(wù)系統(tǒng)的數(shù)據(jù)信息判斷和組織結(jié)構(gòu)。 2.1 數(shù)據(jù)預(yù)處理 在動(dòng)態(tài)交互網(wǎng)絡(luò)日志文件記錄中,存儲(chǔ)的是用戶訪問(wèn)站點(diǎn)信息的原始記錄,而原始記錄的 數(shù)據(jù)具有多樣性和大量性,所以,直接從數(shù)據(jù)中挖掘其有效價(jià)值存在不確定性和一定的困難。 在借助一定的算法和工具分析數(shù)據(jù)時(shí),必須要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。預(yù)處理過(guò)程是指對(duì)數(shù)據(jù)質(zhì) 量、數(shù)據(jù)的多樣性和量級(jí)進(jìn)行處理,這會(huì)直接影響數(shù)據(jù)挖掘的結(jié)果,還會(huì)影響數(shù)據(jù)價(jià)值存在的 判斷。對(duì)于數(shù)據(jù)訪問(wèn)量小、數(shù)據(jù)多樣性單一的網(wǎng)絡(luò)日志信息,數(shù)據(jù)處理的準(zhǔn)確性具有非常重要 的意義。日志預(yù)處理主要是通過(guò)數(shù)據(jù)凈化、用戶識(shí)別、會(huì)話識(shí)別和數(shù)據(jù)合并 4 個(gè)過(guò)程實(shí)現(xiàn)的。 2.2 數(shù)據(jù)模式發(fā)現(xiàn) 龍?jiān)雌诳W(wǎng) 利用數(shù)據(jù)挖掘相關(guān)算法是實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)日志中隱藏的、重復(fù)的、大量有用的或者無(wú)用的信息 進(jìn)行數(shù)據(jù)模式識(shí)別的一種方式,最終發(fā)現(xiàn)可以理解和學(xué)習(xí)的信息。同時(shí),用于動(dòng)態(tài)交互網(wǎng)絡(luò)的 挖掘技術(shù)有路徑選擇、關(guān)聯(lián)分析、分類規(guī)則、聚類分析、序列分析和依賴性建模等。 2.3 模式分析 在動(dòng)態(tài)交互網(wǎng)絡(luò)日志挖掘中,最重要的一項(xiàng)工作就是數(shù)據(jù)分析。它主要完成有用模式的算 法發(fā)現(xiàn)和數(shù)據(jù)鏈的模式分析。在當(dāng)前的電子商務(wù)系統(tǒng)中,模式發(fā)現(xiàn)和模式分析能夠?qū)崿F(xiàn)大量用 戶數(shù)據(jù)的價(jià)值發(fā)現(xiàn),利用挖掘的有效算法,能夠在日志數(shù)據(jù)快速變化的狀態(tài)下分析用戶的瀏覽 狀況,并依據(jù)模式分析結(jié)果改進(jìn)網(wǎng)頁(yè)內(nèi)容,優(yōu)化用戶服務(wù),從而提高用戶的興趣點(diǎn),提升訪問(wèn) 量,解決數(shù)據(jù)大量、快速、多樣性變化的特點(diǎn),以此獲取有效價(jià)值數(shù)據(jù)對(duì)交互網(wǎng)絡(luò)的影響。 3 在信息系統(tǒng)中的構(gòu)建 3.1 網(wǎng)站設(shè)計(jì) 網(wǎng)站設(shè)計(jì)的主要內(nèi)容包括以下幾點(diǎn):①用戶訪問(wèn)網(wǎng)站方式基于 http 協(xié)議;②動(dòng)態(tài)交互網(wǎng)絡(luò) 的服務(wù)多樣性;③依據(jù)用戶行為信息,挖掘有效價(jià)值鏈,產(chǎn)生具有特色的網(wǎng)絡(luò)交互行為,而數(shù) 據(jù)頁(yè)面的引導(dǎo)表現(xiàn)出了便捷和快速的特點(diǎn);④利用日志挖掘技術(shù)查詢用戶有價(jià)值信息,依據(jù)數(shù) 據(jù)價(jià)值判斷、推算出潛在的數(shù)據(jù)連接和頁(yè)面訪問(wèn)指向。 3.2
WEB日志挖掘技術(shù)的研究及應(yīng)用
傳統(tǒng)數(shù)據(jù)挖掘技術(shù)只是對(duì)數(shù)據(jù)結(jié)構(gòu)中結(jié) 構(gòu)化的數(shù)據(jù)進(jìn)行...Web 日志挖掘體系, 才能分析并得出自己需要的信息。...人工神經(jīng)網(wǎng)絡(luò)算法后又一個(gè)得到大家認(rèn)可的研究性課題...
基于Web數(shù)據(jù)挖掘技術(shù)的遠(yuǎn)程教育應(yīng)用研究
基于Web數(shù)據(jù)挖掘技術(shù)的遠(yuǎn)程教育應(yīng)用研究_互聯(lián)網(wǎng)_IT/...我們只需要分析和挖掘系統(tǒng)日志,就可 以很好的對(duì)學(xué)習(xí)...Web 數(shù)據(jù)挖掘是數(shù)據(jù)挖掘技術(shù)與計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的融合,...
基于網(wǎng)絡(luò)輿情日志挖掘的政府決策信息行為研究
基于網(wǎng)絡(luò)輿情日志挖掘的政府決策信息行為研究_軍事/政治...本課題首次提出政府應(yīng)從分析公眾利用網(wǎng)絡(luò)問(wèn)政、參與...日志數(shù)據(jù)的 處理、代表用戶信息行為特征值的提取的...
FL15111702+WEB日志挖掘技術(shù)的研究及應(yīng)用
這就讓挖掘的前提需要將傳 統(tǒng)數(shù)據(jù)挖掘技術(shù)與 Web ...Web 日志挖掘體系, 才能分析并得出自己需要的信息。...人工神經(jīng)網(wǎng)絡(luò)算法后又一個(gè)得到大家認(rèn)可的研究性課題...
基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)頁(yè)個(gè)性化推薦系統(tǒng)分析
基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)頁(yè)個(gè)性化推薦系統(tǒng)分析_信息與通信...關(guān)鍵詞:網(wǎng)絡(luò)摘要:介紹了―網(wǎng)絡(luò)迷航現(xiàn)象及 WEB 數(shù)據(jù)...應(yīng)用數(shù)據(jù)挖掘技術(shù)就是分析網(wǎng)站描述文件和日志文件,...
關(guān)于 網(wǎng)絡(luò)博客關(guān)鍵信息挖掘技術(shù)的研究與實(shí)現(xiàn)
關(guān)于 網(wǎng)絡(luò)博客關(guān)鍵信息挖掘技術(shù)的研究與實(shí)現(xiàn)_調(diào)查/...API 進(jìn)行了設(shè)計(jì)與實(shí)現(xiàn),并對(duì)獲取的數(shù)據(jù)進(jìn)行了分析。...博客的日志結(jié)構(gòu)如圖 1 所示: 圖 1 博客的結(jié)構(gòu) ...
如何通過(guò)用數(shù)據(jù)挖掘技術(shù)來(lái)分析Web網(wǎng)站日志?
之一 如何通過(guò)用數(shù)據(jù)挖掘技術(shù)來(lái)分析 Web 網(wǎng)站日志?...這些信息對(duì)站點(diǎn)建設(shè) 潛在有用的可理解的未知信息和...尋找彼此相似對(duì)象組,這些數(shù)據(jù) 基于距離函數(shù)求出對(duì)象...
基于數(shù)據(jù)挖掘技術(shù)的科技情報(bào)系統(tǒng)研究
基于數(shù)據(jù)挖掘技術(shù)的科技情報(bào)系統(tǒng)研究_信息與通信_(tái)工程...其原因主要是分析處理的數(shù)據(jù) 可能來(lái)自多種不同的...2.2 科技情報(bào)的收集 近些年,隨著網(wǎng)絡(luò)環(huán)境的普及,我...
web數(shù)據(jù)挖掘技術(shù)分析與研究
web數(shù)據(jù)挖掘技術(shù)分析與研究_互聯(lián)網(wǎng)_IT/計(jì)算機(jī)_專業(yè)資料...它所涉及的學(xué)科知識(shí)包括有網(wǎng)絡(luò)技術(shù)、 信息統(tǒng)計(jì)學(xué)、...新聞組、BBS、電子郵件、網(wǎng)站日志等都屬于文本資 源...
本文關(guān)鍵詞:基于網(wǎng)絡(luò)日志挖掘技術(shù)數(shù)據(jù)信息分析的研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):174216
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/174216.html