基于網絡日志挖掘技術數據信息分析的研究 南京廖華
本文關鍵詞:基于網絡日志挖掘技術數據信息分析的研究,由筆耕文化傳播整理發(fā)布。
龍源期刊網
基于網絡日志挖掘技術數據信息分析的研究 作者:付生
來源:《科技與創(chuàng)新》2015年第06期
摘 要:對網絡日志挖掘技術數據信息分析的研究,是動態(tài)交互網絡使用數據挖掘的一種技術實現(xiàn)。通過挖掘動態(tài)交互網絡日志,可以查找用戶訪問動態(tài)交互網絡的瀏覽方式和習慣性行為,并依據數據挖掘分析和研究動態(tài)交互網絡日志記錄中的規(guī)律,判斷數據價值鏈與組織結構的適應性問題,,從而提高信息查找的快速指向性和信息檢索的高效性,并利用統(tǒng)計和關聯(lián)的分析找出特定用戶與特定地域、特定時間、特定頁面等要素之間的內在聯(lián)系。
關鍵詞:日志挖掘;數據分析;信息檢索;網絡日志
中圖分類號:TP311.13 文獻標識碼:A DOI:10.15913/j.cnki.kjycx.2015.06.068 1 日志數據挖掘
動態(tài)交互網絡獲取信息的過程存在站點訪問的跳躍性和無序性,數據信息指向是呈布朗運動分布的。超文本鏈接的跳轉過程具有一定的普遍性,并且還有數據存量大、數據更替快等大數據4V特點。挖掘規(guī)律即是動態(tài)交互網絡用戶訪問信息發(fā)現(xiàn)的重要研究內容。動態(tài)交互網絡日志挖掘是對大量用戶行為和數據價值有效性的判斷,該判斷是經過數據的預處理、數據模式識別和模式分析3個過程實現(xiàn)的。
2 動態(tài)交互網絡日志挖掘的過程
對于動態(tài)交互網絡日志挖掘,首先要研究和分析網絡日志記錄信息存在的變化和特點,進而實現(xiàn)數據的預處理過程。另外,要識別用戶信息,提高對用戶價值信息的服務質量,改進動態(tài)交互網絡服務系統(tǒng)的數據信息判斷和組織結構。
2.1 數據預處理
在動態(tài)交互網絡日志文件記錄中,存儲的是用戶訪問站點信息的原始記錄,而原始記錄的數據具有多樣性和大量性,所以,直接從數據中挖掘其有效價值存在不確定性和一定的困難。在借助一定的算法和工具分析數據時,必須要對數據進行預處理。預處理過程是指對數據質量、數據的多樣性和量級進行處理,這會直接影響數據挖掘的結果,還會影響數據價值存在的判斷。對于數據訪問量小、數據多樣性單一的網絡日志信息,數據處理的準確性具有非常重要的意義。日志預處理主要是通過數據凈化、用戶識別、會話識別和數據合并4個過程實現(xiàn)的。
2.2 數據模式發(fā)現(xiàn)
本文關鍵詞:基于網絡日志挖掘技術數據信息分析的研究,由筆耕文化傳播整理發(fā)布。
本文編號:205994
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/205994.html