基于XML進(jìn)行Web數(shù)據(jù)挖掘的探討
本文關(guān)鍵詞:基于XML進(jìn)行Web數(shù)據(jù)挖掘的探討
更多相關(guān)文章: Web數(shù)據(jù)挖掘 XML語言 應(yīng)用分析
【摘要】:隨著我國的科學(xué)技術(shù)水平的發(fā)展,Internet技術(shù)也得到了迅速的普及和發(fā)展。面對著互聯(lián)網(wǎng)上海量的信息量,要想準(zhǔn)確的找到我們所需要的信息是很困難的,而網(wǎng)絡(luò)搜索引擎在精確度上又不是很高,用戶對其也很難對其真正的滿意。而在這種背景下,Web數(shù)據(jù)挖掘技術(shù)就應(yīng)運而生了。現(xiàn)階段,我國的大多數(shù)網(wǎng)站都是采用HTML建設(shè)的,其結(jié)構(gòu)性較差,給Web數(shù)據(jù)挖掘工作也帶來了很多的不方便。而XML語言的出現(xiàn)就很好的改變了這一問題,其層次性和結(jié)構(gòu)性較好,當(dāng)組織網(wǎng)絡(luò)頁面采用XML語言后,再進(jìn)行Web數(shù)據(jù)挖掘工作時也是非常方便的。本文便對Web數(shù)據(jù)挖掘技術(shù)的概念、Web數(shù)據(jù)挖掘技術(shù)面對的主要問題以及XML語言在Web數(shù)據(jù)挖掘中的應(yīng)用分析三個方面的內(nèi)容進(jìn)行了詳細(xì)的分析和探討,從而詳細(xì)的論述了Web數(shù)據(jù)挖掘技術(shù)中XML語言的應(yīng)用情況。
【作者單位】: 安徽財經(jīng)大學(xué);
【關(guān)鍵詞】: Web數(shù)據(jù)挖掘 XML語言 應(yīng)用分析
【分類號】:TP311.13
【正文快照】: 1 Web數(shù)據(jù)挖掘技術(shù)面對的主要問題在進(jìn)行數(shù)據(jù)準(zhǔn)備的過程中,與面向單個數(shù)據(jù)倉庫的數(shù)據(jù)挖掘技術(shù)相比,Web數(shù)據(jù)挖掘技術(shù)的復(fù)雜程度明顯要更高,其具體體現(xiàn)在以下兩個方面:1.1半結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)。與傳統(tǒng)類型數(shù)據(jù)庫中的數(shù)據(jù)相比,Web上的數(shù)據(jù)是有著明顯的差異的,首先,傳統(tǒng)數(shù)據(jù)庫都具
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 丁紀(jì)云,蔡春娥;利用構(gòu)造數(shù)據(jù)集評定數(shù)據(jù)挖掘過程的方法[J];湖南廣播電視大學(xué)學(xué)報;2001年02期
2 任承業(yè),羅偉其;校園信息系統(tǒng)中CRM與數(shù)據(jù)挖掘的結(jié)合和應(yīng)用[J];計算機工程與應(yīng)用;2003年13期
3 王艷;數(shù)據(jù)挖掘在數(shù)字圖書館中的應(yīng)用[J];情報科學(xué);2003年02期
4 邵紅全,趙茜;用SQL Server2000實現(xiàn)數(shù)據(jù)挖掘的技術(shù)與策略[J];電腦開發(fā)與應(yīng)用;2003年04期
5 蔣良孝,蔡之華;基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘研究[J];計算技術(shù)與自動化;2003年03期
6 黃解軍,萬幼川,潘和平;銀行客戶關(guān)系管理與數(shù)據(jù)挖掘的應(yīng)用[J];計算機工程與設(shè)計;2003年07期
7 崔強,朱衛(wèi)東;基于數(shù)據(jù)挖掘的鐵路機務(wù)段成本控制系統(tǒng)[J];鐵路計算機應(yīng)用;2003年01期
8 楊思春;基于數(shù)據(jù)倉庫的數(shù)據(jù)挖掘技術(shù)分析研究[J];微機發(fā)展;2003年09期
9 湯效琴,戴汝源;數(shù)據(jù)挖掘中聚類分析的技術(shù)方法[J];微計算機信息;2003年01期
10 李月芳,孫俊;數(shù)據(jù)挖掘及其在電網(wǎng)故障診斷中的應(yīng)用[J];農(nóng)機化研究;2003年04期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 郭學(xué)軍;陳曉云;;粗集方法在數(shù)據(jù)挖掘中的應(yīng)用[A];第十六屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1999年
2 徐慧;;基于Web的文獻(xiàn)數(shù)據(jù)挖掘[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2000年
3 孫迎;;醫(yī)院信息的數(shù)據(jù)挖掘與方法研究[A];中華醫(yī)學(xué)會第十次全國醫(yī)學(xué)信息學(xué)術(shù)會議論文匯編[C];2004年
4 薛曉東;李海玲;;數(shù)據(jù)挖掘的客戶關(guān)系管理應(yīng)用[A];科技、工程與經(jīng)濟(jì)社會協(xié)調(diào)發(fā)展——河南省第四屆青年學(xué)術(shù)年會論文集(下冊)[C];2004年
5 薛魯華;張楠;;聚類分析在Web數(shù)據(jù)挖掘中的應(yīng)用[A];北京市第十三次統(tǒng)計科學(xué)討論會論文選編[C];2006年
6 朱揚勇;黃超;;基于多維模型的交互式數(shù)據(jù)挖掘框架[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2003年
7 周紅梅;薛青;;數(shù)據(jù)挖掘技術(shù)及其在裝備作戰(zhàn)仿真系統(tǒng)中的應(yīng)用[A];第五屆全國仿真器學(xué)術(shù)會論文集[C];2004年
8 代廣珍;徐超;;基于Web的數(shù)據(jù)挖掘研究綜述[A];2005年“數(shù)字安徽”博士科技論壇論文集[C];2005年
9 曹波偉;薛青;鄭長偉;于屏崗;陳辰;;基于數(shù)據(jù)挖掘的裝備維修管理智能分析模型研究[A];'2010系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)會議論文集[C];2010年
10 于波;王宏鼎;唐世渭;童云海;;基于數(shù)據(jù)挖掘的數(shù)據(jù)質(zhì)量分析研究[A];全國第16屆計算機科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會議論文集[C];2004年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 □中國電信股份有限公司北京研究院 張舒博 □北京郵電大學(xué)計算機科學(xué)與技術(shù)學(xué)院 牛琨;走出數(shù)據(jù)挖掘的誤區(qū)[N];人民郵電;2006年
2 張立明;數(shù)據(jù)挖掘之道[N];網(wǎng)絡(luò)世界;2003年
3 吳勇毅;危機下,,數(shù)據(jù)挖掘與提供信息決策是關(guān)健[N];中國冶金報;2009年
4 謝立宏博士;企業(yè)的“黃金眼”數(shù)據(jù)挖掘決策支持[N];中國計算機報;2002年
5 創(chuàng)智集團(tuán)副總裁 胡樂群博士;數(shù)據(jù)挖掘在CRM中的應(yīng)用[N];中國計算機報;2002年
6 國能科諾賽仕企業(yè)數(shù)據(jù)挖掘?qū)嶒炇?趙紀(jì)元;挖掘數(shù)據(jù)中的“寶藏”[N];中國計算機報;2001年
7 易明;XML促進(jìn)Web數(shù)據(jù)挖掘[N];通信產(chǎn)業(yè)報;2007年
8 王瑋 蔡蓮紅;數(shù)據(jù)挖掘走入語音處理[N];計算機世界;2001年
9 趙新生;數(shù)據(jù)挖掘與水文現(xiàn)代化建設(shè)[N];黃河報;2005年
10 電腦商報記者 謝濤;數(shù)據(jù)挖掘:未來政府信息化的重要環(huán)節(jié)[N];電腦商報;2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉革平;基于數(shù)據(jù)挖掘的遠(yuǎn)程學(xué)習(xí)評價研究[D];西南師范大學(xué);2005年
2 王濤;挖掘序列模式和結(jié)構(gòu)化模式的精簡集[D];華中科技大學(xué);2006年
3 郭斯羽;動態(tài)數(shù)據(jù)中的數(shù)據(jù)挖掘研究[D];浙江大學(xué);2002年
4 佘春東;數(shù)據(jù)挖掘算法分析及其并行模式研究[D];電子科技大學(xué);2004年
5 宋杰;生物信息數(shù)據(jù)挖掘中的若干方法及其應(yīng)用研究[D];大連理工大學(xué);2005年
6 林曉勇;頻繁模式挖掘和動態(tài)維護(hù)的理論與方法研究[D];北京化工大學(xué);2008年
7 賴邦傳;數(shù)據(jù)驅(qū)動的綜合智能決策支持系統(tǒng)及其生成器的研究與開發(fā)[D];中南大學(xué);2005年
8 王曙燕;醫(yī)學(xué)圖像智能分類算法研究[D];西北大學(xué);2006年
9 金陽;基于概念格模型的序列模式挖掘算法研究[D];吉林大學(xué);2007年
10 翟坤;基于數(shù)據(jù)挖掘的成本管理方法研究[D];大連理工大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 李坤然;數(shù)據(jù)挖掘在股市趨勢預(yù)測的應(yīng)用研究[D];中南林業(yè)科技大學(xué);2008年
2 鄭宏;數(shù)據(jù)挖掘可視化技術(shù)的研究與實現(xiàn)[D];西安電子科技大學(xué);2010年
3 杜金剛;數(shù)據(jù)挖掘在電信客戶關(guān)系管理及數(shù)據(jù)業(yè)務(wù)營銷中的應(yīng)用[D];北京郵電大學(xué);2010年
4 徐路;基于決策樹的數(shù)據(jù)挖掘算法的研究及其在實際中的應(yīng)用[D];電子科技大學(xué);2009年
5 梁小鷗;數(shù)據(jù)挖掘在高職教學(xué)管理中的應(yīng)用[D];華南理工大學(xué);2011年
6 王浩;數(shù)據(jù)挖掘在上海市職業(yè)能力考試院招錄考試優(yōu)化管理項目中的運用研究[D];華東理工大學(xué);2012年
7 黎衛(wèi)英;數(shù)據(jù)挖掘在中職幼教課程改革中的應(yīng)用[D];福建師范大學(xué);2009年
8 張煜輝;數(shù)據(jù)挖掘和SPC在生產(chǎn)過程質(zhì)量控制中應(yīng)用研究[D];上海交通大學(xué);2009年
9 劉華敏;數(shù)據(jù)挖掘在高職院校學(xué)生成績分析中的應(yīng)用[D];安徽大學(xué);2011年
10 李森;基于數(shù)據(jù)挖掘的旅游電子商務(wù)系統(tǒng)研究與實現(xiàn)[D];電子科技大學(xué);2011年
本文編號:545444
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/545444.html