天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 科研管理論文 >

基于分類模型的知識發(fā)現過程研究

發(fā)布時間:2020-08-09 08:05
【摘要】: 數據庫知識發(fā)現(Knowledge Discovery in Databases, KDD)是從大量數據中發(fā)現潛在規(guī)律、提取有用知識的方法和技術。近年來,數據庫知識發(fā)現KDD受到了國內外的普遍關注,已經成為信息系統(tǒng)和計算機科學領域研究中最活躍的前沿領域。 本文以國家自然科學基金項目“管理決策中數據倉庫與數據挖掘新技術研究”為背景,在深入調研與分析國內外知識發(fā)現與數據挖掘相關理論與應用和技術文獻的基礎上,歸納總結了該領域的主要研究內容和關鍵技術,詳細評述了基于分類數據知識發(fā)現的相關理論與技術的研究現狀、存在問題與發(fā)展趨勢,利用UCI(Irvine大學機器學習數據庫)數據庫作為實驗數據,主要研究了知識發(fā)現過程中以下幾個問題:知識發(fā)現過程模型、知識發(fā)現的一種數據預處理方法——屬性選擇方法,數據挖掘算法與數據庫的接口——數據抽取器,數據挖掘方法——多變量決策樹和組合近鄰模型。 本文的主要研究工作和成果為: 1.針對目前的知識發(fā)現過程模型在實際應用中存在挖掘周期長,對大型數據庫的知識發(fā)現支持不夠的問題,提出了基于數據抽取器的知識發(fā)現模型。在模型中,將知識發(fā)現過程分成數據預處理、數據抽取、數據挖掘和結果分析四個階段。該模型利用標準的SQL語言構造數據抽取器,為不同的學習算法準備數據,可以加快知識發(fā)現過程,提高數據挖掘效率。 2.針對知識發(fā)現過程的預處理問題,研究了屬性選擇的理論和技術,提出了一種利用信息理論和概率論,結合了屬性選擇過濾法和打包法的屬性選擇算法,通過去除屬性集中的不相關屬性,降低數據維數,減少數據量,從而提高數據挖掘的精度,加快知識發(fā)現的過程。 3.針對知識發(fā)現過程的數據抽取問題,設計了數據庫管理系統(tǒng)和數據挖掘算法的接口——數據抽取器。該接口利用一組基于SQL語言的數據抽取器實現為數據挖掘算法抽取必要的統(tǒng)計數據,避免了直接對大型數據庫的數據進行調用,使得對大型數據庫進行快速數據挖掘成為可能。并提出了SQL_C4.5算法,利用數據抽取器實現C4.5決策樹的構建。 4.針對數據挖掘的多變量決策樹問題,研究了構造多變量決策樹的理論和方法。提出了一種利用線性判別法構造決策樹的擴展屬性,采用C4.5決策樹的分枝準則生長樹的多變量決策樹算法。該方法能有效的減少決策樹的復雜度,為多變量決策樹的研究 國防科學技術大學研究生院學位論文 提供了新的途徑和思路。 5.針對數據挖掘的組合模型問題,研究了組合模型的理論和技術,分析了組合理 論在近鄰法的應用現狀,提出了一種組合近鄰模型的算法,該算法通過使用隨機的屬性 子集組合近鄰模型,提高了分類精度。 最后,本文設計了一個醫(yī)療數據知識發(fā)現原型系統(tǒng)。利用本文提出的知識發(fā)現過程 模型和關鍵技術,完成了一個醫(yī)療診斷系統(tǒng)應用實例的知識發(fā)現過程,獲得了較好的效 果。 本文針對上述研究內容,進行了大量的實驗研究和論證,結果表明,本文的理論。 方法與技術正確有效,達到了加快知識發(fā)現過程,提高知識發(fā)現精度與效率的目的,實 現了利用分類技術優(yōu)化知識發(fā)現過程的目的,具有良好的實際應用前景。
【學位授予單位】:國防科學技術大學
【學位級別】:博士
【學位授予年份】:2002
【分類號】:G302
【圖文】:

相關性,屬性選擇,性選擇,屬性


性就是非相關屬性。完全無關屬性圖3.1互3.、撇繆粼拳}蘸薰黑{{撰鱷黝黝屬性的相關性2屬性選擇方法3.2.1屬性選擇的一般程序有許多種屬性選擇方法。屬性選擇方法通常要面對的問題是:(1)怎樣才能搜尋到“最好”的屬性?(2)用什么準則來確定最好的屬性子集己經被找到?(3)在什么情第46頁

【相似文獻】

相關期刊論文 前10條

1 文化;;知識管理:騰訊持續(xù)創(chuàng)新的秘密[J];企業(yè)文化;2010年05期

2 肖自茹;;會計計量屬性的選擇[J];武漢冶金管理干部學院學報;2011年02期

3 李惠蓉;;試論現行準則下的金融資產分類與IFRS9改進后的新金融資產分類[J];中國證券期貨;2011年08期

4 吳俊英;;智力資源會計計量對象與計量屬性的選擇[J];生產力研究;2011年06期

5 孫艷萍;;淺談森林生態(tài)效益外部性公允價值計量模式[J];中國鄉(xiāng)鎮(zhèn)企業(yè)會計;2011年06期

6 王敏;;關于會計計量屬性的應用選擇分析[J];時代金融;2011年21期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

相關會議論文 前10條

1 楊光飛;黨延忠;;不完美數據中的知識發(fā)現研究綜述[A];第六屆(2011)中國管理學年會——商務智能分會場論文集[C];2011年

2 董伯儒;林少培;王永文;;工程建設MIS中的知識發(fā)現和深化[A];中國土木工程學會計算機應用分會第七屆年會論文集[C];1999年

3 張世海;劉曉燕;涂慶;歐進萍;王光遠;;知識發(fā)現及其在高層結構智能選型中應用[A];計算機技術在工程建設中的應用——第十二屆全國工程建設計算機應用學術會議論文集[C];2004年

4 萬家華;劉冰;江早;;知識發(fā)現中的可視化技術[A];第十七屆全國數據庫學術會議論文集(研究報告篇)[C];2000年

5 蒙應杰;張文;吳超;;基于粗集的數據庫水印屬性選擇優(yōu)化問題[A];第二十三屆中國數據庫學術會議論文集(技術報告篇)[C];2006年

6 趙榮珍;楊娟;黃顯華;;粗糙集理論的故障知識發(fā)現及其工程應用模式研究[A];第十二屆全國設備故障診斷學術會議論文集[C];2010年

7 董伯儒;林少培;王永文;;工程建設MIS中的知識發(fā)現和深化[A];中國土木工程學會計算機應用分會第七屆年會土木工程計算機應用文集[C];1999年

8 段培俊;周東岱;;數據挖掘研究綜述[A];2003年中國智能自動化會議論文集(下冊)[C];2003年

9 閆光輝;李戰(zhàn)懷;吳海軍;;基于Z-Ordering技術的分形屬性選擇方法[A];第二十三屆中國數據庫學術會議論文集(研究報告篇)[C];2006年

10 張文修;徐萍;米據生;吳偉志;;知識系統(tǒng)與知識發(fā)現[A];中國系統(tǒng)工程學會模糊數學與模糊系統(tǒng)委員會第十一屆年會論文選集[C];2002年

相關重要報紙文章 前10條

1 劉向晨;讓文件捉迷藏[N];中國電腦教育報;2003年

2 張德政;信息挖掘商業(yè)智能之“芯”[N];中國計算機報;2002年

3 蒼蒼;教你兩手[N];中國電腦教育報;2004年

4 中國科學院計算技術研究所 劉毅勇 何雄 李金山 廖浩均 孟亮 鄧柱中;空間數據挖掘:變數據為知識[N];計算機世界;2005年

5 柳濤;秋季更需護理肌膚[N];中華工商時報;2002年

6 零和千;練習使用黑白網點[N];電腦報;2005年

7 胡虎;突出信息化貢獻水平 處理好三個關系[N];人民郵電;2007年

8 陳志楠;挖掘“不為人知的藝術”[N];科技日報;2009年

9 尤紅梅;蔡雪晴:優(yōu)勢在于執(zhí)行[N];中國企業(yè)報;2004年

10 湯天浩;人工智能技術:未來船舶系統(tǒng)的靈魂[N];中國船舶報;2005年

相關博士學位論文 前10條

1 陳元;基于分類模型的知識發(fā)現過程研究[D];國防科學技術大學;2002年

2 謝宗霞;太陽寧靜區(qū)磁場流場特性知識發(fā)現的方法研究[D];哈爾濱工業(yè)大學;2010年

3 張云中;基于形式概念分析的Folksonomy知識發(fā)現研究[D];吉林大學;2012年

4 楊立;基于領域知識的知識發(fā)現研究[D];中國科學院研究生院(軟件研究所);2005年

5 李初民;基于網絡管理數據庫中性能數據的知識發(fā)現(KDD)研究[D];重慶大學;2001年

6 李剛;知識發(fā)現的圖模型方法[D];中國科學院軟件研究所;2001年

7 謝志鵬;基于概念格模型的知識發(fā)現研究[D];合肥工業(yè)大學;2001年

8 吳濤;構造性知識發(fā)現方法研究[D];安徽大學;2003年

9 劉剛;數據挖掘技術與分類算法研究[D];中國人民解放軍信息工程大學;2004年

10 湯永川;關于不確定性推理理論與知識發(fā)現的研究[D];西南交通大學;2002年

相關碩士學位論文 前10條

1 張冬艷;基于粗糙集合理論的決策樹構造算法研究[D];合肥工業(yè)大學;2006年

2 薛靜;專家信息管理系統(tǒng)在CRM中的研究與應用——基于java技術的構架[D];西北工業(yè)大學;2001年

3 陳紅葉;Web信息提取及知識發(fā)現方法研究[D];合肥工業(yè)大學;2002年

4 遲慶云;基于決策樹的分類算法研究和應用[D];山東師范大學;2005年

5 王益玲;基于DCS實時信息的智能故障診斷系統(tǒng)的研究與設計[D];南京工業(yè)大學;2003年

6 李長源;關聯規(guī)則挖掘算法研究[D];哈爾濱工程大學;2005年

7 郭國印;數據挖掘技術的研究及其在PLM中的應用[D];西北工業(yè)大學;2005年

8 谷宏群;數據挖掘中可視化方法研究[D];武漢大學;2005年

9 梁利莉;數據挖掘技術在CRM中的應用研究[D];首都經濟貿易大學;2005年

10 劉娟;中藥藥對的量化分析與知識發(fā)現[D];成都中醫(yī)藥大學;2005年



本文編號:2786842

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/keyanlw/2786842.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶45c84***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com