林業(yè)樣地的數據清洗方法研究及其應用
發(fā)布時間:2022-12-04 16:00
針對信息時代中遇到的臟數據現象,研究類比分析了林業(yè)信息化過程中所存在的數據質量問題以及產生的原因,從統(tǒng)計學和數據挖掘與模式識別的層面介紹了面向異常記錄檢測和重復記錄檢測的數據清洗算法,探索了基于分類算法和聚類算法的數據清洗方法在林業(yè)樣地數據中的應用,驗證了數據清洗算法在林業(yè)行業(yè)的可行性,提出了存在相應的應用瓶頸。
【文章頁數】:5 頁
【文章目錄】:
1 數據質量與林業(yè)臟數據
2 數據清洗的定義與算法
2.1 數據清洗的定義
2.2 數據清洗的算法
(1)面向異常記錄檢測的數據清洗算法。
(2)面向重復記錄檢測的數據清洗算法。
3 林業(yè)樣地數據中數據清洗的應用
3.1 采用分類算法的林業(yè)樣地數據清洗研究
3.2 采用聚類算法的林業(yè)樣地數據清洗研究
4 結論
【參考文獻】:
期刊論文
[1]結構化數據清洗技術綜述[J]. 郝爽,李國良,馮建華,王寧. 清華大學學報(自然科學版). 2018(12)
[2]基于關聯數據的一致性和時效性清洗方法[J]. 杜岳峰,申德榮,聶鐵錚,寇月,于戈. 計算機學報. 2017(01)
[3]基于任務合并的并行大數據清洗過程優(yōu)化[J]. 楊東華,李寧寧,王宏志,李建中,高宏. 計算機學報. 2016(01)
[4]構建數據倉庫過程中的數據清洗研究[J]. 劉喜文,鄭昌興,王文龍,湯剛強. 圖書與情報. 2013(05)
[5]數據清洗研究綜述[J]. 王曰芬,章成志,張蓓蓓,吳婷婷. 現代圖書情報技術. 2007(12)
碩士論文
[1]基于數據挖掘的數據清洗及其評估模型的研究[D]. 鄒杰.北京郵電大學 2017
[2]數據質量管理與數據清洗技術的研究與應用[D]. 陳孟婕.北京郵電大學 2013
本文編號:3708565
【文章頁數】:5 頁
【文章目錄】:
1 數據質量與林業(yè)臟數據
2 數據清洗的定義與算法
2.1 數據清洗的定義
2.2 數據清洗的算法
(1)面向異常記錄檢測的數據清洗算法。
(2)面向重復記錄檢測的數據清洗算法。
3 林業(yè)樣地數據中數據清洗的應用
3.1 采用分類算法的林業(yè)樣地數據清洗研究
3.2 采用聚類算法的林業(yè)樣地數據清洗研究
4 結論
【參考文獻】:
期刊論文
[1]結構化數據清洗技術綜述[J]. 郝爽,李國良,馮建華,王寧. 清華大學學報(自然科學版). 2018(12)
[2]基于關聯數據的一致性和時效性清洗方法[J]. 杜岳峰,申德榮,聶鐵錚,寇月,于戈. 計算機學報. 2017(01)
[3]基于任務合并的并行大數據清洗過程優(yōu)化[J]. 楊東華,李寧寧,王宏志,李建中,高宏. 計算機學報. 2016(01)
[4]構建數據倉庫過程中的數據清洗研究[J]. 劉喜文,鄭昌興,王文龍,湯剛強. 圖書與情報. 2013(05)
[5]數據清洗研究綜述[J]. 王曰芬,章成志,張蓓蓓,吳婷婷. 現代圖書情報技術. 2007(12)
碩士論文
[1]基于數據挖掘的數據清洗及其評估模型的研究[D]. 鄒杰.北京郵電大學 2017
[2]數據質量管理與數據清洗技術的研究與應用[D]. 陳孟婕.北京郵電大學 2013
本文編號:3708565
本文鏈接:http://sikaile.net/wenshubaike/mfmb/3708565.html