決策森林研究綜述
本文關(guān)鍵詞: 數(shù)據(jù)挖掘 抽樣 決策森林 分類 分布式計(jì)算 決策樹 出處:《電子技術(shù)應(yīng)用》2016年12期 論文類型:期刊論文
【摘要】:隨著經(jīng)濟(jì)與社會(huì)的發(fā)展,數(shù)據(jù)挖掘技術(shù)廣泛應(yīng)用到各個(gè)領(lǐng)域,其中分類算法中的決策森林(Decision Forest)成為一個(gè)研究熱點(diǎn)。決策森林算法是一種包含多個(gè)決策樹分類器的統(tǒng)計(jì)學(xué)習(xí)理論,能較好地處理噪聲且避免發(fā)生過(guò)擬合。針對(duì)幾種典型的決策森林算法,闡述了其原理和算法的特點(diǎn),并從決策森林的構(gòu)建過(guò)程出發(fā),系統(tǒng)地分析和總結(jié)了國(guó)內(nèi)外現(xiàn)有的決策森林算法。在此基礎(chǔ)上,詳細(xì)說(shuō)明了在面對(duì)大數(shù)據(jù)時(shí)應(yīng)用決策森林進(jìn)行分布式計(jì)算的處理過(guò)程。通過(guò)比較,總結(jié)出了各種決策森林算法的適用范圍。
[Abstract]:With the development of economy and society, data mining technology has been widely used in various fields, among which decision decision forest algorithm (DFS) has become a research hotspot. Decision Forest algorithm (DFF) is a kind of statistical learning theory which includes multiple decision tree classifiers. It can deal with noise well and avoid over-fitting. In view of several typical decision forest algorithms, the principle and characteristics of the algorithm are expounded, and the construction process of decision-making forest is discussed. This paper systematically analyzes and summarizes the existing decision making forest algorithms at home and abroad. On this basis, the process of applying decision forest to distributed computing in the face of big data is explained in detail. The application range of various decision-making forest algorithms is summarized.
【作者單位】: 沈陽(yáng)理工大學(xué)信息科學(xué)與工程學(xué)院;沈陽(yáng)理工大學(xué)自動(dòng)化與電氣工程學(xué)院;
【分類號(hào)】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 香麗蕓;淺談數(shù)據(jù)挖掘及其應(yīng)用[J];昌吉師專學(xué)報(bào);2001年02期
2 鄭雪燕,張杰明,岳洋;數(shù)據(jù)挖掘語(yǔ)言[J];計(jì)算機(jī)時(shí)代;2001年11期
3 劉明晶;數(shù)據(jù)挖掘[J];華南金融電腦;2001年04期
4 張偉;劉勇國(guó);彭軍;廖曉峰;吳中福;;數(shù)據(jù)挖掘發(fā)展研究[J];計(jì)算機(jī)科學(xué);2001年07期
5 鐘曉;馬少平;張鈸;俞瑞釗;;數(shù)據(jù)挖掘綜述[J];模式識(shí)別與人工智能;2001年01期
6 朱建平,張潤(rùn)楚;數(shù)據(jù)挖掘的發(fā)展及其特點(diǎn)[J];統(tǒng)計(jì)與決策;2002年07期
7 傅嵐;在數(shù)據(jù)海洋中打撈信息數(shù)據(jù)挖掘[J];科技廣場(chǎng);2002年11期
8 李峻;數(shù)據(jù)挖掘,企業(yè)洞察先機(jī)的“慧眼”[J];中國(guó)計(jì)算機(jī)用戶;2002年48期
9 羅可,蔡碧野,卜勝賢,謝中科;數(shù)據(jù)挖掘及其發(fā)展研究[J];計(jì)算機(jī)工程與應(yīng)用;2002年14期
10 ;2002數(shù)據(jù)挖掘研討班[J];計(jì)算機(jī)工程;2002年06期
相關(guān)會(huì)議論文 前10條
1 史東輝;蔡慶生;張春陽(yáng);;一種新的數(shù)據(jù)挖掘多策略方法研究[A];第十七屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2000年
2 張弦;;數(shù)據(jù)挖掘在農(nóng)業(yè)中的應(yīng)用[A];紀(jì)念中國(guó)農(nóng)業(yè)工程學(xué)會(huì)成立30周年暨中國(guó)農(nóng)業(yè)工程學(xué)會(huì)2009年學(xué)術(shù)年會(huì)(CSAE 2009)論文集[C];2009年
3 魏順平;;教育數(shù)據(jù)挖掘:現(xiàn)狀與趨勢(shì)[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計(jì)算機(jī)模擬與信息技術(shù)學(xué)術(shù)會(huì)議論文集[C];2011年
4 關(guān)清平;沉培輝;;概率網(wǎng)絡(luò)在數(shù)據(jù)挖掘上的應(yīng)用[A];科技、工程與經(jīng)濟(jì)社會(huì)協(xié)調(diào)發(fā)展——中國(guó)科協(xié)第五屆青年學(xué)術(shù)年會(huì)論文集[C];2004年
5 丁瑾;;基于Web數(shù)據(jù)挖掘的綜述[A];山西省科學(xué)技術(shù)情報(bào)學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C];2004年
6 聶茹;田森平;;Web數(shù)據(jù)挖掘及其在電子商務(wù)中的應(yīng)用[A];中南六。▍^(qū))自動(dòng)化學(xué)會(huì)第24屆學(xué)術(shù)年會(huì)會(huì)議論文集[C];2006年
7 李菊;王軍;;數(shù)據(jù)挖掘在客戶關(guān)系管理的應(yīng)用[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
8 肖陽(yáng);李啟賢;;數(shù)據(jù)挖掘在中國(guó)鋼鐵行業(yè)中的應(yīng)用[A];中國(guó)計(jì)量協(xié)會(huì)冶金分會(huì)2012年會(huì)暨能源計(jì)量與節(jié)能降耗經(jīng)驗(yàn)交流會(huì)論文集[C];2012年
9 楊磊;王貴成;汪勇;張占勝;;SQL Server 2005在數(shù)據(jù)挖掘中的應(yīng)用[A];2009年中國(guó)智能自動(dòng)化會(huì)議論文集(第二分冊(cè))[C];2009年
10 謝中;邱玉輝;;面向商務(wù)網(wǎng)站有效性的數(shù)據(jù)挖掘方法[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2001年
相關(guān)重要報(bào)紙文章 前10條
1 □中國(guó)電信股份有限公司北京研究院 張舒博 □北京郵電大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 牛琨;走出數(shù)據(jù)挖掘的誤區(qū)[N];人民郵電;2006年
2 《網(wǎng)絡(luò)世界》記者 王瑩;數(shù)據(jù)挖掘保險(xiǎn)業(yè)的新藍(lán)海[N];網(wǎng)絡(luò)世界;2012年
3 劉俊麗;基于地理化的網(wǎng)絡(luò)數(shù)據(jù)挖掘與分析提升投資有效性[N];人民郵電;2014年
4 ;數(shù)據(jù)挖掘:如何挖出效益?[N];中國(guó)計(jì)算機(jī)報(bào);2004年
5 任中華;財(cái)務(wù)數(shù)據(jù)挖掘六步走[N];中國(guó)計(jì)算機(jī)報(bào);2007年
6 電腦商報(bào)記者 謝濤;數(shù)據(jù)挖掘:未來(lái)政府信息化的重要環(huán)節(jié)[N];電腦商報(bào);2007年
7 吳勇毅;軟件選型:數(shù)據(jù)挖掘是重點(diǎn)[N];中國(guó)冶金報(bào);2009年
8 本報(bào)特約撰稿 許麗萍;數(shù)據(jù)挖掘:軟件應(yīng)用的新境界[N];計(jì)算機(jī)世界;2009年
9 謝立宏博士;企業(yè)的“黃金眼”數(shù)據(jù)挖掘決策支持[N];中國(guó)計(jì)算機(jī)報(bào);2002年
10 吳勇毅;危機(jī)下,數(shù)據(jù)挖掘與提供信息決策是關(guān)健[N];中國(guó)冶金報(bào);2009年
相關(guān)博士學(xué)位論文 前10條
1 于自強(qiáng);海量流數(shù)據(jù)挖掘相關(guān)問(wèn)題研究[D];山東大學(xué);2015年
2 張馨;全基因組SNP芯片應(yīng)用于CNV和L0H分析的軟件比對(duì)與數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年
3 李秋虹;基于MapReduce的大規(guī)模數(shù)據(jù)挖掘技術(shù)研究[D];復(fù)旦大學(xué);2013年
4 李榮;生物信息數(shù)據(jù)挖掘若干關(guān)鍵問(wèn)題研究與應(yīng)用[D];復(fù)旦大學(xué);2004年
5 李玉華;面向服務(wù)的數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D];華中科技大學(xué);2006年
6 吳少智;時(shí)間序列數(shù)據(jù)挖掘在生物醫(yī)學(xué)中的應(yīng)用研究[D];電子科技大學(xué);2010年
7 王珊珊;知識(shí)指導(dǎo)下的數(shù)據(jù)挖掘在新聞和金融工具之間因果關(guān)系上的應(yīng)用[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年
8 楊虎;序列數(shù)據(jù)挖掘的模型和算法研究[D];重慶大學(xué);2003年
9 陳平;數(shù)據(jù)挖掘網(wǎng)格若干關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2007年
10 鞏建光;面向電信領(lǐng)域的數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 林仁紅;基于數(shù)據(jù)挖掘的機(jī)遇識(shí)別與評(píng)價(jià)研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2007年
2 張彥俊;游戲運(yùn)營(yíng)中的數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年
3 王杰鋒;物聯(lián)網(wǎng)能耗數(shù)據(jù)智能分析及其應(yīng)用平臺(tái)設(shè)計(jì)[D];江南大學(xué);2015年
4 戴陽(yáng)陽(yáng);基于數(shù)據(jù)挖掘的金融時(shí)間序列預(yù)測(cè)研究與應(yīng)用[D];江南大學(xué);2015年
5 石思優(yōu);基于主題模型的醫(yī)療數(shù)據(jù)挖掘研究[D];廣東技術(shù)師范學(xué)院;2015年
6 陳丹;移動(dòng)互聯(lián)網(wǎng)信令挖掘?qū)崿F(xiàn)智慧營(yíng)銷的設(shè)計(jì)與實(shí)現(xiàn)應(yīng)用研究[D];華南理工大學(xué);2015年
7 陳思;基于數(shù)據(jù)挖掘的大學(xué)生客戶識(shí)別模型的研究[D];昆明理工大學(xué);2015年
8 位長(zhǎng)帥;基于客戶數(shù)據(jù)挖掘的電信客戶關(guān)系管理研究[D];西南交通大學(xué);2015年
9 顧欣;基于數(shù)據(jù)挖掘藥房管理系統(tǒng)設(shè)計(jì)與開發(fā)[D];中國(guó)石油大學(xué)(華東);2014年
10 李慧;基于數(shù)據(jù)挖掘的人壽保險(xiǎn)客戶細(xì)分研究[D];安徽大學(xué);2015年
,本文編號(hào):1509884
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1509884.html