天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

改進(jìn)的C4.5算法在期貨數(shù)據(jù)挖掘中的研究

發(fā)布時(shí)間:2019-11-01 02:34
【摘要】:在利用現(xiàn)有C4.5算法構(gòu)建期貨預(yù)測(cè)決策樹時(shí),往往出現(xiàn)預(yù)測(cè)準(zhǔn)確率低的弊端,導(dǎo)致預(yù)測(cè)模型很難使用,為此提出了一種面向期貨數(shù)據(jù)的C4.5-K算法。該算法的主要思想是通過在C4.5算法中引進(jìn)新的參數(shù)K,調(diào)整屬性度量標(biāo)準(zhǔn)信息增益率的取值范圍,進(jìn)而構(gòu)建決策樹預(yù)測(cè)模型進(jìn)行預(yù)測(cè)。通過實(shí)驗(yàn)表明,該改進(jìn)算法能有效提高期貨預(yù)測(cè)能力。
【圖文】:

曲線,加權(quán)信息,曲線,決策樹


2017,53(11)K≤0,這個(gè)取值區(qū)間正好與L1的取值區(qū)間[0,+∞)隔開且相鄰。圖1中分別顯示了不同K值下L2的曲線圖,從下到上,K的取值分別為-1、-0.7、-0.5、-0.3、-0.1。從圖中可以看出K取值越接近于-1,曲線L2越陡峭,,離L3越近;反之越趨近于0,曲線愈加平滑,離x軸愈近。從圖1中也容易觀察到曲線L2與L1相比,L2要平滑得多,因此可以通過訓(xùn)練K取不同值,進(jìn)而用帶加權(quán)參數(shù)K的x′來(lái)弱化某些強(qiáng)關(guān)聯(lián)屬性的信息熵,以達(dá)到提高弱關(guān)聯(lián)屬性在決策樹全局范圍的分類能力。以下就C4.5-K算法通過訓(xùn)練K進(jìn)而構(gòu)建決策樹的流程進(jìn)行闡述。2.4改進(jìn)算法的決策樹構(gòu)建過程在構(gòu)建決策樹[11-13]的過程中,C4.5-K算法首先需要取一初始K值,并判斷所處理的屬性是離散屬性還是連續(xù)屬性,若為離散屬性則按照公式(1)得到相應(yīng)的信息熵;若為連續(xù)屬性,首先對(duì)連續(xù)屬性的數(shù)據(jù)進(jìn)行排序,通過公式(2)計(jì)算其信息熵,根據(jù)C4.5算法計(jì)算其信息增益,再采用公式(3)計(jì)算該屬性的信息增益率。然后通過比對(duì)按不同屬性計(jì)算的信息增益率值的大小,確定優(yōu)先分裂的屬性。按照上述步驟獲得決策樹后,當(dāng)出現(xiàn)生成的決策樹模型誤差率大于指定閾值時(shí),可通過調(diào)整加權(quán)參數(shù)K的取值,進(jìn)行反復(fù)實(shí)驗(yàn)來(lái)使得生成的決策樹模型和樣本實(shí)際數(shù)據(jù)逐漸逼近,使訓(xùn)練誤差率降到最低,最終達(dá)到提高決策樹預(yù)測(cè)準(zhǔn)確性的目的。其相應(yīng)的流程圖如圖2所示。3實(shí)驗(yàn)與分析為了驗(yàn)證C4.5-K算法的準(zhǔn)確性和有效性,以下將以雞蛋期貨歷史數(shù)據(jù)為例進(jìn)行訓(xùn)練建模。期貨原始數(shù)據(jù)項(xiàng)主要包括合約種類、開盤價(jià)、收盤價(jià)、最高價(jià)、最低價(jià)、漲跌1、結(jié)算價(jià)、漲跌2、交易日期、持倉(cāng)量、成交量等屬性。3.1數(shù)據(jù)預(yù)處理為了方便后續(xù)的數(shù)據(jù)挖掘,首先需要對(duì)期貨原始數(shù)據(jù)進(jìn)行預(yù)處理[14-15],有關(guān)處理內(nèi)容

曲線,加權(quán)信息,曲線,決策樹


2017,53(11)K≤0,這個(gè)取值區(qū)間正好與L1的取值區(qū)間[0,+∞)隔開且相鄰。圖1中分別顯示了不同K值下L2的曲線圖,從下到上,K的取值分別為-1、-0.7、-0.5、-0.3、-0.1。從圖中可以看出K取值越接近于-1,曲線L2越陡峭,離L3越近;反之越趨近于0,曲線愈加平滑,離x軸愈近。從圖1中也容易觀察到曲線L2與L1相比,L2要平滑得多,因此可以通過訓(xùn)練K取不同值,進(jìn)而用帶加權(quán)參數(shù)K的x′來(lái)弱化某些強(qiáng)關(guān)聯(lián)屬性的信息熵,以達(dá)到提高弱關(guān)聯(lián)屬性在決策樹全局范圍的分類能力。以下就C4.5-K算法通過訓(xùn)練K進(jìn)而構(gòu)建決策樹的流程進(jìn)行闡述。2.4改進(jìn)算法的決策樹構(gòu)建過程在構(gòu)建決策樹[11-13]的過程中,C4.5-K算法首先需要取一初始K值,并判斷所處理的屬性是離散屬性還是連續(xù)屬性,若為離散屬性則按照公式(1)得到相應(yīng)的信息熵;若為連續(xù)屬性,首先對(duì)連續(xù)屬性的數(shù)據(jù)進(jìn)行排序,通過公式(2)計(jì)算其信息熵,根據(jù)C4.5算法計(jì)算其信息增益,再采用公式(3)計(jì)算該屬性的信息增益率。然后通過比對(duì)按不同屬性計(jì)算的信息增益率值的大小,確定優(yōu)先分裂的屬性。按照上述步驟獲得決策樹后,當(dāng)出現(xiàn)生成的決策樹模型誤差率大于指定閾值時(shí),可通過調(diào)整加權(quán)參數(shù)K的取值,進(jìn)行反復(fù)實(shí)驗(yàn)來(lái)使得生成的決策樹模型和樣本實(shí)際數(shù)據(jù)逐漸逼近,使訓(xùn)練誤差率降到最低,最終達(dá)到提高決策樹預(yù)測(cè)準(zhǔn)確性的目的。其相應(yīng)的流程圖如圖2所示。3實(shí)驗(yàn)與分析為了驗(yàn)證C4.5-K算法的準(zhǔn)確性和有效性,以下將以雞蛋期貨歷史數(shù)據(jù)為例進(jìn)行訓(xùn)練建模。期貨原始數(shù)據(jù)項(xiàng)主要包括合約種類、開盤價(jià)、收盤價(jià)、最高價(jià)、最低價(jià)、漲跌1、結(jié)算價(jià)、漲跌2、交易日期、持倉(cāng)量、成交量等屬性。3.1數(shù)據(jù)預(yù)處理為了方便后續(xù)的數(shù)據(jù)挖掘,首先需要對(duì)期貨原始數(shù)據(jù)進(jìn)行預(yù)處理[14-15],有關(guān)處理內(nèi)容

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 香麗蕓;淺談數(shù)據(jù)挖掘及其應(yīng)用[J];昌吉師專學(xué)報(bào);2001年02期

2 鄭雪燕,張杰明,岳洋;數(shù)據(jù)挖掘語(yǔ)言[J];計(jì)算機(jī)時(shí)代;2001年11期

3 劉明晶;數(shù)據(jù)挖掘[J];華南金融電腦;2001年04期

4 張偉;劉勇國(guó);彭軍;廖曉峰;吳中福;;數(shù)據(jù)挖掘發(fā)展研究[J];計(jì)算機(jī)科學(xué);2001年07期

5 鐘曉;馬少平;張鈸;俞瑞釗;;數(shù)據(jù)挖掘綜述[J];模式識(shí)別與人工智能;2001年01期

6 朱建平,張潤(rùn)楚;數(shù)據(jù)挖掘的發(fā)展及其特點(diǎn)[J];統(tǒng)計(jì)與決策;2002年07期

7 傅嵐;在數(shù)據(jù)海洋中打撈信息數(shù)據(jù)挖掘[J];科技廣場(chǎng);2002年11期

8 李峻;數(shù)據(jù)挖掘,企業(yè)洞察先機(jī)的“慧眼”[J];中國(guó)計(jì)算機(jī)用戶;2002年48期

9 羅可,蔡碧野,卜勝賢,謝中科;數(shù)據(jù)挖掘及其發(fā)展研究[J];計(jì)算機(jī)工程與應(yīng)用;2002年14期

10 ;2002數(shù)據(jù)挖掘研討班[J];計(jì)算機(jī)工程;2002年06期

相關(guān)會(huì)議論文 前10條

1 史東輝;蔡慶生;張春陽(yáng);;一種新的數(shù)據(jù)挖掘多策略方法研究[A];第十七屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2000年

2 張弦;;數(shù)據(jù)挖掘在農(nóng)業(yè)中的應(yīng)用[A];紀(jì)念中國(guó)農(nóng)業(yè)工程學(xué)會(huì)成立30周年暨中國(guó)農(nóng)業(yè)工程學(xué)會(huì)2009年學(xué)術(shù)年會(huì)(CSAE 2009)論文集[C];2009年

3 魏順平;;教育數(shù)據(jù)挖掘:現(xiàn)狀與趨勢(shì)[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計(jì)算機(jī)模擬與信息技術(shù)學(xué)術(shù)會(huì)議論文集[C];2011年

4 關(guān)清平;沉培輝;;概率網(wǎng)絡(luò)在數(shù)據(jù)挖掘上的應(yīng)用[A];科技、工程與經(jīng)濟(jì)社會(huì)協(xié)調(diào)發(fā)展——中國(guó)科協(xié)第五屆青年學(xué)術(shù)年會(huì)論文集[C];2004年

5 丁瑾;;基于Web數(shù)據(jù)挖掘的綜述[A];山西省科學(xué)技術(shù)情報(bào)學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C];2004年

6 聶茹;田森平;;Web數(shù)據(jù)挖掘及其在電子商務(wù)中的應(yīng)用[A];中南六省(區(qū))自動(dòng)化學(xué)會(huì)第24屆學(xué)術(shù)年會(huì)會(huì)議論文集[C];2006年

7 李菊;王軍;;數(shù)據(jù)挖掘在客戶關(guān)系管理的應(yīng)用[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年

8 肖陽(yáng);李啟賢;;數(shù)據(jù)挖掘在中國(guó)鋼鐵行業(yè)中的應(yīng)用[A];中國(guó)計(jì)量協(xié)會(huì)冶金分會(huì)2012年會(huì)暨能源計(jì)量與節(jié)能降耗經(jīng)驗(yàn)交流會(huì)論文集[C];2012年

9 楊磊;王貴成;汪勇;張占勝;;SQL Server 2005在數(shù)據(jù)挖掘中的應(yīng)用[A];2009年中國(guó)智能自動(dòng)化會(huì)議論文集(第二分冊(cè))[C];2009年

10 謝中;邱玉輝;;面向商務(wù)網(wǎng)站有效性的數(shù)據(jù)挖掘方法[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2001年

相關(guān)重要報(bào)紙文章 前10條

1 □中國(guó)電信股份有限公司北京研究院 張舒博 □北京郵電大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 牛琨;走出數(shù)據(jù)挖掘的誤區(qū)[N];人民郵電;2006年

2 《網(wǎng)絡(luò)世界》記者 王瑩;數(shù)據(jù)挖掘保險(xiǎn)業(yè)的新藍(lán)海[N];網(wǎng)絡(luò)世界;2012年

3 劉俊麗;基于地理化的網(wǎng)絡(luò)數(shù)據(jù)挖掘與分析提升投資有效性[N];人民郵電;2014年

4 ;數(shù)據(jù)挖掘:如何挖出效益?[N];中國(guó)計(jì)算機(jī)報(bào);2004年

5 任中華;財(cái)務(wù)數(shù)據(jù)挖掘六步走[N];中國(guó)計(jì)算機(jī)報(bào);2007年

6 電腦商報(bào)記者 謝濤;數(shù)據(jù)挖掘:未來(lái)政府信息化的重要環(huán)節(jié)[N];電腦商報(bào);2007年

7 吳勇毅;軟件選型:數(shù)據(jù)挖掘是重點(diǎn)[N];中國(guó)冶金報(bào);2009年

8 本報(bào)特約撰稿 許麗萍;數(shù)據(jù)挖掘:軟件應(yīng)用的新境界[N];計(jì)算機(jī)世界;2009年

9 謝立宏博士;企業(yè)的“黃金眼”數(shù)據(jù)挖掘決策支持[N];中國(guó)計(jì)算機(jī)報(bào);2002年

10 吳勇毅;危機(jī)下,數(shù)據(jù)挖掘與提供信息決策是關(guān)健[N];中國(guó)冶金報(bào);2009年

相關(guān)博士學(xué)位論文 前10條

1 于自強(qiáng);海量流數(shù)據(jù)挖掘相關(guān)問題研究[D];山東大學(xué);2015年

2 張馨;全基因組SNP芯片應(yīng)用于CNV和L0H分析的軟件比對(duì)與數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年

3 李秋虹;基于MapReduce的大規(guī)模數(shù)據(jù)挖掘技術(shù)研究[D];復(fù)旦大學(xué);2013年

4 白曉明;基于數(shù)據(jù)挖掘的復(fù)合材料宏—細(xì)觀力學(xué)模型研究[D];哈爾濱工業(yè)大學(xué);2016年

5 吳賢;社會(huì)化數(shù)據(jù)挖掘中的若干問題研究[D];上海交通大學(xué);2015年

6 楊博;基于GPU異構(gòu)體系結(jié)構(gòu)的大規(guī)模圖數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2015年

7 馮驥;自然鄰居思想概念及其在數(shù)據(jù)挖掘領(lǐng)域的應(yīng)用[D];重慶大學(xué);2016年

8 李榮;生物信息數(shù)據(jù)挖掘若干關(guān)鍵問題研究與應(yīng)用[D];復(fù)旦大學(xué);2004年

9 李玉華;面向服務(wù)的數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D];華中科技大學(xué);2006年

10 吳少智;時(shí)間序列數(shù)據(jù)挖掘在生物醫(yī)學(xué)中的應(yīng)用研究[D];電子科技大學(xué);2010年

相關(guān)碩士學(xué)位論文 前10條

1 林仁紅;基于數(shù)據(jù)挖掘的機(jī)遇識(shí)別與評(píng)價(jià)研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2007年

2 張彥俊;游戲運(yùn)營(yíng)中的數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年

3 焦亞召;基于多核函數(shù)FCM算法在數(shù)據(jù)挖掘聚類中的應(yīng)用研究[D];昆明理工大學(xué);2015年

4 王杰鋒;物聯(lián)網(wǎng)能耗數(shù)據(jù)智能分析及其應(yīng)用平臺(tái)設(shè)計(jì)[D];江南大學(xué);2015年

5 戴陽(yáng)陽(yáng);基于數(shù)據(jù)挖掘的金融時(shí)間序列預(yù)測(cè)研究與應(yīng)用[D];江南大學(xué);2015年

6 石思優(yōu);基于主題模型的醫(yī)療數(shù)據(jù)挖掘研究[D];廣東技術(shù)師范學(xué)院;2015年

7 陳丹;移動(dòng)互聯(lián)網(wǎng)信令挖掘?qū)崿F(xiàn)智慧營(yíng)銷的設(shè)計(jì)與實(shí)現(xiàn)應(yīng)用研究[D];華南理工大學(xué);2015年

8 陳思;基于數(shù)據(jù)挖掘的大學(xué)生客戶識(shí)別模型的研究[D];昆明理工大學(xué);2015年

9 位長(zhǎng)帥;基于客戶數(shù)據(jù)挖掘的電信客戶關(guān)系管理研究[D];西南交通大學(xué);2015年

10 言炯;數(shù)據(jù)挖掘在高考錄取因素分析中的應(yīng)用研究[D];蘇州大學(xué);2015年



本文編號(hào):2553958

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2553958.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶64ba8***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com