基于GBDT等機(jī)器學(xué)習(xí)算法的新股量化策略研究
【圖文】:
2.3 機(jī)器學(xué)習(xí)介紹機(jī)器學(xué)習(xí)是在歷史數(shù)據(jù)中尋找規(guī)律,用于對(duì)新數(shù)據(jù)的預(yù)測(cè)。機(jī)器學(xué)習(xí)的邏輯框架如圖2-1所示,可以看到:假設(shè)G會(huì)產(chǎn)一系列的獨(dú)立同分布樣本(x1,y1),(x2,y2)…….(xn,yn),具有 F(y|x)的聯(lián)合分布。定義式(2-4)的損失函數(shù)函數(shù)[48]:R( ) ( ( )) ( ) (式 2-4)機(jī)器學(xué)習(xí)目的是在這些樣本中尋找某個(gè)最優(yōu)的函數(shù) f(x,v),該函數(shù)可以使得(2-4)的值最小。V 代表了廣義的參數(shù),, ( ( ))是預(yù)測(cè)誤差又被稱為損失函數(shù),該函數(shù)根據(jù)具體的應(yīng)用問題不同而不同。在分類問題中,如果學(xué)習(xí)函數(shù)的預(yù)測(cè)類別同真實(shí)類別不一致,則可以認(rèn)為在該樣本上,學(xué)習(xí)器錯(cuò)誤。
圖 2-2 完全線性可分問題-2 所示,實(shí)心點(diǎn)與空心點(diǎn)分別代表不同的類別,比如 y=1 代表空心點(diǎn)。在平面上可以找到直線 L 對(duì)這些點(diǎn)做劃分,則可以看做是 1,在 y 線以下可以看作是 0。而在一個(gè)平面條這種曲線,比如和 L 平行的直線 L1、L2。而確定使用哪便是尋找最優(yōu)分類的問題。認(rèn)為如果存在一條直線與 L 平行同時(shí)又使得 L1 和 L2 之間該直線便被認(rèn)為是最優(yōu)的分類直線,L1 和 L2 之間的距離,該距離越大,學(xué)習(xí)器的泛化能力越強(qiáng)。同理類推,在多的分類平面就是使得分類距離達(dá)到最大的平面。而支持向被最優(yōu)分類平面對(duì)應(yīng)的平面所經(jīng)過的樣本點(diǎn),比如在圖 經(jīng)過的點(diǎn)。-2 的二維平面的分類問題中,決策函數(shù)是尋找能夠劃分樣本,如下所示:
【學(xué)位授予單位】:西南財(cái)經(jīng)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:F832.51;F224
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 趙金濤;邱雪濤;何東杰;;基于GBDT的線上交易欺詐偵測(cè)研究[J];微型電腦應(yīng)用;2017年10期
2 蘇興華;孫俊明;高翔;王敏;;基于GBDT算法的鉆井機(jī)械鉆速預(yù)測(cè)方法研究[J];計(jì)算機(jī)應(yīng)用與軟件;2019年12期
3 張重生;彭國雯;于珂珂;;基于GBDT和HOG特征的人臉關(guān)鍵點(diǎn)定位[J];河南大學(xué)學(xué)報(bào)(自然科學(xué)版);2018年02期
4 張洋;葉月;張宗翔;佘芳;陳析宇;;基于GBDT的學(xué)術(shù)會(huì)議替代計(jì)量學(xué)評(píng)價(jià)模型研究[J];情報(bào)學(xué)報(bào);2019年11期
5 王立平;鄧芳明;;基于小波包和GBDT的瓦斯傳感器故障診斷[J];測(cè)控技術(shù);2016年12期
6 王洪偉;孟園;;在線評(píng)論質(zhì)量有用特征識(shí)別:基于GBDT特征貢獻(xiàn)度方法[J];中文信息學(xué)報(bào);2017年03期
7 鄭凱文;楊超;;基于迭代決策樹(GBDT)短期負(fù)荷預(yù)測(cè)研究[J];貴州電力技術(shù);2017年02期
8 舒暢;李輝;;基于小波與GBDT的無人機(jī)傳感器故障診斷[J];測(cè)控技術(shù);2017年08期
9 王黎;廖聞劍;;基于GBDT的個(gè)人信用評(píng)估方法[J];電子設(shè)計(jì)工程;2017年15期
10 龔誼承;都承華;張艷娜;余力;;基于主成分和GBDT對(duì)血糖值的預(yù)測(cè)[J];數(shù)學(xué)的實(shí)踐與認(rèn)識(shí);2019年14期
相關(guān)碩士學(xué)位論文 前10條
1 蘭筱莉;基于GBDT等機(jī)器學(xué)習(xí)算法的新股量化策略研究[D];西南財(cái)經(jīng)大學(xué);2018年
2 張艷娜;互聯(lián)網(wǎng)金融中基于GBDT的三類信用風(fēng)險(xiǎn)度量及其驅(qū)動(dòng)的海薩尼轉(zhuǎn)換[D];武漢科技大學(xué);2019年
3 張瀟;基于改進(jìn)的GBDT的量化投資模型[D];廣西大學(xué);2018年
4 陳子之;基于GBDT的地方政府債務(wù)風(fēng)險(xiǎn)評(píng)級(jí)和預(yù)警研究[D];上海師范大學(xué);2017年
5 王天華;基于改進(jìn)的GBDT算法的乘客出行預(yù)測(cè)研究[D];大連理工大學(xué);2016年
6 孫萬龍;基于GBDT的社區(qū)問題標(biāo)簽推薦技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2015年
7 馬姝;基于數(shù)據(jù)挖掘的消費(fèi)者購買預(yù)測(cè)的研究[D];云南財(cái)經(jīng)大學(xué);2016年
8 連克強(qiáng);基于Boosting的集成樹算法研究與分析[D];中國地質(zhì)大學(xué)(北京);2018年
9 趙中祥;顯微視頻細(xì)胞分割與跟蹤方法研究[D];哈爾濱工業(yè)大學(xué);2016年
10 李子玉;基于數(shù)據(jù)驅(qū)動(dòng)的機(jī)場(chǎng)航站樓離港旅客托運(yùn)行李需求預(yù)測(cè)研究[D];北京交通大學(xué);2018年
本文編號(hào):2604137
本文鏈接:http://sikaile.net/jingjilunwen/jingjiguanlilunwen/2604137.html