天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

不均衡數(shù)據(jù)在股票研報分類中的應(yīng)用

發(fā)布時間:2018-01-02 03:16

  本文關(guān)鍵詞:不均衡數(shù)據(jù)在股票研報分類中的應(yīng)用 出處:《計算機應(yīng)用研究》2017年03期  論文類型:期刊論文


  更多相關(guān)文章: 不均衡數(shù)據(jù) 股票研報 CHI統(tǒng)計 SVM算法 層次欠采樣


【摘要】:股票研報是由金融行業(yè)分析師對股票相關(guān)新聞作出的分析和評價,它從專業(yè)角度分析此類新聞是否會對某股票的未來走勢產(chǎn)生影響,并提出專業(yè)投資建議,往往比論壇分析更具權(quán)威性。然而,各類別研報數(shù)量之間的嚴重不均衡性致使常規(guī)的SVM分類效果較差。為提高分類效果,提出一種新的不均衡數(shù)據(jù)分類方法。在文本特征項選擇方面采用組合特征思想以選擇更具語義信息的特征短語,并改進CHI統(tǒng)計以提高對少數(shù)類樣本特征項的選擇,然后設(shè)計一個基于SVM聚類的邊界自適應(yīng)層次欠采樣算法對多數(shù)類樣本進行層次欠采樣。實驗結(jié)果表明,該方法能夠在不影響多數(shù)類分類的基礎(chǔ)上對少數(shù)類的分類效果有較為明顯的提升。
[Abstract]:Stock Research News is an analysis and evaluation of stock related news made by financial industry analysts. It analyzes whether such news will have an impact on the future trend of a certain stock from a professional point of view and puts forward professional investment suggestions. Often more authoritative than the analysis of the forum. However, the serious imbalance between the number of the various categories of research results in the poor performance of the conventional SVM classification, in order to improve the effectiveness of classification. In this paper, a new method of unbalance data classification is proposed. In the selection of text feature items, the idea of combining features is adopted to select feature phrases with more semantic information. And improve the CHI statistics to improve the selection of a small number of sample feature items. Then a boundary adaptive hierarchical under-sampling algorithm based on SVM clustering is designed to perform hierarchical under-sampling for most samples. This method can improve the classification effect of a few classes without affecting the classification of most classes.
【作者單位】: 武漢大學計算機學院;
【基金】:國家自然科學基金青年項目(164659)
【分類號】:F832.51;TP311.13
【正文快照】: 0引言股票市場是金融領(lǐng)域的重要組成部分,在現(xiàn)代市場經(jīng)濟中具有舉足輕重的地位。一方面,隨著國家對股票市場管理建設(shè)力度的加強,并實施一系列促進股票市場發(fā)展的相關(guān)政策后,越來越多的股民關(guān)注股票價格的走勢并參與股票投資。另一方面,隨著社交網(wǎng)絡(luò)的快速發(fā)展,網(wǎng)絡(luò)信息量急劇

【參考文獻】

相關(guān)期刊論文 前3條

1 姜楊;閆相斌;;基于議程設(shè)置的新聞媒體報道對上市公司股票收益影響的實證研究[J];金融理論與實踐;2015年06期

2 彭敏;汪清;黃濟民;周李;胡鑫匯;;基于情感分析技術(shù)的股票研究報告分類[J];武漢大學學報(理學版);2015年02期

3 陶新民;張冬雪;郝思媛;付丹丹;;基于譜聚類欠取樣的不均衡數(shù)據(jù)SVM分類算法[J];控制與決策;2012年12期

【共引文獻】

相關(guān)期刊論文 前10條

1 朱琳琳;徐健;;網(wǎng)絡(luò)評論情感分析關(guān)鍵技術(shù)及應(yīng)用研究[J];情報理論與實踐;2017年01期

2 毛文濤;田楊陽;王金婉;何玲;;面向貫序不均衡分類的粒度極限學習機[J];控制與決策;2016年12期

3 熊邦書;劉雨;莫燕;黃建萍;李新民;;基于SVM的直升機飛行狀態(tài)識別[J];應(yīng)用科學學報;2016年04期

4 杜紅樂;張燕;;密度不均衡數(shù)據(jù)分類算法[J];西華大學學報(自然科學版);2015年05期

5 李新華;趙娟;袁振宇;王晨e,

本文編號:1367429


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/huobiyinxinglunwen/1367429.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶76bfe***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com