Logistic模型對非平衡數(shù)據(jù)的敏感性:測度、修正與比較
【圖文】:
對平衡數(shù)據(jù)集而言,噪聲數(shù)據(jù)的存在并不會影響各類數(shù)據(jù)的識別。而在非逡逑平衡數(shù)據(jù)集中,由于稀有類數(shù)據(jù)規(guī)模較小,噪聲數(shù)據(jù)會嚴重影響分類器對稀有逡逑類的識別能力,如圖2-2所示,當稀有類樣本(^)出現(xiàn)在多數(shù)類樣本(公)逡逑中和多數(shù)類樣本(5)出現(xiàn)在稀有類樣本(^)中時都會產(chǎn)生噪聲現(xiàn)象。研究逡逑表明,噪聲數(shù)據(jù)對稀有類的影響要遠遠大于多數(shù)類(Weiss邋G,邋2004),即公中逡逑的兩個噪聲數(shù)據(jù)對多數(shù)類的判定邊界沒有影響,然而,由于^中出現(xiàn)兩個噪聲逡逑數(shù)據(jù),,學習器無法區(qū)分稀有類數(shù)據(jù)和噪聲數(shù)據(jù),不能根據(jù)稀有類的數(shù)據(jù)信息對逡逑邊界作出判定。因此,在對非平衡數(shù)據(jù)集進行分類時,應當去除噪聲數(shù)據(jù)。逡逑12逡逑
特征構成一個新的特征集,送樣不僅可W簡化特征空間,也可W根據(jù)選擇的有逡逑效特征解決分類問題。一個完整的特征選擇過程大致可W分為四個階段:生成逡逑特征子集、評價特征子集、終止條件、結果驗證(如圖3-4所示)。生成特征逡逑20逡逑
【學位授予單位】:東北財經(jīng)大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:C81
【相似文獻】
相關期刊論文 前7條
1 馮力;;經(jīng)濟周期的logistic預測漠型[J];統(tǒng)計與咨詢;2005年06期
2 王忠純;;LOGISTIC方程迭代過程圖解演示[J];物理通報;1999年07期
3 任常茂;具有反饋控制的Logistic擴散系統(tǒng)周期解的存在與穩(wěn)定[J];荊州師專學報;1996年05期
4 程亞煥;;具有污染和捕獲影響的一類廣義Logistic種群的生存分析[J];通化師范學院學報;2006年04期
5 魏艷華;王丙參;李艷穎;;Logistic分布參數(shù)的漸進置信區(qū)間估計[J];樂山師范學院學報;2012年05期
6 萬維明;張南南;馬永峰;;一類具有連續(xù)時滯和非線性出生率的Logistic人口模型的定性分析[J];大連交通大學學報;2011年03期
7 石曉軍;;Logistic違約率模型最優(yōu)樣本配比與分界點的模擬分析[J];數(shù)理統(tǒng)計與管理;2006年06期
相關博士學位論文 前2條
1 徐猛;N人雪堆博弈模型的第三種策略引入及其影響探究[D];浙江大學;2017年
2 黃毅敏;主輔制造商協(xié)同生產(chǎn)系統(tǒng)博弈模型研究[D];天津大學;2016年
相關碩士學位論文 前10條
1 郭楠楠;一類帶有Logistic項的多物種生物趨化模型解的整體有界性[D];東南大學;2015年
2 王微廣;基于Logistic分布的GARCH族模型在期貨中的應用[D];西安建筑科技大學;2016年
3 馮月平;Logistic財務預警回歸模型的構建與檢驗[D];青島理工大學;2010年
4 胡丹丹;幾種數(shù)據(jù)類型下兩參數(shù)Logistic分布參數(shù)的近似極大似然估計[D];上海師范大學;2017年
5 王浩;胃癌術后嚴重并發(fā)癥的多因素Logistic風險模型的建立及死亡危險因素分析[D];青島大學;2008年
6 田凱;Logistic可加部分線性模型的漸近正態(tài)性[D];廣西大學;2017年
7 徐步霄;社會階層對不誠實行為的影響:一個有中介的調節(jié)模型[D];華中師范大學;2017年
8 康凱;基于Skewed-T Realized GARCH模型的滬深300指數(shù)波動性研究[D];天津商業(yè)大學;2017年
9 張保中;各種分類方法在垃圾短信識別中的應用[D];華中師范大學;2017年
10 覃利華;若干個雙險種風險模型破產(chǎn)問題的研究[D];廣西大學;2017年
本文編號:2674709
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/2674709.html