混合采樣方法的研究及其在醫(yī)療問答系統(tǒng)中的應(yīng)用
發(fā)布時(shí)間:2021-04-14 11:56
隨著機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘領(lǐng)域的迅速發(fā)展,不平衡數(shù)據(jù)集分類已經(jīng)成為當(dāng)前的研究熱點(diǎn)之一。在實(shí)際應(yīng)用中經(jīng)常遇到數(shù)據(jù)集不平衡問題,比如:醫(yī)療診斷、欺詐檢測(cè)、地震預(yù)測(cè)等,如何提高正類樣本的分類精度是研究的重點(diǎn)。大部分分類算法往往會(huì)偏向負(fù)類,而對(duì)正類識(shí)別率卻很低。在深入分析了不平衡數(shù)據(jù)處理方法及醫(yī)療問答系統(tǒng)的基礎(chǔ)上,本文在二分類不平衡數(shù)據(jù)集上,提出了基于樣本細(xì)分的混合采樣算法(Hybrid Sampling Algorithm Based On Sample Subdivision),簡(jiǎn)稱SS-HSA算法,并研究了該算法在醫(yī)療問答系統(tǒng)中的應(yīng)用。本文主要內(nèi)容包括:(1)詳細(xì)分析了ENN(Edited Nearest Neighbor)欠采樣、Borderline-SMOTE過采樣、Random-SMOTE+ENN混合采樣、ISMOTE過采樣算法,為本文提出的SS-HSA算法提供理論基礎(chǔ)。(2)基于樣本細(xì)分的混合采樣算法,本文在數(shù)據(jù)層面提出的SS-HSA算法結(jié)合了Borderline-SMOTE、ISMOTE過采樣算法以及ENN欠采樣算法的優(yōu)點(diǎn),同時(shí)加入了樣本細(xì)分的思想。一方面,對(duì)生成的樣本數(shù)量精細(xì)控制...
【文章來源】:鄭州大學(xué)河南省 211工程院校
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
采樣前分類效果圖
采樣后分類效果圖
原始數(shù)據(jù)集的分布
【參考文獻(xiàn)】:
期刊論文
[1]知識(shí)圖譜發(fā)展與構(gòu)建的研究進(jìn)展[J]. 朱木易潔,鮑秉坤,徐常勝. 南京信息工程大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(06)
[2]基于鄰域混合抽樣和動(dòng)態(tài)集成的不平衡數(shù)據(jù)分類方法[J]. 高鋒,黃海燕. 計(jì)算機(jī)科學(xué). 2017(08)
[3]基于Web的問答系統(tǒng)綜述[J]. 李舟軍,李水華. 計(jì)算機(jī)科學(xué). 2017(06)
[4]面向不均衡數(shù)據(jù)集中少數(shù)類細(xì)分的過采樣算法[J]. 古平,楊煬. 計(jì)算機(jī)工程. 2017(02)
[5]不平衡數(shù)據(jù)集的混合采樣方法[J]. 尚旭. 數(shù)字技術(shù)與應(yīng)用. 2016 (12)
[6]知識(shí)圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計(jì)算機(jī)研究與發(fā)展. 2016(03)
[7]基于混合采樣的非平衡數(shù)據(jù)集分類研究[J]. 古平,歐陽(yáng)源遊. 計(jì)算機(jī)應(yīng)用研究. 2015(02)
[8]基于改進(jìn)SMOTE的非平衡數(shù)據(jù)集分類研究[J]. 王超學(xué),潘正茂,董麗麗,馬春森,張星. 計(jì)算機(jī)工程與應(yīng)用. 2013(02)
[9]面向不均衡數(shù)據(jù)集的ISMOTE算法[J]. 許丹丹,王勇,蔡立軍. 計(jì)算機(jī)應(yīng)用. 2011(09)
[10]不平衡分類問題研究綜述[J]. 葉志飛,文益民,呂寶糧. 智能系統(tǒng)學(xué)報(bào). 2009(02)
本文編號(hào):3137273
【文章來源】:鄭州大學(xué)河南省 211工程院校
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
采樣前分類效果圖
采樣后分類效果圖
原始數(shù)據(jù)集的分布
【參考文獻(xiàn)】:
期刊論文
[1]知識(shí)圖譜發(fā)展與構(gòu)建的研究進(jìn)展[J]. 朱木易潔,鮑秉坤,徐常勝. 南京信息工程大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(06)
[2]基于鄰域混合抽樣和動(dòng)態(tài)集成的不平衡數(shù)據(jù)分類方法[J]. 高鋒,黃海燕. 計(jì)算機(jī)科學(xué). 2017(08)
[3]基于Web的問答系統(tǒng)綜述[J]. 李舟軍,李水華. 計(jì)算機(jī)科學(xué). 2017(06)
[4]面向不均衡數(shù)據(jù)集中少數(shù)類細(xì)分的過采樣算法[J]. 古平,楊煬. 計(jì)算機(jī)工程. 2017(02)
[5]不平衡數(shù)據(jù)集的混合采樣方法[J]. 尚旭. 數(shù)字技術(shù)與應(yīng)用. 2016 (12)
[6]知識(shí)圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計(jì)算機(jī)研究與發(fā)展. 2016(03)
[7]基于混合采樣的非平衡數(shù)據(jù)集分類研究[J]. 古平,歐陽(yáng)源遊. 計(jì)算機(jī)應(yīng)用研究. 2015(02)
[8]基于改進(jìn)SMOTE的非平衡數(shù)據(jù)集分類研究[J]. 王超學(xué),潘正茂,董麗麗,馬春森,張星. 計(jì)算機(jī)工程與應(yīng)用. 2013(02)
[9]面向不均衡數(shù)據(jù)集的ISMOTE算法[J]. 許丹丹,王勇,蔡立軍. 計(jì)算機(jī)應(yīng)用. 2011(09)
[10]不平衡分類問題研究綜述[J]. 葉志飛,文益民,呂寶糧. 智能系統(tǒng)學(xué)報(bào). 2009(02)
本文編號(hào):3137273
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3137273.html
最近更新
教材專著