面向不平衡數(shù)據(jù)集分類的層次引力模型研究
本文關(guān)鍵詞:面向不平衡數(shù)據(jù)集分類的層次引力模型研究
更多相關(guān)文章: 不平衡數(shù)據(jù)集分類 層次分類模型 數(shù)據(jù)引力模型 小析取項(xiàng)
【摘要】:分類是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)熱點(diǎn)問題,傳統(tǒng)的分類問題主要關(guān)注數(shù)據(jù)分布平衡的情況,但是在實(shí)際應(yīng)用當(dāng)中數(shù)據(jù)不平衡的情況時(shí)有發(fā)生。數(shù)據(jù)的不平衡給分類直接或間接地帶來了很多困難,傳統(tǒng)的方法在對(duì)不平衡數(shù)據(jù)集進(jìn)行分類時(shí)往往變得不再適用。由于不平衡數(shù)據(jù)集分類問題的挑戰(zhàn)性和在現(xiàn)實(shí)中的廣泛應(yīng)用,吸引了越來越多的人對(duì)其進(jìn)行研究。目前對(duì)不平衡數(shù)據(jù)集分類的解決方法主要分三種:問題定義層的解決方法、數(shù)據(jù)層的解決方法和算法層的解決方法。在對(duì)不平衡數(shù)據(jù)集分類中的主要問題進(jìn)行分析后,該文介紹了兩種傳統(tǒng)的分類方法,即層次分類模型和數(shù)據(jù)引力模型,并分析了將它們用于不平衡數(shù)據(jù)集分類的可行性:將兩者結(jié)合可以同時(shí)降低類間不平衡和小析取項(xiàng)對(duì)分類影響。然后在此基礎(chǔ)上對(duì)兩者進(jìn)行了修改,提出了一種用于不平衡數(shù)據(jù)集分類的層次引力模型,即HDGC。本文的主要工作如下:1.將層次分類模型和數(shù)據(jù)引力模型相結(jié)合,在吸納兩者優(yōu)點(diǎn)的同時(shí)使兩者彌補(bǔ)了彼此的不足,即層次分類模型精確分類能力的不足和數(shù)據(jù)引力模型分類代價(jià)較高的問題。2.改變了傳統(tǒng)層次分類模型中采用新生成樣本代替原始樣本的做法,將劃分后位于同一區(qū)域的樣本看作一個(gè)數(shù)據(jù)單元,根據(jù)數(shù)據(jù)單元距離邊界的遠(yuǎn)近對(duì)其進(jìn)行不同標(biāo)記,并使用標(biāo)記結(jié)果輔助分類。3.采用了局部引力和全局引力相結(jié)合進(jìn)行分類的方法。局部引力只采用相鄰的訓(xùn)練樣本對(duì)測試樣本進(jìn)行分類,在有足夠信息的情況下提高了分類的效率,而使用全局引力則可以利用盡可能多的信息對(duì)難分樣本進(jìn)行分類。為了驗(yàn)證HDGC算法的有效性,分別在實(shí)際數(shù)據(jù)集和人工數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明該方法能夠很好的處理不平衡數(shù)據(jù)集的分類問題,同時(shí)具有較高的分類效率。
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP181;TP311.13
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 張晶;宋福根;孫捷;;價(jià)格與廣告的組合博弈模型及系統(tǒng)仿真[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2013年05期
2 ;[J];;年期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前7條
1 黃濤;張明;覃東海;;東亞的貿(mào)易一體化模式:一個(gè)引力模型的驗(yàn)證[A];現(xiàn)代工業(yè)工程與管理研討會(huì)會(huì)議論文集[C];2006年
2 武藝;吳小根;;旅游地引力模型分析研究[A];地理學(xué)會(huì)全面建設(shè)小康社會(huì)——第九次中國青年地理工作者學(xué)術(shù)研討會(huì)論文摘要集[C];2003年
3 何偉;;我國大豆進(jìn)口的主要影響因素——基于引力模型的研究[A];農(nóng)業(yè)經(jīng)濟(jì)問題(2010年增刊)[C];2010年
4 王晨鐘;;基于改進(jìn)的引力模型解析我國外貿(mào)發(fā)展的動(dòng)因變化[A];新規(guī)劃·新視野·新發(fā)展——天津市社會(huì)科學(xué)界第七屆學(xué)術(shù)年會(huì)優(yōu)秀論文集《天津?qū)W術(shù)文庫》(下)[C];2011年
5 謝國立;;引力模型在城市交通流量分布預(yù)測中的應(yīng)用[A];第三屆全國結(jié)構(gòu)工程學(xué)術(shù)會(huì)議論文集(下)[C];1994年
6 王海龍;;基于引力模型的京津冀地區(qū)城市圈輻射力分析[A];全國經(jīng)濟(jì)地理研究會(huì)第十三屆學(xué)術(shù)年會(huì)暨金融危機(jī)背景下的中國區(qū)域經(jīng)濟(jì)發(fā)展研討會(huì)論文集[C];2009年
7 余淼杰;;發(fā)展中國家間的民主進(jìn)步能促進(jìn)其雙邊貿(mào)易嗎——基于引力模型的一個(gè)實(shí)證研究[A];經(jīng)濟(jì)學(xué)(季刊)第7卷第4期[C];2008年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前6條
1 薩達(dá)罕(Saadeh Shaker Othman Saadeh);中國和海灣合作理事會(huì)國家之間的雙邊貿(mào)易重力模型比較分析[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2016年
2 維摩拉;中國與南亞經(jīng)貿(mào)協(xié)調(diào)發(fā)展研究[D];南京師范大學(xué);2015年
3 郝景芳;基于面板數(shù)據(jù)引力模型的中國對(duì)外貿(mào)易研究[D];清華大學(xué);2012年
4 朱海霞;基于引力模型的中美農(nóng)產(chǎn)品貿(mào)易邊境效應(yīng)模型研究[D];上海交通大學(xué);2008年
5 何偉;基于引力模型的中國食用油籽貿(mào)易影響因素及貿(mào)易潛力研究[D];中國農(nóng)業(yè)科學(xué)院;2011年
6 張英濤;生產(chǎn)外包與區(qū)域經(jīng)濟(jì)合作:理論和實(shí)證研究[D];南開大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 鄭翔;基于引力模型的區(qū)域經(jīng)濟(jì)聯(lián)系的測度與實(shí)證分析[D];浙江工商大學(xué);2015年
2 JUNAID KAMAL(卡馬爾);巴基斯坦雙邊貿(mào)易影響因素研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2015年
3 陳娜娜;中國與哈薩克斯坦雙邊貨物貿(mào)易潛力研究[D];新疆大學(xué);2015年
4 任媛;中國與主要貿(mào)易伙伴雙邊貿(mào)易成本的測度與分析[D];陜西師范大學(xué);2015年
5 韓笑;中國貨物貿(mào)易出口量的影響因素[D];合肥工業(yè)大學(xué);2015年
6 赫慧慧;加入TPP:順勢而為亦或另取爐灶[D];安徽大學(xué);2016年
7 馬苓苓;基于引力模型識(shí)別復(fù)雜網(wǎng)絡(luò)中有影響力的傳播者[D];安徽大學(xué);2016年
8 吳沁;中國與“一帶一路”國家貿(mào)易潛力研究[D];南京大學(xué);2016年
9 陳三景;中哈貿(mào)易密切度分析及貿(mào)易潛力測算[D];新疆財(cái)經(jīng)大學(xué);2016年
10 許智云;福建省高新技術(shù)產(chǎn)品國際貿(mào)易現(xiàn)狀分析與前景展望[D];福州大學(xué);2014年
,本文編號(hào):1296027
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1296027.html