地學(xué)信息工程專業(yè)優(yōu)秀論文 面向非均衡數(shù)據(jù)集的機(jī)器學(xué)習(xí)及在地學(xué)數(shù)據(jù)處理中
本文關(guān)鍵詞:面向非均衡數(shù)據(jù)集的機(jī)器學(xué)習(xí)及在地學(xué)數(shù)據(jù)處理中的應(yīng)用,由筆耕文化傳播整理發(fā)布。
文檔介紹:
【精品】畢業(yè)論文優(yōu)秀畢業(yè)論文本科論文專業(yè)學(xué)術(shù)論文參考文獻(xiàn)資料地學(xué)信息工程專業(yè)優(yōu)秀論文面向非均衡數(shù)據(jù)集的機(jī)器學(xué)習(xí)及在地學(xué)數(shù)據(jù)處理中的應(yīng)用關(guān)鍵詞:地質(zhì)數(shù)據(jù)庫數(shù)據(jù)挖掘人工智能機(jī)器學(xué)習(xí)摘要:分類是數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的重要任務(wù)之一,傳統(tǒng)的機(jī)器學(xué)習(xí)分類研究大多基于如下假設(shè):(1)以高總體分類正確率為目標(biāo);(2)數(shù)據(jù)集中的各類樣本數(shù)目基本均衡;(3)所有的分類錯誤會帶來相同的錯誤代價;谶@些假設(shè),人們研究了大量的分類算法如決策樹算法、貝葉斯分類、人工神經(jīng)網(wǎng)絡(luò)、K-近鄰算法、支持向量機(jī)、遺傳算法等,并將其廣泛應(yīng)用于醫(yī)學(xué)診斷、信息檢索、文本分類等眾多應(yīng)用領(lǐng)域。然而,真實(shí)世界的分類問題存在很多類別非均衡的情況,數(shù)據(jù)集中某個類別的樣本數(shù)可能會遠(yuǎn)多于其他類別。在這些情況下,分類器通常會傾向于將測試樣本全部判別為大類而忽視小類樣本,這使得到的分類器在小類樣本上效果會變得很差。不平衡數(shù)據(jù)集自身的特點(diǎn)(少數(shù)類數(shù)據(jù)的絕對缺乏和相對缺乏、數(shù)據(jù)碎片、噪聲)以及傳統(tǒng)分類算法的局限性(不恰當(dāng)?shù)脑u價標(biāo)準(zhǔn)和不恰當(dāng)?shù)臍w納偏置)是對不平衡數(shù)據(jù)集進(jìn)行準(zhǔn)確可靠分類的關(guān)鍵制約因素。因此,對不平衡數(shù)據(jù)集的分類問題已成為機(jī)器學(xué)習(xí)和模式識別領(lǐng)域中新的研究熱點(diǎn),是對傳統(tǒng)分類...
內(nèi)容來自轉(zhuǎn)載請標(biāo)明出處.
本文關(guān)鍵詞:面向非均衡數(shù)據(jù)集的機(jī)器學(xué)習(xí)及在地學(xué)數(shù)據(jù)處理中的應(yīng)用,,由筆耕文化傳播整理發(fā)布。
本文編號:110468
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/110468.html