天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

基于主動學(xué)習(xí)的標(biāo)簽噪聲清洗方法研究

發(fā)布時間:2022-12-07 03:24
  隨著互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)的快速發(fā)展和廣泛使用,人們獲取到的數(shù)據(jù)的規(guī)模也在不斷增長,如何從數(shù)據(jù)中提取有價值的信息變得越來越重要。機(jī)器學(xué)習(xí)作為一種數(shù)據(jù)挖掘與分析的重要技術(shù),其目的是從數(shù)據(jù)中挖掘關(guān)鍵信息,利用已有信息對未知信息進(jìn)行預(yù)測,從而更好地為人們提供決策依據(jù)。監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)中的主要學(xué)習(xí)方式之一,而標(biāo)簽是監(jiān)督學(xué)習(xí)的關(guān)鍵特征,對模型的訓(xùn)練起著至關(guān)重要的作用,F(xiàn)實(shí)生活中的數(shù)據(jù)由于在標(biāo)記標(biāo)簽過程中受一些主觀因素的限制,如專業(yè)領(lǐng)域知識的限制、人為標(biāo)記錯誤等的影響,導(dǎo)致數(shù)據(jù)中可能存在一定程度的標(biāo)簽噪聲,從而對模型產(chǎn)生嚴(yán)重的負(fù)面影響,因此,提高訓(xùn)練樣本數(shù)據(jù)的標(biāo)簽質(zhì)量對監(jiān)督學(xué)習(xí)具有重要意義。目前,對標(biāo)簽噪聲的處理大都是對樣本進(jìn)行噪聲識別后直接過濾,這種處理標(biāo)簽噪聲的方法雖然簡單,但當(dāng)數(shù)據(jù)中噪聲樣本含量較高時,丟棄這些噪聲樣本會造成數(shù)據(jù)信息的缺失。本文針對標(biāo)簽噪聲過濾可能會丟棄過多樣本這一問題,結(jié)合主動學(xué)習(xí)方法,對分類問題的標(biāo)簽噪聲識別與處理方法開展研究。主要內(nèi)容概括如下:(1)提出基于主動學(xué)習(xí)的標(biāo)簽噪聲清洗方法ALNC(Active Label Noise Cleaning)。針對去除大量噪聲樣本時... 

【文章頁數(shù)】:52 頁

【學(xué)位級別】:碩士

【文章目錄】:
中文摘要
ABSTRACT
第一章 引言
    1.1 研究背景
    1.2 國內(nèi)外研究現(xiàn)狀
    1.3 論文的主要工作
    1.4 論文結(jié)構(gòu)
第二章 背景知識
    2.1 主動學(xué)習(xí)簡介
    2.2 采樣方法簡介
    2.3 本章小結(jié)
第三章 標(biāo)簽噪聲主動清洗
    3.1 基于主動學(xué)習(xí)的標(biāo)簽噪聲清洗方法
        3.1.1 ALNC算法原理
        3.1.2 ALNC算法步驟
    3.2 實(shí)驗(yàn)結(jié)果與分析
        3.2.1 實(shí)驗(yàn)數(shù)據(jù)
        3.2.2 實(shí)驗(yàn)參數(shù)
        3.2.3 實(shí)驗(yàn)結(jié)果
    3.3 本章小結(jié)
第四章 基于采樣的標(biāo)簽噪聲主動清洗
    4.1 基于SPXY采樣的標(biāo)簽噪聲主動清洗方法
        4.1.1 SPXY_ALNC算法原理
        4.1.2 SPXY_ALNC算法步驟
    4.2 實(shí)驗(yàn)結(jié)果與分析
        4.2.1 實(shí)驗(yàn)數(shù)據(jù)
        4.2.2 實(shí)驗(yàn)參數(shù)
        4.2.3 實(shí)驗(yàn)結(jié)果
    4.3 本章小結(jié)
第五章 總結(jié)與展望
參考文獻(xiàn)
攻讀學(xué)位期間取得的研究成果
致謝
個人簡況及聯(lián)系方式


【參考文獻(xiàn)】:
期刊論文
[1]基于主動學(xué)習(xí)的標(biāo)簽噪聲清洗方法[J]. 孟曉超,姜高霞,王文劍.  陜西師范大學(xué)學(xué)報(自然科學(xué)版). 2020(02)
[2]基于數(shù)據(jù)分布的標(biāo)簽噪聲過濾[J]. 陳慶強(qiáng),王文劍,姜高霞.  清華大學(xué)學(xué)報(自然科學(xué)版). 2019(04)
[3]采樣方法研究綜述[J]. 宋壽鵬,邵勇華,堵瑩.  數(shù)據(jù)采集與處理. 2016(03)
[4]一種任意維Line-Sweep計(jì)算的數(shù)據(jù)劃分算法[J]. 王鵬,邱楓,張為華,臧斌宇,朱傳琪.  計(jì)算機(jī)學(xué)報. 2012(12)
[5]主動學(xué)習(xí)算法綜述[J]. 劉康,錢旭,王自強(qiáng).  計(jì)算機(jī)工程與應(yīng)用. 2012(34)
[6]最小最大模塊化網(wǎng)絡(luò)中基于聚類的數(shù)據(jù)劃分方法研究[J]. 解曉敏,李云.  南京大學(xué)學(xué)報(自然科學(xué)版). 2012(02)
[7]重采樣方法與機(jī)器學(xué)習(xí)[J]. 畢華,梁洪力,王玨.  計(jì)算機(jī)學(xué)報. 2009(05)
[8]SPXY樣本劃分法及蒙特卡羅交叉驗(yàn)證結(jié)合近紅外光譜用于橘葉中橙皮苷的含量測定[J]. 展曉日,朱向榮,史新元,張卓勇,喬延江.  光譜學(xué)與光譜分析. 2009(04)
[9]發(fā)酵過程中神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本的選取[J]. 李運(yùn)鋒,袁景淇,薛耀鋒.  化工自動化及儀表. 2004(06)



本文編號:3712143

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3712143.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4d837***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com