天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

面向代價(jià)敏感多標(biāo)記數(shù)據(jù)的特征選擇研究

發(fā)布時(shí)間:2020-12-06 18:28
  隨著大數(shù)據(jù)時(shí)代的發(fā)展,數(shù)據(jù)量呈現(xiàn)爆發(fā)式增長(zhǎng),數(shù)據(jù)的形式復(fù)雜多樣,數(shù)據(jù)的語(yǔ)義日益豐富,特別是多標(biāo)記高維數(shù)據(jù)的廣泛存在,傳統(tǒng)的單標(biāo)記分類(lèi)將一個(gè)樣本只歸為某一個(gè)標(biāo)記中,導(dǎo)致無(wú)法描述當(dāng)一個(gè)樣本屬于多個(gè)標(biāo)記的問(wèn)題,需利用多標(biāo)記分類(lèi)來(lái)描述此類(lèi)數(shù)據(jù)資源,對(duì)于多標(biāo)記數(shù)據(jù)的分析和挖掘已成為機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域的研究熱點(diǎn)之一。由于多標(biāo)記高維數(shù)據(jù)的維數(shù)災(zāi)難問(wèn)題嚴(yán)重影響多標(biāo)記學(xué)習(xí)的分類(lèi)性能。因此,針對(duì)多標(biāo)記學(xué)習(xí)的特征選擇研究顯得尤為重要。當(dāng)前對(duì)于多標(biāo)記數(shù)據(jù)的特征選擇研究大多是針對(duì)完備性數(shù)據(jù),但在許多應(yīng)用領(lǐng)域中連續(xù)型數(shù)值數(shù)據(jù)較多,且由于診測(cè)成本和隱私保護(hù)等因素導(dǎo)致數(shù)據(jù)往往呈現(xiàn)出不完備性。另外,數(shù)據(jù)的獲取往往需要花費(fèi)代價(jià),為解決上述問(wèn)題,研究面向代價(jià)敏感多標(biāo)記數(shù)據(jù)的特征選擇模型與算法,下面簡(jiǎn)單概括本文的創(chuàng)新點(diǎn):首先,針對(duì)多標(biāo)記數(shù)據(jù)的不完備性,提出了一種面向多標(biāo)記不完備數(shù)據(jù)的特征選擇算法。該算法將鄰域粗糙集模型應(yīng)用于多標(biāo)記不完備數(shù)據(jù)的特征選擇中,根據(jù)容差鄰域閾值求解多標(biāo)記不完備數(shù)據(jù)的鄰域粒度,并基于鄰域粒度給出了度量多標(biāo)記不完備數(shù)據(jù)的特征重要性準(zhǔn)則,以此設(shè)計(jì)了多標(biāo)記不完備數(shù)據(jù)的特征選擇算法。該算法能夠有效地處理多... 

【文章來(lái)源】:江西農(nóng)業(yè)大學(xué)江西省

【文章頁(yè)數(shù)】:72 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

面向代價(jià)敏感多標(biāo)記數(shù)據(jù)的特征選擇研究


單標(biāo)記學(xué)習(xí)問(wèn)題

照片,多標(biāo)記,學(xué)習(xí)問(wèn)題


隨著互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的迅速普及,數(shù)據(jù)量呈爆發(fā)式增長(zhǎng),如何對(duì)數(shù)據(jù)進(jìn)行有效地分析和利用已發(fā)展成為大數(shù)據(jù)時(shí)代亟待解決的問(wèn)題,而機(jī)器學(xué)習(xí)恰好順應(yīng)了大數(shù)據(jù)時(shí)代的迫切需求,且被廣泛應(yīng)用于許多實(shí)際生活領(lǐng)域,例如數(shù)據(jù)挖掘、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理、天氣預(yù)報(bào)、能源勘探、環(huán)境監(jiān)測(cè)、生物特征識(shí)別、搜索引擎、醫(yī)學(xué)診斷、檢測(cè)信用卡欺詐、證券市場(chǎng)分析、商業(yè)營(yíng)銷(xiāo)、DNA 序列測(cè)序、語(yǔ)音和手寫(xiě)識(shí)別、戰(zhàn)略游戲和機(jī)器人運(yùn)用等領(lǐng)域,并取得巨大成就。常見(jiàn)的機(jī)器學(xué)習(xí)方法包括監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)這三種,其中,在實(shí)際應(yīng)用中較為常用的方法是監(jiān)督學(xué)習(xí),其對(duì)應(yīng)的訓(xùn)練數(shù)據(jù)是具有給定標(biāo)記的。在傳統(tǒng)的有監(jiān)督學(xué)習(xí)框架中,每個(gè)樣本的相關(guān)類(lèi)別標(biāo)記具有唯一性[1](如圖 1.1 所示),此類(lèi)問(wèn)題被稱(chēng)為單標(biāo)記學(xué)習(xí)問(wèn)題。例如,在我們挑選西瓜的過(guò)程中,通過(guò)西瓜的“色澤”、“根蒂”和“敲聲”可以判斷西瓜是否為好瓜(如表 1.1 所示)。然而,隨著數(shù)據(jù)規(guī)模、數(shù)據(jù)維度的快速增長(zhǎng)以及數(shù)據(jù)標(biāo)注結(jié)構(gòu)的復(fù)雜度的增加,現(xiàn)實(shí)生活中存在的實(shí)例具有多義性的問(wèn)題,即每個(gè)樣本在一個(gè)特征向量下,可能同時(shí)隸屬于多個(gè)類(lèi)別標(biāo)記(如圖 1.2 所示),人們將這種多義性問(wèn)題的學(xué)習(xí)框架稱(chēng)為多標(biāo)記學(xué)習(xí)問(wèn)題。例如,在為一張照片添加標(biāo)簽的的時(shí)候,照片中同時(shí)包括“天空”、“房屋”、“湖水”和“樹(shù)木”(如圖 1.3 所示)。

多標(biāo)記


圖 1.3 多標(biāo)記示例圖記學(xué)習(xí)問(wèn)題通常被應(yīng)用于描述復(fù)雜場(chǎng)景,例如,一篇文檔可能同時(shí)屬于“計(jì)算機(jī)”、“數(shù)學(xué)”和“生物”;在圖像標(biāo)注中,一幅圖片可能同時(shí)標(biāo)水”和“樹(shù)”;在音樂(lè)情感分析中,一首歌曲可能同時(shí)被標(biāo)注為“歡樂(lè)”激情”;在生物信息學(xué)中,每段基因可能同時(shí)具有多種功能,如“蛋白陳代謝”和“轉(zhuǎn)錄”等。隨著多標(biāo)記在文本分類(lèi)[2-4]、圖像視頻自動(dòng)標(biāo)注[11-13]和生物分類(lèi)[14-16]等領(lǐng)域的廣泛應(yīng)用,多標(biāo)記學(xué)習(xí)受到越來(lái)越多研究成為機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘和模式識(shí)別等領(lǐng)域的研究熱點(diǎn)之一。數(shù)學(xué)家 Pawlak 教授于 1982 年提出的粗糙集理論是一種用于處理不精相容知識(shí)的數(shù)學(xué)工具[17],近年來(lái),該理論在機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域得用[18,19]。屬性約簡(jiǎn),又稱(chēng)特征選擇,是粗糙集理論的核心內(nèi)容之一,其分類(lèi)能力不變的條件下,刪除不相關(guān)或冗余特征。與單標(biāo)記學(xué)習(xí)一樣,面臨著“維數(shù)災(zāi)難”的挑戰(zhàn)。高維數(shù)據(jù)不僅影響算法的執(zhí)行效率,也降分類(lèi)性能,而特征降維技術(shù)是解決維數(shù)災(zāi)難的有效方法。目前,針對(duì)單征降維技術(shù)的研究較為廣泛,而針對(duì)多標(biāo)記數(shù)據(jù)的特征降維技術(shù)的研究此,基于多標(biāo)記學(xué)習(xí)特征選擇的研究[20-24]具有重要的理論和應(yīng)用意義

【參考文獻(xiàn)】:
期刊論文
[1]一種結(jié)合類(lèi)別權(quán)重及多示例的多標(biāo)記學(xué)習(xí)改進(jìn)算法[J]. 楊小健,王杉杉,李榮雨.  小型微型計(jì)算機(jī)系統(tǒng). 2017(04)
[2]基于局部子空間的多標(biāo)記特征選擇算法[J]. 劉景華,林夢(mèng)雷,王晨曦,林耀進(jìn).  模式識(shí)別與人工智能. 2016(03)
[3]基于決策粗糙集的多標(biāo)記情緒分類(lèi)[J]. 張志飛,苗奪謙,張紅云.  模式識(shí)別與人工智能. 2015(08)
[4]共享子空間的多標(biāo)記學(xué)習(xí)方法[J]. 楊柳,鄒珊,于劍,景麗萍.  計(jì)算機(jī)科學(xué)與探索. 2015(08)
[5]基于鄰域粗糙集的多標(biāo)記分類(lèi)特征選擇算法[J]. 段潔,胡清華,張靈均,錢(qián)宇華,李德玉.  計(jì)算機(jī)研究與發(fā)展. 2015(01)
[6]一類(lèi)基于信息熵的多標(biāo)簽特征選擇算法[J]. 張振海,李士寧,李志剛,陳昊.  計(jì)算機(jī)研究與發(fā)展. 2013(06)
[7]一種面向人臉識(shí)別的加權(quán)代價(jià)敏感局部保持投影[J]. 萬(wàn)建武,楊明,吉根林,陳銀娟.  軟件學(xué)報(bào). 2013(05)
[8]廣義鄰域關(guān)系下不完備混合決策系統(tǒng)的約簡(jiǎn)[J]. 徐久成,張靈均,孫林,李雙群.  計(jì)算機(jī)科學(xué). 2013(04)
[9]基于信息熵的核屬性增量式高效更新算法[J]. 錢(qián)文彬,楊炳儒,徐章艷,張長(zhǎng)勝.  模式識(shí)別與人工智能. 2013(01)
[10]面向非完備決策表的正向近似特征選擇加速算法[J]. 錢(qián)宇華,梁吉業(yè),王鋒.  計(jì)算機(jī)學(xué)報(bào). 2011(03)



本文編號(hào):2901838

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2901838.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a6525***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com