天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

多標記特征選擇及其類屬屬性獲取算法

發(fā)布時間:2021-04-11 21:27
  近年來,大數據技術以及人工智能技術得到了高速的發(fā)展,同時也推動了多標記學習的發(fā)展,多標記學習逐漸被諸多學者和專家列入重點的研究課題并在這方面取得了非常不錯的成績。其中,多標記特征選擇也在數據挖掘和機器學習中得到了越來越多的關注,而且已經提出了大量的算法來實現特征空間的降維,并成功地應用于多種領域。多標記特征選擇的目的就是實現特征降維,選擇具有高度鑒別能力的特征,來實現相關性最大化與冗余性最小化。與多標記特征提取不同,特征選擇是從原始特征空間中選擇特征,不進行任何變換,很好地保留了原始特征的物理意義,在可讀性和可解釋性方面,多標記特征選擇算法已成為許多研究者關注的焦點。在多數特征選擇算法中主要利用信息熵等方法判斷相關性,利用條件概率判斷冗余性,這些方法不僅需要先驗知識,而且計算較為復雜。并且進行多標記特征選擇時,標記具有其本身所獨有的屬性,這些獨有的屬性對于標記具有很強的判別能力,因此,加強對類屬屬性的研究,可以更加高效地開展多標記學習,基于上述問題,本文提出了兩種特征選擇算法,主要內容如下:(1)本文利用粗糙集隸屬度與肯德爾相關系數進行特征選擇。粗糙集計算的特點就是不需要先驗知識,對數... 

【文章來源】:安慶師范大學安徽省

【文章頁數】:52 頁

【學位級別】:碩士

【部分圖文】:

多標記特征選擇及其類屬屬性獲取算法


單標記學習樣例

沙子,問題


21.2國內外研究現狀在傳統(tǒng)的單標記學習過程中,我們所認為的真實世界,它的每一個對象只存在一個類別標記與之對應,例如圖1.1我們只把它標記為“兔子”,沒有了其它標記。但是我們知道在現實的世界中,每一個對象都具有很多種類別屬性,存在很多的類別標記,即屬于多標記的類別標記。例如圖1.2,我們可以把圖片做出多個標記,如“天空”,“海水”,“沙子”等。圖1.1單標記學習樣例多標記問題在我們的實際生活中也是非常常見的,例如在文本分類中,一篇文章可能被標記為“地理”,“歷史”類文章;在風景分類中,一張圖片可能被標注為“鮮花”或“樹林”;在一篇“當前政治會議對經濟的影響”的新聞報道中,我們可以把這篇報道標記為“政治”或“經濟”新聞來表現出這兩方面的相關性等等。隨著我們時代的快速發(fā)展,我們生產生活所產生的數據也在不斷地增加,數據的復雜化使得傳統(tǒng)對象的語義變得不唯一,單一語義的單標記學習完全不能滿足數據發(fā)展的要求。越來越多的國內外學者開始廣泛關注于多標記對象的多義性特點。在多標記學習過程中,一個對象可以對應多種解釋,我們就把這些多種解釋,標注為合理的類別標記,即標記子集。作為一種學習建模工具,多標記學習框架應運而生[9]。圖1.2多標記學習樣例與單標記不同,多標記學習問題在我們的學習、生產、生活中有著非常多的應用,在建立多義性對象學習模型方面扮演著非常重要的角色,F在在很多的領域多標記都有著廣泛的應用,比如在文本分類[10-11]、情感分析[12-13]、生物信息學[14]和圖像視頻自動標注[15]等方面,其中最早出現于文檔分類中所遇見的歧義性問天空海水沙子兔子

流程圖,特征選擇,流程


9術的應用與開發(fā),提高數據運行的準確性和運行效率,來完善特征選擇方法,體現一定的應用價值。在機器學習的相關領域中,特征數量一般會比較高,因此不相關的特征勢必會對特征產生不同程度的影響,不同的特征之間也會出現一定程度的依賴性,可能會產生一些不理想的后果,具體表述為:(1)特征個數與之前相比逐漸增加,導致特征的分析以及模型的訓練時間不斷延長。(2)特征個數的不斷增加為“維度災難”的產生提供了條件,導致模型逐漸趨向復雜化發(fā)展,對其推廣能力產生嚴重的影響?偟膩碇v,不同類型與屬性的新搜索算法為特征選擇算法的應用與實踐提供了有力的支持與保障,再加上評估標準的不斷完善,推動了特征選擇算法的發(fā)展與進步。特征選擇方法流程圖,(如圖2.1所示)。特征選擇方法大致可以分成三種不同類型:過濾式(filter)、包裹式(wrapper)和嵌入式(embedding)。圖2.1特征選擇一般流程2.3.1過濾式選擇(filter)過濾式方法的特征選擇過程中,(如圖2.2所示),需要基于數據集完成特征的正確選擇,再選擇合適的訓練學習器。借助特征的有效選擇完成初試特征的快速“過濾”,以完成過濾處理后的特征為基礎,對模型進行訓練。

【參考文獻】:
期刊論文
[1]基于標記增強的多標記代價敏感特征選擇算法[J]. 黃錦濤,錢文彬,王映龍.  小型微型計算機系統(tǒng). 2020(04)
[2]基于標記相關性的多標記三支分類算法[J]. 余鷹,吳新念,王樂為,張應龍.  山東大學學報(理學版). 2020(03)
[3]不平衡訓練數據下的基于深度學習的文本分類[J]. 陳志,郭武.  小型微型計算機系統(tǒng). 2020(01)
[4]基于專家特征的條件互信息多標記特征選擇算法[J]. 程玉勝,宋帆,王一賓,錢坤.  計算機應用. 2020(02)
[5]基于標簽相關性的類屬屬性多標簽分類算法[J]. 牟甲鵬,蔡劍,余孟池,徐建.  計算機應用研究. 2020(09)
[6]多標簽學習中基于互信息的快速特征選擇方法[J]. 徐洪峰,孫振強.  計算機應用. 2019(10)
[7]彈性網絡核極限學習機的多標記學習算法[J]. 王一賓,裴根生,程玉勝.  智能系統(tǒng)學報. 2019(04)
[8]文本分類TF-IDF算法的改進研究[J]. 葉雪梅,毛雪岷,夏錦春,王波.  計算機工程與應用. 2019(02)
[9]基于稀疏表示的視頻目標跟蹤研究綜述[J]. 黃宏圖,畢篤彥,侯志強,胡長城,高山,查宇飛,庫濤.  自動化學報. 2018(10)
[10]基于粗糙集的數據流多標記分布特征選擇[J]. 程玉勝,陳飛,王一賓.  計算機應用. 2018(11)



本文編號:3131987

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3131987.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶13e14***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com