層次性多示例多標(biāo)記學(xué)習(xí)算法的研究
發(fā)布時(shí)間:2021-01-03 16:58
多示例多標(biāo)記學(xué)習(xí)是機(jī)器學(xué)習(xí)中解決實(shí)際問(wèn)題時(shí)常見(jiàn)的學(xué)習(xí)框架。在過(guò)去,學(xué)習(xí)對(duì)象由一個(gè)示例(即屬性向量)描述且對(duì)應(yīng)于一個(gè)類別標(biāo)記,但是隨著問(wèn)題的復(fù)雜性和事物的多變性,一個(gè)樣本可以由多個(gè)示例組成,同時(shí)該樣本屬于多個(gè)類別標(biāo)記,這種問(wèn)題的學(xué)習(xí)就是多示例多標(biāo)記學(xué)習(xí)框架。隨著科技的飛速發(fā)展,大數(shù)據(jù)時(shí)代日益逼近,深入研究多示例多標(biāo)記學(xué)習(xí)算法具有很大的現(xiàn)實(shí)意義。現(xiàn)實(shí)很多多示例多標(biāo)記學(xué)習(xí)應(yīng)用中,標(biāo)記之間是有關(guān)聯(lián)的,并且很多應(yīng)用場(chǎng)景下,標(biāo)記呈現(xiàn)層次性樹(shù)(TREE)結(jié)構(gòu)或者有向無(wú)環(huán)圖(DAG,Directed Acyclic Graph)結(jié)構(gòu)。但是目前對(duì)多示例多標(biāo)記研究時(shí)往往忽略了標(biāo)記之間的層次依賴性,迫切需要開(kāi)發(fā)一種可以考慮這種層次性標(biāo)記關(guān)系的全新多示例多標(biāo)記學(xué)習(xí)方法。所以本論文將提出兩種基于層次性結(jié)構(gòu)的多示例多標(biāo)記學(xué)習(xí)算法,即基于樹(shù)結(jié)構(gòu)、有向無(wú)環(huán)圖結(jié)構(gòu)的多示例多標(biāo)記學(xué)習(xí)算法。算法充分考慮了標(biāo)記之間的層次性結(jié)構(gòu),提高了算法的效率,并擴(kuò)大了多示例多標(biāo)記學(xué)習(xí)的應(yīng)用范圍。本文把算法應(yīng)用于G蛋白偶聯(lián)受體的生物學(xué)功能預(yù)測(cè),由于GO(Gene Ontology)標(biāo)記通常可表示為兩種層次性結(jié)構(gòu),即樹(shù)和有向無(wú)環(huán)圖結(jié)構(gòu),所以在...
【文章來(lái)源】:南京郵電大學(xué)江蘇省
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
多示例多標(biāo)記(MIML)學(xué)習(xí)樣例
多示例多標(biāo)記學(xué)習(xí)框架的提出和定義多示例多標(biāo)記學(xué)習(xí)框架的提出是為了解決對(duì)象具有多義性的問(wèn)題,因?yàn)檫@種多重含義的對(duì)象通常具有難以理解的內(nèi)涵,所以如果只用一個(gè)示例特征向量來(lái)描述,那么未免太過(guò)簡(jiǎn)化。這也使得在特征描述的時(shí)候丟失掉了重要的信息,那么之后在進(jìn)行模型訓(xùn)練時(shí)將帶來(lái)更大的挑戰(zhàn)和困難。舉些例子來(lái)說(shuō),在圖像分類問(wèn)題中,如圖 2.1,一幅圖片往往可以分割為多個(gè)具有特定含義且相對(duì)獨(dú)立的部分,我們用一個(gè)示例來(lái)描述每一個(gè)部分,這樣,多個(gè)示例組成的集合就可以描述一副圖片,與此同時(shí),該副圖像可能隸屬于多個(gè)類別標(biāo)記。在文檔分類中,根據(jù)其各部分表達(dá)含義的不同,將文檔劃分為若干部分,每個(gè)部分用一個(gè)示例來(lái)描述,這樣,一個(gè)文檔就可以表示成多個(gè)示例的集合,而該文檔在從不同的角度進(jìn)行思考時(shí),可能同時(shí)隸屬于多個(gè)類別標(biāo)記;在生物信息學(xué)中,基因或者蛋白質(zhì)的每個(gè)特征可以由一個(gè)示例進(jìn)行表示,而基因或者蛋白質(zhì)本身往往隸屬于多個(gè)生物學(xué)功能。
輸出空間的映射,這種映射可以表示為 :2 → 2時(shí)映射函數(shù)可以表示為 : × 2 → 1, + ( ) = ( ),此時(shí) = ( ), :2 →假設(shè)數(shù)據(jù)樣本為 ,并且 的概念類別標(biāo)記集合為Y = ( ( )) 學(xué)習(xí)是多示例學(xué)習(xí)和多標(biāo)記學(xué)習(xí)的具體化實(shí)例,監(jiān)督學(xué)習(xí)問(wèn)題來(lái)解決。監(jiān)督學(xué)習(xí)概論中是一個(gè)示例: × → 1, + 1 ,那么可以通過(guò)以下公式習(xí)問(wèn)題,即: ( ) = , = +1
【參考文獻(xiàn)】:
期刊論文
[1]數(shù)據(jù)挖掘綜述[J]. 王光宏,蔣平. 同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2004(02)
本文編號(hào):2955166
【文章來(lái)源】:南京郵電大學(xué)江蘇省
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
多示例多標(biāo)記(MIML)學(xué)習(xí)樣例
多示例多標(biāo)記學(xué)習(xí)框架的提出和定義多示例多標(biāo)記學(xué)習(xí)框架的提出是為了解決對(duì)象具有多義性的問(wèn)題,因?yàn)檫@種多重含義的對(duì)象通常具有難以理解的內(nèi)涵,所以如果只用一個(gè)示例特征向量來(lái)描述,那么未免太過(guò)簡(jiǎn)化。這也使得在特征描述的時(shí)候丟失掉了重要的信息,那么之后在進(jìn)行模型訓(xùn)練時(shí)將帶來(lái)更大的挑戰(zhàn)和困難。舉些例子來(lái)說(shuō),在圖像分類問(wèn)題中,如圖 2.1,一幅圖片往往可以分割為多個(gè)具有特定含義且相對(duì)獨(dú)立的部分,我們用一個(gè)示例來(lái)描述每一個(gè)部分,這樣,多個(gè)示例組成的集合就可以描述一副圖片,與此同時(shí),該副圖像可能隸屬于多個(gè)類別標(biāo)記。在文檔分類中,根據(jù)其各部分表達(dá)含義的不同,將文檔劃分為若干部分,每個(gè)部分用一個(gè)示例來(lái)描述,這樣,一個(gè)文檔就可以表示成多個(gè)示例的集合,而該文檔在從不同的角度進(jìn)行思考時(shí),可能同時(shí)隸屬于多個(gè)類別標(biāo)記;在生物信息學(xué)中,基因或者蛋白質(zhì)的每個(gè)特征可以由一個(gè)示例進(jìn)行表示,而基因或者蛋白質(zhì)本身往往隸屬于多個(gè)生物學(xué)功能。
輸出空間的映射,這種映射可以表示為 :2 → 2時(shí)映射函數(shù)可以表示為 : × 2 → 1, + ( ) = ( ),此時(shí) = ( ), :2 →假設(shè)數(shù)據(jù)樣本為 ,并且 的概念類別標(biāo)記集合為Y = ( ( )) 學(xué)習(xí)是多示例學(xué)習(xí)和多標(biāo)記學(xué)習(xí)的具體化實(shí)例,監(jiān)督學(xué)習(xí)問(wèn)題來(lái)解決。監(jiān)督學(xué)習(xí)概論中是一個(gè)示例: × → 1, + 1 ,那么可以通過(guò)以下公式習(xí)問(wèn)題,即: ( ) = , = +1
【參考文獻(xiàn)】:
期刊論文
[1]數(shù)據(jù)挖掘綜述[J]. 王光宏,蔣平. 同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2004(02)
本文編號(hào):2955166
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2955166.html
最近更新
教材專著