基于多視角學(xué)習(xí)和遷移學(xué)習(xí)的分類方法及應(yīng)用研究
發(fā)布時間:2021-10-05 00:34
由于現(xiàn)今時代處于信息爆炸時期,機(jī)器學(xué)習(xí)也因此獲得了重大的發(fā)展,尤其在聚類、分類和回歸等領(lǐng)域獲得了階級式的跨越。分類仍舊是現(xiàn)今機(jī)器學(xué)習(xí)中最重要的研究領(lǐng)域之一,其在語義分析、圖像識別、人臉識別等實(shí)際應(yīng)用場景中發(fā)揮著重要的作用。然而,隨著社會的不斷發(fā)展和進(jìn)步以及計算機(jī)領(lǐng)域的革新,數(shù)據(jù)量不斷增大,很多新興數(shù)據(jù)的應(yīng)用場景不斷被擴(kuò)充,也因此帶來了很多傳統(tǒng)機(jī)器學(xué)習(xí)方法所無法適應(yīng)的新問題:收集的數(shù)據(jù)形式多種多樣,且其內(nèi)在關(guān)系結(jié)構(gòu)較為復(fù)雜;收集到的有標(biāo)記數(shù)據(jù)的數(shù)量十分有限。這些可能會造成經(jīng)典的分類方法應(yīng)用于這些場景時無法適應(yīng),因而面臨更加嚴(yán)酷的挑戰(zhàn):一方面數(shù)據(jù)多樣性增加,已有的經(jīng)典分類方法會忽略各種形式的數(shù)據(jù)的內(nèi)在關(guān)系,進(jìn)而導(dǎo)致此類方法在處理這種數(shù)據(jù)時無法得到滿意的效果;另一方面由于可收集的有標(biāo)記樣本的嚴(yán)重缺乏,使得傳統(tǒng)分類方法對此類數(shù)據(jù)直接進(jìn)行處理建模時無法獲得較好的泛化能力,效果較差。因此,本課題主要解決在新興數(shù)據(jù)的挑戰(zhàn)下,如何將經(jīng)典的機(jī)器學(xué)習(xí)分類算法進(jìn)行拓展,以期能夠應(yīng)對新興數(shù)據(jù)應(yīng)用場景中出現(xiàn)的上述問題,最終得到更好的分類性能。為了解決經(jīng)典的分類方法在上述提到的新興數(shù)據(jù)應(yīng)用場景中所需應(yīng)對的挑戰(zhàn),本...
【文章來源】:江南大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁數(shù)】:111 頁
【學(xué)位級別】:博士
【部分圖文】:
人工智能與其他學(xué)科及領(lǐng)域的關(guān)系示意圖
習(xí)方法進(jìn)行研究并改進(jìn),以期得到能夠解決新興數(shù)據(jù)應(yīng)用場景中的問題的更加智能的方法。機(jī)器學(xué)習(xí)是通過特定的算法來分析處理數(shù)據(jù),并學(xué)習(xí)總結(jié)規(guī)律,以此對真實(shí)世界的未知事件作出預(yù)判和決策。較傳統(tǒng)算法中只具備解決特定問題的硬編碼程序不同,機(jī)器學(xué)習(xí)具有更強(qiáng)的“學(xué)習(xí)”能力,以提前“訓(xùn)練”大量數(shù)據(jù)來獲取預(yù)判未知的能力,具體過程如下:首先選擇數(shù)據(jù),即將原始數(shù)據(jù)分為訓(xùn)練、驗(yàn)證和測試三部分,然后使用訓(xùn)練數(shù)據(jù)來構(gòu)建相應(yīng)的模型,之后將驗(yàn)證數(shù)據(jù)用于驗(yàn)證模型的有效性,然后在測試數(shù)據(jù)上測試模型最終的性能表現(xiàn)。下面通過圖1-2來形象化展示機(jī)器學(xué)習(xí)的工作流程。圖1-2機(jī)器學(xué)習(xí)工作流程Fig.1-2Theprocessofmachinelearning機(jī)器學(xué)習(xí)是在早期人工智能發(fā)展起來的,其包括決策樹[8]、邏輯回歸[10]、聚類[24]和強(qiáng)化學(xué)習(xí)[28]等。眾所周知,我們還沒有實(shí)現(xiàn)強(qiáng)人工智能,而早期機(jī)器學(xué)習(xí)方法甚至都無法實(shí)現(xiàn)
江南大學(xué)博士學(xué)位論文4弱人工智能。但經(jīng)過多年的發(fā)展,已經(jīng)產(chǎn)生了很多基于機(jī)器學(xué)習(xí)的經(jīng)典方法,按照數(shù)據(jù)有無標(biāo)簽,可以將機(jī)器學(xué)習(xí)做如下的三種劃分:1)監(jiān)督學(xué)習(xí)(SupervisedLearning)[6-7],是一種利用已知類別的樣本調(diào)整分類器的參數(shù),從而達(dá)到所需性能的的學(xué)習(xí)方式,這種方式既有數(shù)據(jù)也有標(biāo)簽。常見的監(jiān)督式學(xué)習(xí)有:回歸和分類;貧w(Regression)[6]:其通過對預(yù)先給定的數(shù)據(jù)集中的函數(shù)和坐標(biāo)點(diǎn)進(jìn)行學(xué)習(xí),運(yùn)用模型估計給定數(shù)據(jù)集的函數(shù),并求得一個最符合給定數(shù)據(jù)集的函數(shù)表達(dá)式。然后我們即可利用創(chuàng)建的模型(即函數(shù)表達(dá)式)來預(yù)估輸入新的自變量時,會輸出的數(shù)據(jù)。其中,作為輸入的是特征向量,輸出的是標(biāo)簽,且標(biāo)簽值是連續(xù)的;分類(Classification)[7]:通過對給定的數(shù)據(jù)集的特征向量和其標(biāo)簽的學(xué)習(xí),實(shí)現(xiàn)對未知標(biāo)簽的特征向量的數(shù)據(jù)的標(biāo)簽給定。它和回歸的最大區(qū)別就是看輸出結(jié)果是離散還是連續(xù)的。圖1-3顯示的是分類的形象化示例。圖1-3分類形象化示例Fig.1-3Visualizationexampleofclassification常用算法有:決策樹[8]、線性回歸[9]、邏輯回歸[10]、K-近鄰[11]、樸素貝葉斯[12]、隨機(jī)森林[13]、支持向量機(jī)[14]、模糊系統(tǒng)[15]和神經(jīng)網(wǎng)絡(luò)[16]等。圖1-4聚類形象化示例Fig.1-4Anexampleofclustering
【參考文獻(xiàn)】:
期刊論文
[1]基于劃分自適應(yīng)融合的多視角模糊聚類算法[J]. 鄧趙紅,張丹丹,蔣亦樟,劉解放,王士同. 控制與決策. 2016(04)
[2]熵加權(quán)多視角協(xié)同劃分模糊聚類算法[J]. 蔣亦樟,鄧趙紅,王駿,錢鵬江,王士同. 軟件學(xué)報. 2014(10)
本文編號:3418644
【文章來源】:江南大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁數(shù)】:111 頁
【學(xué)位級別】:博士
【部分圖文】:
人工智能與其他學(xué)科及領(lǐng)域的關(guān)系示意圖
習(xí)方法進(jìn)行研究并改進(jìn),以期得到能夠解決新興數(shù)據(jù)應(yīng)用場景中的問題的更加智能的方法。機(jī)器學(xué)習(xí)是通過特定的算法來分析處理數(shù)據(jù),并學(xué)習(xí)總結(jié)規(guī)律,以此對真實(shí)世界的未知事件作出預(yù)判和決策。較傳統(tǒng)算法中只具備解決特定問題的硬編碼程序不同,機(jī)器學(xué)習(xí)具有更強(qiáng)的“學(xué)習(xí)”能力,以提前“訓(xùn)練”大量數(shù)據(jù)來獲取預(yù)判未知的能力,具體過程如下:首先選擇數(shù)據(jù),即將原始數(shù)據(jù)分為訓(xùn)練、驗(yàn)證和測試三部分,然后使用訓(xùn)練數(shù)據(jù)來構(gòu)建相應(yīng)的模型,之后將驗(yàn)證數(shù)據(jù)用于驗(yàn)證模型的有效性,然后在測試數(shù)據(jù)上測試模型最終的性能表現(xiàn)。下面通過圖1-2來形象化展示機(jī)器學(xué)習(xí)的工作流程。圖1-2機(jī)器學(xué)習(xí)工作流程Fig.1-2Theprocessofmachinelearning機(jī)器學(xué)習(xí)是在早期人工智能發(fā)展起來的,其包括決策樹[8]、邏輯回歸[10]、聚類[24]和強(qiáng)化學(xué)習(xí)[28]等。眾所周知,我們還沒有實(shí)現(xiàn)強(qiáng)人工智能,而早期機(jī)器學(xué)習(xí)方法甚至都無法實(shí)現(xiàn)
江南大學(xué)博士學(xué)位論文4弱人工智能。但經(jīng)過多年的發(fā)展,已經(jīng)產(chǎn)生了很多基于機(jī)器學(xué)習(xí)的經(jīng)典方法,按照數(shù)據(jù)有無標(biāo)簽,可以將機(jī)器學(xué)習(xí)做如下的三種劃分:1)監(jiān)督學(xué)習(xí)(SupervisedLearning)[6-7],是一種利用已知類別的樣本調(diào)整分類器的參數(shù),從而達(dá)到所需性能的的學(xué)習(xí)方式,這種方式既有數(shù)據(jù)也有標(biāo)簽。常見的監(jiān)督式學(xué)習(xí)有:回歸和分類;貧w(Regression)[6]:其通過對預(yù)先給定的數(shù)據(jù)集中的函數(shù)和坐標(biāo)點(diǎn)進(jìn)行學(xué)習(xí),運(yùn)用模型估計給定數(shù)據(jù)集的函數(shù),并求得一個最符合給定數(shù)據(jù)集的函數(shù)表達(dá)式。然后我們即可利用創(chuàng)建的模型(即函數(shù)表達(dá)式)來預(yù)估輸入新的自變量時,會輸出的數(shù)據(jù)。其中,作為輸入的是特征向量,輸出的是標(biāo)簽,且標(biāo)簽值是連續(xù)的;分類(Classification)[7]:通過對給定的數(shù)據(jù)集的特征向量和其標(biāo)簽的學(xué)習(xí),實(shí)現(xiàn)對未知標(biāo)簽的特征向量的數(shù)據(jù)的標(biāo)簽給定。它和回歸的最大區(qū)別就是看輸出結(jié)果是離散還是連續(xù)的。圖1-3顯示的是分類的形象化示例。圖1-3分類形象化示例Fig.1-3Visualizationexampleofclassification常用算法有:決策樹[8]、線性回歸[9]、邏輯回歸[10]、K-近鄰[11]、樸素貝葉斯[12]、隨機(jī)森林[13]、支持向量機(jī)[14]、模糊系統(tǒng)[15]和神經(jīng)網(wǎng)絡(luò)[16]等。圖1-4聚類形象化示例Fig.1-4Anexampleofclustering
【參考文獻(xiàn)】:
期刊論文
[1]基于劃分自適應(yīng)融合的多視角模糊聚類算法[J]. 鄧趙紅,張丹丹,蔣亦樟,劉解放,王士同. 控制與決策. 2016(04)
[2]熵加權(quán)多視角協(xié)同劃分模糊聚類算法[J]. 蔣亦樟,鄧趙紅,王駿,錢鵬江,王士同. 軟件學(xué)報. 2014(10)
本文編號:3418644
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3418644.html
最近更新
教材專著