天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于Faster R-CNN戲曲卡通人物識(shí)別的研究

發(fā)布時(shí)間:2021-11-27 04:26
  戲曲作為中國獨(dú)特的舞臺(tái)藝術(shù)形式,有著數(shù)百年的歷史。由于文化多元化的發(fā)展,導(dǎo)致傳統(tǒng)戲曲漸漸衰落。近年,制作的戲曲動(dòng)畫易被人們接受,從而可以通過把戲曲人物卡通化,來吸引人們喜歡并了解戲曲。因此,結(jié)合戲曲卡通人物與目標(biāo)識(shí)別技術(shù),對(duì)目標(biāo)進(jìn)行分類識(shí)別,能夠幫助人們快速認(rèn)識(shí)每個(gè)戲曲卡通人物,為這個(gè)藝術(shù)門類培養(yǎng)更多的觀眾和演員,這對(duì)于戲曲的傳承保護(hù)具有重要意義。目前,目標(biāo)分類識(shí)別在諸多方面的研究已經(jīng)取得可喜的成果,但是在戲曲卡通人物的檢測識(shí)別上的研究還鮮有人涉及,本文運(yùn)用基于特征提取網(wǎng)絡(luò)Res Net50的Faster R-CNN算法對(duì)戲曲卡通人物進(jìn)行檢測識(shí)別,再融合特征金字塔網(wǎng)絡(luò)(Feature Pyramid Networks)并對(duì)網(wǎng)絡(luò)進(jìn)行改進(jìn),取得了很好的識(shí)別效果。主要研究內(nèi)容如下:(1)數(shù)據(jù)集的制作本文實(shí)驗(yàn)所用數(shù)據(jù)集是從網(wǎng)絡(luò)搜索相關(guān)圖片以及拍攝收藏的戲曲玩偶為基礎(chǔ)進(jìn)行制作。因?yàn)?收集到的圖片數(shù)量有限,運(yùn)用了數(shù)據(jù)增強(qiáng)技術(shù),對(duì)圖片數(shù)量進(jìn)行擴(kuò)充;再對(duì)每張圖片手工標(biāo)注。制作了第一個(gè)完整的戲曲人物數(shù)據(jù)集。(2)基于Faster R-CNN算法,融合特征金字塔網(wǎng)絡(luò)的戲曲卡通人物識(shí)別本文運(yùn)用基于特征提取網(wǎng)... 

【文章來源】:湖南師范大學(xué)湖南省 211工程院校

【文章頁數(shù)】:65 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于Faster R-CNN戲曲卡通人物識(shí)別的研究


圖2-1兩階段檢測算法整體流程

結(jié)構(gòu)圖,結(jié)構(gòu)圖,算法,區(qū)域


碩士學(xué)位論文8圖2-1流程分析:首先輸入一張圖片,接著經(jīng)過卷積神經(jīng)網(wǎng)絡(luò),通過卷積神經(jīng)網(wǎng)絡(luò)對(duì)圖片進(jìn)行深度特征的提取,這個(gè)卷積神經(jīng)網(wǎng)絡(luò)稱為主干網(wǎng)絡(luò),典型的主干網(wǎng)絡(luò)有VGGNet,ResNet,Zenet等。接著,通過區(qū)域生成網(wǎng)絡(luò)(RPN)產(chǎn)生候選區(qū)域,同時(shí)會(huì)完成區(qū)域的分類,即將圖片分為背景和目標(biāo)這樣兩種不同的類別,也會(huì)對(duì)目標(biāo)位置進(jìn)行初步的預(yù)測。然后對(duì)候選區(qū)域中的位置框進(jìn)行調(diào)整,使用RoI_pooling層,通俗講此層為“摳圖”的意思,通過RoI_pooling層可以避免重復(fù)計(jì)算CNN特征。再將摳圖所得到的候選區(qū)域目標(biāo)映射到特征圖上相應(yīng)區(qū)域,經(jīng)過全連接層,來得到特征向量,最后通過分類和回歸實(shí)現(xiàn)對(duì)候選目標(biāo)類別的判定和目標(biāo)位置的確定[41]。目前,應(yīng)用較多的兩階段檢測識(shí)別算法為FasterR-CNN。先產(chǎn)生目標(biāo)候選框,再對(duì)候選框進(jìn)行分類。R-CNN族算法的發(fā)展進(jìn)步,使目標(biāo)檢測識(shí)別的流程越來越簡練,精度越來越高,速度也有了很大的提升。2.2R-CNN族2.2.1R-CNNR-CNN的出現(xiàn),擴(kuò)大了深度學(xué)習(xí)的應(yīng)用領(lǐng)域。它使用了CNN較好的特征提取和分類性能,通過候選區(qū)域選擇來實(shí)現(xiàn)問題的轉(zhuǎn)化。R-CNN生成proposals采用的是SelectiveSearch,主要通過顏色、邊緣等從下至上對(duì)圖像進(jìn)行分割。再對(duì)分割區(qū)域進(jìn)行不同尺度的合并,每生成一個(gè)區(qū)域即為候選區(qū)域[42],該算法工作原理如圖2-2所示:圖2-2R-CNN算法結(jié)構(gòu)圖(1)輸入圖像:輸入待檢測的圖像,送入網(wǎng)絡(luò);

結(jié)構(gòu)圖,結(jié)構(gòu)圖,原理,全連接


碩士學(xué)位論文10段訓(xùn)練的,過程極其耗費(fèi)時(shí)間和空間。FastR-CNN整合了深度網(wǎng)絡(luò),支持向量機(jī)(SVM)分類。實(shí)驗(yàn)證明:在PascalVOC數(shù)據(jù)集上,F(xiàn)astR-CNN的訓(xùn)練時(shí)間較R-CNN縮短了8/9。網(wǎng)絡(luò)結(jié)構(gòu)如圖2-3所示:圖2-3FastR-CNN原理結(jié)構(gòu)圖從圖2-3分析得知,F(xiàn)astR-CNN的輸入由兩部分組成:①等待處理的圖像;②候選區(qū)域(regionproposal)。在處理時(shí),首先卷積核池化獲取特征圖。因?yàn)闀?huì)有多個(gè)候選區(qū)域,這時(shí)系統(tǒng)會(huì)有一個(gè)甄別,即判斷RoI。RoI池化層可以提取到特征向量,每一個(gè)特征向量,都會(huì)被輸送到全連接層的序列當(dāng)中,全連接層有兩個(gè)輸出層。其中一層用來分類,輸出的是每個(gè)RoI的概率分布,產(chǎn)生幾個(gè)對(duì)象類概率估計(jì);另一層產(chǎn)生每個(gè)對(duì)象類坐標(biāo)信息。在圖像分類研究中,卷積層計(jì)算比較費(fèi)時(shí)。但是對(duì)于檢測識(shí)別來說,運(yùn)用selectivesearch算法來提取,會(huì)出現(xiàn)比較多的候選框,在前向計(jì)算中,全連接層計(jì)算則比較費(fèi)時(shí)。采用SVD對(duì)全連接層進(jìn)行分解,加速計(jì)算,SVD實(shí)現(xiàn)如圖2-4:圖2-4SVD分解加速實(shí)現(xiàn)以往實(shí)驗(yàn)表明:SVD分解全連接層的方法確實(shí)可以提升速度。此外,F(xiàn)astR-CNN對(duì)圖片采用中心化采樣:先采樣,然后在得到的采樣圖像上再對(duì)候選區(qū)域


本文編號(hào):3521550

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/huanjingshejilunwen/3521550.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶abbfa***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com