安檢違禁品圖像生成與評(píng)價(jià)網(wǎng)絡(luò)模型研究
發(fā)布時(shí)間:2021-08-03 00:53
近年來,行李安檢X光圖像中違禁品自動(dòng)檢測(cè)任務(wù)受到了廣泛的關(guān)注,這對(duì)維護(hù)公共交通安全,提升安檢效率具有重要意義。隨著深度學(xué)習(xí)的快速發(fā)展,基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的安檢X光違禁品自動(dòng)檢測(cè)的研究取得了不小的進(jìn)展。然而帶有違禁品的行李安檢X光圖像不易獲得,這使得目前存在的安檢X光圖像數(shù)據(jù)集中的正樣本很難訓(xùn)練出一個(gè)可靠的CNN模型。為解決安檢X光圖像數(shù)據(jù)集較小的問題,提出了一種基于生成式對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Network,GAN)模型的X光違禁品圖像生成的方法。主要研究?jī)?nèi)容如下:1)構(gòu)建了兩個(gè)安檢數(shù)據(jù)集:X光違禁品圖像數(shù)據(jù)集和行李安檢X光圖像數(shù)據(jù)集,并對(duì)這兩個(gè)安檢數(shù)據(jù)集進(jìn)行了預(yù)處理以及對(duì)其特點(diǎn)進(jìn)行分析。2)構(gòu)建了基于改進(jìn)GAN模型的X光違禁品圖像生成網(wǎng)絡(luò)。通過改進(jìn)GAN模型的網(wǎng)絡(luò)結(jié)構(gòu)以及損失函數(shù),使得改進(jìn)GAN模型能夠適用于生成X光違禁品圖像。結(jié)合真實(shí)安檢數(shù)據(jù)集定性和定量分析,判斷不同GAN模型的性能優(yōu)劣。基于該模型生成了大量質(zhì)量高多樣性豐富的無背景X光違禁品圖像,有背景X光違禁品圖像和高分辨率行李安...
【文章來源】:中國民航大學(xué)天津市
【文章頁數(shù)】:70 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
安檢X光機(jī)實(shí)物圖
中國民航大學(xué)碩士學(xué)位論文25的GAN模型進(jìn)行定量的評(píng)估,F(xiàn)ID分?jǐn)?shù)越低,生成圖像的質(zhì)量和多樣性越好,反之依然。3.3.2不同生成模型的實(shí)驗(yàn)結(jié)果如圖3-5所示,對(duì)比了6個(gè)GAN模型生成的不同視覺質(zhì)量的圖像,其中以手槍和水果刀為例,并且為了方便視覺對(duì)比,都選擇同一個(gè)方向的違禁品。圖3-5不同GAN模型生成的圖像第一個(gè)模型是深度卷積生成對(duì)抗網(wǎng)絡(luò)(DCGAN)[33]。可以發(fā)現(xiàn)DCGAN生成的圖像與真實(shí)圖像相比,具有大量的噪聲,沒有紋理信息并且部分圖像嚴(yán)重失真無法辨認(rèn)。第二種模型是帶有鉸鏈損耗(Hinge)函數(shù)[66]的DCGAN。與DCGAN生成的圖像相比,圖像質(zhì)量有較小的提高,但仍然存在噪聲并且違禁品外形扭曲。第三種模型是SAGAN[35],該模型生成的圖像幾乎沒有噪聲,但X光違禁物品圖像的外形輪廓扭曲,并且生成的圖像多樣性較為單一。第四和第五種模型是WGAN-GP和WGAN-LP[34],圖像質(zhì)量有所提高,紋理信息更加的豐富,外形輪廓更加合理,人們能夠通過這些紋理信息和外形輪廓來判斷違禁品的放置位置,但是部分違禁物品的圖像邊緣模糊。最后是改進(jìn)GAN模型,與其他模型相比,改進(jìn)的GAN模型生成圖像的視覺質(zhì)量有了明顯提高。
本文編號(hào):3318608
【文章來源】:中國民航大學(xué)天津市
【文章頁數(shù)】:70 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
安檢X光機(jī)實(shí)物圖
中國民航大學(xué)碩士學(xué)位論文25的GAN模型進(jìn)行定量的評(píng)估,F(xiàn)ID分?jǐn)?shù)越低,生成圖像的質(zhì)量和多樣性越好,反之依然。3.3.2不同生成模型的實(shí)驗(yàn)結(jié)果如圖3-5所示,對(duì)比了6個(gè)GAN模型生成的不同視覺質(zhì)量的圖像,其中以手槍和水果刀為例,并且為了方便視覺對(duì)比,都選擇同一個(gè)方向的違禁品。圖3-5不同GAN模型生成的圖像第一個(gè)模型是深度卷積生成對(duì)抗網(wǎng)絡(luò)(DCGAN)[33]。可以發(fā)現(xiàn)DCGAN生成的圖像與真實(shí)圖像相比,具有大量的噪聲,沒有紋理信息并且部分圖像嚴(yán)重失真無法辨認(rèn)。第二種模型是帶有鉸鏈損耗(Hinge)函數(shù)[66]的DCGAN。與DCGAN生成的圖像相比,圖像質(zhì)量有較小的提高,但仍然存在噪聲并且違禁品外形扭曲。第三種模型是SAGAN[35],該模型生成的圖像幾乎沒有噪聲,但X光違禁物品圖像的外形輪廓扭曲,并且生成的圖像多樣性較為單一。第四和第五種模型是WGAN-GP和WGAN-LP[34],圖像質(zhì)量有所提高,紋理信息更加的豐富,外形輪廓更加合理,人們能夠通過這些紋理信息和外形輪廓來判斷違禁品的放置位置,但是部分違禁物品的圖像邊緣模糊。最后是改進(jìn)GAN模型,與其他模型相比,改進(jìn)的GAN模型生成圖像的視覺質(zhì)量有了明顯提高。
本文編號(hào):3318608
本文鏈接:http://sikaile.net/guanlilunwen/xiangmuguanli/3318608.html
最近更新
教材專著