視覺顯著性檢測方法及應(yīng)用研究
發(fā)布時(shí)間:2021-06-17 06:13
隨著多媒體信息技術(shù)的發(fā)展,人們獲取和分享圖片的數(shù)量急劇增加,利用計(jì)算機(jī)自動分析和理解圖片內(nèi)容成為計(jì)算機(jī)視覺領(lǐng)域亟待解決的問題。顯著性檢測作為圖像內(nèi)容分析的關(guān)鍵技術(shù),可以快速獲取圖片中最感興趣的區(qū)域,為計(jì)算機(jī)提供簡潔、有效的內(nèi)容信息,是解決圖像分類、檢索和壓縮等諸多視覺任務(wù)的關(guān)鍵步驟。顯著性檢測經(jīng)過二十年的發(fā)展,出現(xiàn)了眾多性能優(yōu)異的算法。然而,現(xiàn)實(shí)世界中圖片數(shù)量規(guī)模巨大、圖像內(nèi)容多樣、復(fù)雜、實(shí)際應(yīng)用場景特定,如何快速有效地利用先驗(yàn)知識、準(zhǔn)確地檢測顯著性區(qū)域、精確地評估顯著譜質(zhì)量以增強(qiáng)算法的魯棒性、利用顯著性解決實(shí)際應(yīng)用依然是此方向有待解決的問題。在此背景下,本文基于顯著性檢測方法及其應(yīng)用展開研究,探索了預(yù)處理階段對象性先驗(yàn)快速生成方法、顯著譜生成階段基于背景的顯著性檢測方法、后處理階段基于無參考質(zhì)量評價(jià)網(wǎng)絡(luò)的顯著譜挑選方法、顯著性檢測在廣告視頻分類以及廣告數(shù)據(jù)篩選中的應(yīng)用。具體研究內(nèi)容和主要貢獻(xiàn)如下:1.針對預(yù)處理階段潛在對象生成計(jì)算復(fù)雜度高的問題,提出了一種基于邊緣方向統(tǒng)計(jì)的對象窗生成方法。從通用對象屬性和計(jì)算效率的角度出發(fā),分析了利用邊緣方向判別對象的可行性,設(shè)計(jì)了一種基于邊緣方向統(tǒng)...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:122 頁
【學(xué)位級別】:博士
【部分圖文】:
圖2-4兩種塊內(nèi)邊緣方向模板
8×8 image block圖 2-5 收集的對象窗內(nèi)所有塊邊緣模板的分布情況因此,使用最常出現(xiàn) 16 種的邊緣方向模板來分類圖像邊緣。圖2-6顯示了從文獻(xiàn)[94]中選取的 16 種邊緣方向模板。從圖2-6可以看出,這 16 種邊緣方向滿足多樣性的特點(diǎn),使用此 16 種邊緣模板可以滿足構(gòu)成一個(gè)閉合的對象輪廓的要求。15
BING 方法運(yùn)行時(shí)間 Ta,本章測試 BING 方法運(yùn)行時(shí)間為 Tb,根據(jù)設(shè)備間的差異,兩種運(yùn)行時(shí)間關(guān)系為 Rt= Ta/Tb。設(shè)文獻(xiàn) [96] 提供的其他方法運(yùn)行時(shí)間為 ya, 其算法在本設(shè)備上運(yùn)行時(shí)間的線性映射值為 yb, 則 yb= ya/Rt,得到的時(shí)間作為該方法的運(yùn)行時(shí)間。表 2-3 平均運(yùn)行時(shí)間比較結(jié)果方法 OBJ SS CPMC BING EB Our時(shí)間(秒) 0.45 2 50 0.04 0.06 0.03表2-3顯示本章方法與現(xiàn)有方法檢測一張圖片所需的平均時(shí)間。其中,本章方法運(yùn)行時(shí)間最短, 僅需 0.03 秒,少于其他方法如 SS(2 秒)、CPMC(50 秒)等。而在運(yùn)行速度上與本章方法最接近的方法是 BING,該方法運(yùn)行一張圖片所需時(shí)間為0.04 秒。另外,本章方法在生成對象窗質(zhì)量上明顯優(yōu)于 BING,而且在一定范圍IOU 閾值下本章方法與 CPMC 性能相當(dāng)?shù)\(yùn)行時(shí)間只有 CPMC 的萬分之一。上述結(jié)果表明,本章方法具有較少的運(yùn)行時(shí)間,同時(shí)可以生成質(zhì)量較高的對象窗。
本文編號:3234641
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:122 頁
【學(xué)位級別】:博士
【部分圖文】:
圖2-4兩種塊內(nèi)邊緣方向模板
8×8 image block圖 2-5 收集的對象窗內(nèi)所有塊邊緣模板的分布情況因此,使用最常出現(xiàn) 16 種的邊緣方向模板來分類圖像邊緣。圖2-6顯示了從文獻(xiàn)[94]中選取的 16 種邊緣方向模板。從圖2-6可以看出,這 16 種邊緣方向滿足多樣性的特點(diǎn),使用此 16 種邊緣模板可以滿足構(gòu)成一個(gè)閉合的對象輪廓的要求。15
BING 方法運(yùn)行時(shí)間 Ta,本章測試 BING 方法運(yùn)行時(shí)間為 Tb,根據(jù)設(shè)備間的差異,兩種運(yùn)行時(shí)間關(guān)系為 Rt= Ta/Tb。設(shè)文獻(xiàn) [96] 提供的其他方法運(yùn)行時(shí)間為 ya, 其算法在本設(shè)備上運(yùn)行時(shí)間的線性映射值為 yb, 則 yb= ya/Rt,得到的時(shí)間作為該方法的運(yùn)行時(shí)間。表 2-3 平均運(yùn)行時(shí)間比較結(jié)果方法 OBJ SS CPMC BING EB Our時(shí)間(秒) 0.45 2 50 0.04 0.06 0.03表2-3顯示本章方法與現(xiàn)有方法檢測一張圖片所需的平均時(shí)間。其中,本章方法運(yùn)行時(shí)間最短, 僅需 0.03 秒,少于其他方法如 SS(2 秒)、CPMC(50 秒)等。而在運(yùn)行速度上與本章方法最接近的方法是 BING,該方法運(yùn)行一張圖片所需時(shí)間為0.04 秒。另外,本章方法在生成對象窗質(zhì)量上明顯優(yōu)于 BING,而且在一定范圍IOU 閾值下本章方法與 CPMC 性能相當(dāng)?shù)\(yùn)行時(shí)間只有 CPMC 的萬分之一。上述結(jié)果表明,本章方法具有較少的運(yùn)行時(shí)間,同時(shí)可以生成質(zhì)量較高的對象窗。
本文編號:3234641
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3234641.html
最近更新
教材專著