基于機(jī)器學(xué)習(xí)視覺目標(biāo)分類識別方法研究
發(fā)布時間:2021-09-07 17:22
隨著計算機(jī)技術(shù)的不斷發(fā)展以及人們公共安全意識的日益加深,機(jī)器視覺目標(biāo)分類識別在圖像與視頻分析方面受到廣泛關(guān)注,其智能化要求越來越受到人們重視。論文在廣泛閱讀與調(diào)研國內(nèi)外相關(guān)研究的基礎(chǔ)上,針對目前機(jī)器學(xué)習(xí)視覺目標(biāo)分類識別存在的相關(guān)問題與不足,對視覺目標(biāo)分類、運(yùn)動目標(biāo)表征與識別以及視頻行為預(yù)測等方面開展了深入研究。論文主要特色與貢獻(xiàn)體現(xiàn)在如下方面:提出了一種基于機(jī)器學(xué)習(xí)的古陶瓷無損分類識別方法。采用差分鏈碼獲取古陶瓷旋轉(zhuǎn)、平移不變特征,在此基礎(chǔ)上,確定古陶瓷邊緣輪廓曲率,獲取結(jié)構(gòu)細(xì)節(jié)特征,并在HSI顏色空間下提取古陶瓷釉色多通道顏色特征以及反映古陶瓷紋理多樣性的紋飾LBP特征。綜合上述視覺特征對不同時期古陶瓷進(jìn)行斷代分析。實(shí)驗(yàn)結(jié)果表明,所提方法具有魯棒的無損分類識別性能,可為古陶瓷科技鑒定和數(shù)字博物館建設(shè)發(fā)揮積極作用。提出了一種基于邊緣時空域軌跡的視頻運(yùn)動目標(biāo)表征方法。為有效描述不同運(yùn)動模式下視覺行為的演化過程,將具有類似時空和運(yùn)動特征的各種邊緣軌跡視為一組骨架,同時引入基于幅度和方向信息的編碼方法對這些運(yùn)動邊緣軌跡進(jìn)行聚類,獲取時空運(yùn)動骨架描述子,從而充分考慮時空軌跡對之間的運(yùn)動相似性。...
【文章來源】:上海大學(xué)上海市 211工程院校
【文章頁數(shù)】:144 頁
【學(xué)位級別】:博士
【部分圖文】:
古陶瓷視覺結(jié)構(gòu)特征提取示意圖
上海大學(xué)博士學(xué)位論文2612()()cos2()()(B)RGRBHRGRBG(2-3)其中,RG或RB;若BG,則H2H。R、G、B分別為原古陶瓷釉色中RGB顏色空間的三通道顏色值。Smax(R,G,B)min(R,G,B)(2-4)1()3IRBG(2-5)對HSI顏色空間三分量進(jìn)行如下非均勻量化:0,[316,20]1,[21,40]2,[41,75]0,[0,0.2]0,[0,0.2]3,[76,155]1,[0.2,0.7]1,[0.2,0.7]4,[159,190]2,[0.7,01]2,[0.7,01]5,[191,270]6,[271,295]7,[296,315]hhhsihHSsIihsihhh(2-6)圖2-2古陶瓷釉色直方圖特征提取流程框圖2.2.3基于局部二值模式紋飾特征提取古陶瓷紋飾構(gòu)圖優(yōu)美、內(nèi)涵豐富,不同的紋飾圖案特征往往代表著不同的文化習(xí)俗和風(fēng)土人情,蘊(yùn)含著豐富信息。如何提取有效的古陶瓷紋飾圖案信息,在古陶瓷分類識別中起著舉足輕重的作用。LBP作為一種紋理描述算子,已被廣泛用于紋理分類、人臉識別及圖像檢索等領(lǐng)域[13],它具有良好的旋轉(zhuǎn)不變性和灰度不變性,因此,基于LBP能提取代表古陶瓷紋飾圖像的本質(zhì)特征。其中,提取古陶瓷紋飾LBP特征如下:遍歷古陶瓷紋飾圖像中每一像素3×3鄰域,將該鄰域周圍的8個像素點(diǎn)灰度值與該
上海大學(xué)博士學(xué)位論文27鄰域中心像素點(diǎn)灰度值做比較,大于或等于中心灰度值的點(diǎn)用1表示,反之用0,以此類推,沿順時針方向得到的8個二進(jìn)制值作為該鄰域中心的特征值,并以直方圖形式統(tǒng)計整個區(qū)域每個特征值數(shù)量,作為古陶器紋飾的圖案特征描述子,如圖2-3所示。圖2-3古陶瓷紋飾圖案LBP特征提取圖2-4為來自古陶瓷紋飾數(shù)據(jù)庫中2個不同作者所繪制的鴛鴦紋飾局部圖及其與之對應(yīng)的LBP特征圖。由圖2-4可以看出:不同作者繪制水彩鴛鴦圖案LBP特征圖具有較明顯差異。圖2-4不同作者繪制的水彩鴛鴦紋飾局部圖及其與之對應(yīng)的LBP特征圖2.3基于廣義回歸神經(jīng)網(wǎng)絡(luò)古陶瓷多元特征分類2.3.1GRNN網(wǎng)絡(luò)原理廣義回歸神經(jīng)網(wǎng)絡(luò)(GeneralizedRegressionNeuralNetwork,GRNN)是以數(shù)理統(tǒng)計為基礎(chǔ)的一種人工神經(jīng)網(wǎng)絡(luò),由DonaldF.Specht于1991年提出[118]。
【參考文獻(xiàn)】:
期刊論文
[1]基于多特征融合的運(yùn)動想象腦電信號識別研究[J]. 姜月,鄒任玲. 中國醫(yī)學(xué)物理學(xué)雜志. 2019(05)
[2]融合均勻局部二元模式和稀疏表示的人臉識別[J]. 高洪濤,郜亞麗. 計算機(jī)工程與設(shè)計. 2019(03)
[3]基于興趣點(diǎn)統(tǒng)計特征的雙人交互行為預(yù)測算法[J]. 姬曉飛,謝旋. 計算機(jī)技術(shù)與發(fā)展. 2019(07)
[4]視頻行為識別綜述[J]. 羅會蘭,王嬋娟,盧飛. 通信學(xué)報. 2018(06)
[5]基于深度學(xué)習(xí)的視頻預(yù)測研究綜述[J]. 莫凌飛,蔣紅亮,李煊鵬. 智能系統(tǒng)學(xué)報. 2018(01)
[6]深度學(xué)習(xí)在目標(biāo)視覺檢測中的應(yīng)用進(jìn)展與展望[J]. 張慧,王坤峰,王飛躍. 自動化學(xué)報. 2017(08)
[7]面向智能監(jiān)控攝像頭的監(jiān)控視頻大數(shù)據(jù)分析處理[J]. 邵振峰,蔡家駿,王中元,馬照亭. 電子與信息學(xué)報. 2017(05)
[8]神經(jīng)網(wǎng)絡(luò)七十年:回顧與展望[J]. 焦李成,楊淑媛,劉芳,王士剛,馮志璽. 計算機(jī)學(xué)報. 2016(08)
[9]數(shù)字化碗類器型結(jié)構(gòu)及其應(yīng)用[J]. 熊露,唐敏,李其江,吳琳,葉正隆. 陶瓷學(xué)報. 2015(04)
[10]智慧城市中的大數(shù)據(jù)[J]. 李德仁,姚遠(yuǎn),邵振峰. 武漢大學(xué)學(xué)報(信息科學(xué)版). 2014(06)
博士論文
[1]復(fù)雜人體行為分析的時空上下文方法研究[D]. 許萬茹.北京交通大學(xué) 2018
[2]視頻序列中的人體動作識別[D]. 陳淵博.北京郵電大學(xué) 2015
碩士論文
[1]基于多特征的人體行為識別的研究[D]. 徐陳晨.南京郵電大學(xué) 2017
本文編號:3389949
【文章來源】:上海大學(xué)上海市 211工程院校
【文章頁數(shù)】:144 頁
【學(xué)位級別】:博士
【部分圖文】:
古陶瓷視覺結(jié)構(gòu)特征提取示意圖
上海大學(xué)博士學(xué)位論文2612()()cos2()()(B)RGRBHRGRBG(2-3)其中,RG或RB;若BG,則H2H。R、G、B分別為原古陶瓷釉色中RGB顏色空間的三通道顏色值。Smax(R,G,B)min(R,G,B)(2-4)1()3IRBG(2-5)對HSI顏色空間三分量進(jìn)行如下非均勻量化:0,[316,20]1,[21,40]2,[41,75]0,[0,0.2]0,[0,0.2]3,[76,155]1,[0.2,0.7]1,[0.2,0.7]4,[159,190]2,[0.7,01]2,[0.7,01]5,[191,270]6,[271,295]7,[296,315]hhhsihHSsIihsihhh(2-6)圖2-2古陶瓷釉色直方圖特征提取流程框圖2.2.3基于局部二值模式紋飾特征提取古陶瓷紋飾構(gòu)圖優(yōu)美、內(nèi)涵豐富,不同的紋飾圖案特征往往代表著不同的文化習(xí)俗和風(fēng)土人情,蘊(yùn)含著豐富信息。如何提取有效的古陶瓷紋飾圖案信息,在古陶瓷分類識別中起著舉足輕重的作用。LBP作為一種紋理描述算子,已被廣泛用于紋理分類、人臉識別及圖像檢索等領(lǐng)域[13],它具有良好的旋轉(zhuǎn)不變性和灰度不變性,因此,基于LBP能提取代表古陶瓷紋飾圖像的本質(zhì)特征。其中,提取古陶瓷紋飾LBP特征如下:遍歷古陶瓷紋飾圖像中每一像素3×3鄰域,將該鄰域周圍的8個像素點(diǎn)灰度值與該
上海大學(xué)博士學(xué)位論文27鄰域中心像素點(diǎn)灰度值做比較,大于或等于中心灰度值的點(diǎn)用1表示,反之用0,以此類推,沿順時針方向得到的8個二進(jìn)制值作為該鄰域中心的特征值,并以直方圖形式統(tǒng)計整個區(qū)域每個特征值數(shù)量,作為古陶器紋飾的圖案特征描述子,如圖2-3所示。圖2-3古陶瓷紋飾圖案LBP特征提取圖2-4為來自古陶瓷紋飾數(shù)據(jù)庫中2個不同作者所繪制的鴛鴦紋飾局部圖及其與之對應(yīng)的LBP特征圖。由圖2-4可以看出:不同作者繪制水彩鴛鴦圖案LBP特征圖具有較明顯差異。圖2-4不同作者繪制的水彩鴛鴦紋飾局部圖及其與之對應(yīng)的LBP特征圖2.3基于廣義回歸神經(jīng)網(wǎng)絡(luò)古陶瓷多元特征分類2.3.1GRNN網(wǎng)絡(luò)原理廣義回歸神經(jīng)網(wǎng)絡(luò)(GeneralizedRegressionNeuralNetwork,GRNN)是以數(shù)理統(tǒng)計為基礎(chǔ)的一種人工神經(jīng)網(wǎng)絡(luò),由DonaldF.Specht于1991年提出[118]。
【參考文獻(xiàn)】:
期刊論文
[1]基于多特征融合的運(yùn)動想象腦電信號識別研究[J]. 姜月,鄒任玲. 中國醫(yī)學(xué)物理學(xué)雜志. 2019(05)
[2]融合均勻局部二元模式和稀疏表示的人臉識別[J]. 高洪濤,郜亞麗. 計算機(jī)工程與設(shè)計. 2019(03)
[3]基于興趣點(diǎn)統(tǒng)計特征的雙人交互行為預(yù)測算法[J]. 姬曉飛,謝旋. 計算機(jī)技術(shù)與發(fā)展. 2019(07)
[4]視頻行為識別綜述[J]. 羅會蘭,王嬋娟,盧飛. 通信學(xué)報. 2018(06)
[5]基于深度學(xué)習(xí)的視頻預(yù)測研究綜述[J]. 莫凌飛,蔣紅亮,李煊鵬. 智能系統(tǒng)學(xué)報. 2018(01)
[6]深度學(xué)習(xí)在目標(biāo)視覺檢測中的應(yīng)用進(jìn)展與展望[J]. 張慧,王坤峰,王飛躍. 自動化學(xué)報. 2017(08)
[7]面向智能監(jiān)控攝像頭的監(jiān)控視頻大數(shù)據(jù)分析處理[J]. 邵振峰,蔡家駿,王中元,馬照亭. 電子與信息學(xué)報. 2017(05)
[8]神經(jīng)網(wǎng)絡(luò)七十年:回顧與展望[J]. 焦李成,楊淑媛,劉芳,王士剛,馮志璽. 計算機(jī)學(xué)報. 2016(08)
[9]數(shù)字化碗類器型結(jié)構(gòu)及其應(yīng)用[J]. 熊露,唐敏,李其江,吳琳,葉正隆. 陶瓷學(xué)報. 2015(04)
[10]智慧城市中的大數(shù)據(jù)[J]. 李德仁,姚遠(yuǎn),邵振峰. 武漢大學(xué)學(xué)報(信息科學(xué)版). 2014(06)
博士論文
[1]復(fù)雜人體行為分析的時空上下文方法研究[D]. 許萬茹.北京交通大學(xué) 2018
[2]視頻序列中的人體動作識別[D]. 陳淵博.北京郵電大學(xué) 2015
碩士論文
[1]基于多特征的人體行為識別的研究[D]. 徐陳晨.南京郵電大學(xué) 2017
本文編號:3389949
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3389949.html
最近更新
教材專著