基于卷積神經(jīng)網(wǎng)絡(luò)和相關(guān)性的跨媒體檢索方法研究
【文章頁數(shù)】:60 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1跨媒
6第2章跨媒體檢索的相關(guān)方法隨著網(wǎng)絡(luò)的發(fā)展,人們?cè)谏詈凸ぷ髦薪佑|到各種各樣的數(shù)據(jù)。這些數(shù)據(jù)以多種媒體形式共存。人們使用互聯(lián)網(wǎng)時(shí),這些不同模態(tài)的數(shù)據(jù)充斥著人們的視覺與感官,使人們獲得的信息更加豐富而全面。人類大腦在獲取外界信息的過程中,必須要結(jié)合于多個(gè)感官的合作,每個(gè)感官獲取的信....
圖2.2gamma校正圖像亮度Fig.2.2GammacorrectionimagebrightnessT
第2章跨媒體檢索的相關(guān)方法92.1.2HOG算法原理HOG屬于局部特征概述算法,對(duì)圖像的外觀以及形狀可以實(shí)現(xiàn)很好的描述。該算法也廣泛應(yīng)用于計(jì)算機(jī)視覺和圖像處理領(lǐng)域,如在行人檢測(cè)方面進(jìn)行應(yīng)用。行人表情出現(xiàn)了變化,依托于HOG算子來對(duì)面部器官的邊緣形狀進(jìn)行檢測(cè),此時(shí)也就可以實(shí)現(xiàn)對(duì)表情....
圖2.4sigmoid函數(shù)Fig.2.4sigmoidfunctionsigmoid函數(shù)在實(shí)際操作中作為激活函數(shù),在這種情況下神經(jīng)元的輸出y則為:
第2章跨媒體檢索的相關(guān)方法11Y獲得的總刺激在此次課題研究中我們主要將其視為前層各神經(jīng)元刺激加權(quán)和,權(quán)重在此次課題研究中我們主要將其視為神經(jīng)元與神經(jīng)元間關(guān)系的密切程度。這樣就可以進(jìn)行以下推斷:=∑=0(2.7)對(duì)于末端神經(jīng)元所遭受刺激加權(quán)和來講,一般情況下其“工整”度并不好,此時(shí)....
圖3.2AlexNet網(wǎng)絡(luò)結(jié)構(gòu)
第3章基于卷積神經(jīng)網(wǎng)絡(luò)的跨媒體檢索方法29圖3.2AlexNet網(wǎng)絡(luò)結(jié)構(gòu)Fig.3.2AlexNetnetworkstructure3.2.2VGGNet2014年,VGG和谷歌共同研發(fā)出了VGGNet[35]。ILSVRC比賽中,這一模型在分類項(xiàng)目中得到了第二名的成績,在定位項(xiàng)....
本文編號(hào):4028032
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/4028032.html