圖像內(nèi)容識別技術(shù)和對比挖掘在網(wǎng)站分析中的應(yīng)用研究
發(fā)布時間:2021-03-24 01:38
現(xiàn)如今,隨著生活質(zhì)量提高,人們旅行比以往任何時候都多,對酒店需求也隨之增加。信息技術(shù)的蓬勃發(fā)展使得社交網(wǎng)站為酒店選擇提供了便利。但是,由于無法對網(wǎng)站上展示的酒店進(jìn)行實地考察,消費(fèi)者如何通過對比以選擇滿足自身需求的酒店成為廣泛關(guān)注的問題。而網(wǎng)站上展示的圖像在提供視覺享受的同時,為這一問題提供了很好的解決途徑,因為圖像能反映酒店實際情況。但是隨著社交網(wǎng)站上的圖像越來越多,圖像信息負(fù)載問題也越來越嚴(yán)重,這對消費(fèi)者進(jìn)行人工對比選擇造成了很大的困擾。針對上述問題,本文經(jīng)過大量調(diào)研,發(fā)現(xiàn)在國內(nèi)外社交網(wǎng)站的相關(guān)研究中,大多數(shù)人傾向于針對評論或者評分進(jìn)行研究,然而圖像內(nèi)容的對比挖掘相關(guān)研究較少,使得圖像信息無法得到充分利用。為實現(xiàn)對比兩組大規(guī)模圖像數(shù)據(jù)集并得到之間的差異,本文首先利用深度學(xué)習(xí)技術(shù)識別圖像中的實體并得到標(biāo)簽。隨后為消減實體相似性導(dǎo)致的信息冗余對對比分析產(chǎn)生的不利影響,采用:1)文本分析中詞向量轉(zhuǎn)化的方法,將實體標(biāo)簽向量化;2)無需指定類別數(shù)目的層次聚類算法進(jìn)行標(biāo)簽向量的聚類。最后利用FP-Growth算法對聚類后的向量集挖掘頻繁項集并進(jìn)行對比挖掘,識別兩組圖像數(shù)據(jù)集中的對比模式。通過識別...
【文章來源】:西安石油大學(xué)陜西省
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
論文組織結(jié)構(gòu)框圖
耐黃芠32][52],在后續(xù)的跟圖像相關(guān)的研究和應(yīng)用中,這種類型的卷積神經(jīng)網(wǎng)絡(luò)倍受歡迎。(2)深度學(xué)習(xí)原理深度學(xué)習(xí)是一種從海量的數(shù)據(jù)中通過自身參數(shù)設(shè)置而自動學(xué)習(xí)數(shù)據(jù)之間的非線性關(guān)系的模型,其中一個重要的問題是怎樣有效的學(xué)習(xí)這些關(guān)系。在建立模型時,如果能夠引入一些更為一般的先驗假設(shè)去表示輸入數(shù)據(jù)的關(guān)系或者分布,將會增加算法的智能化程度。其中深度學(xué)習(xí)中一般的先驗性假設(shè)包括:連續(xù)性、多因素性、分層組織、半監(jiān)督性學(xué)習(xí)、特征共享、流形學(xué)習(xí)、天然聚類、空間時序列一致性、稀疏性、因素依賴簡單性。圖2-1深度學(xué)習(xí)模型在深度學(xué)習(xí)模型中,包含不同的層次,這些不同的層次表示不同尺度上的特定的特征表達(dá),其中靠下層的結(jié)構(gòu)可以反映數(shù)據(jù)中表達(dá)的細(xì)節(jié)信息,而較上層的結(jié)構(gòu)則反映了數(shù)據(jù)所表達(dá)的全局信息。如圖2-1所示,該圖展示了四層,第一層反映的比較細(xì)小的信息,包含大量圖像數(shù)據(jù)訓(xùn)練所得到的深度學(xué)習(xí)模型。第二張圖為第二層則能得到物體的局部信息。第三層就能反映出比較完整的物體輪廓信息。而第四張圖所表達(dá)的第四層則反映了比較清晰符合人類認(rèn)知的信息。這些從不同的抽象程度所得到的特征,其非常強(qiáng)大的表示能力表達(dá)了不同的內(nèi)容,每個特種中還包含著非常豐富的語義信息。(3)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)感知機(jī)是一種二分類的模型,也是深度學(xué)習(xí)的基本結(jié)構(gòu),其中包含一個激活函數(shù),這里的激活函數(shù)主要是用來確定輸入樣本所屬的類別。設(shè)感知機(jī)的輸入數(shù)據(jù)為1,2,3則感知機(jī)的輸出結(jié)果如式(2-1)所示:(2-1)其中為邊的連接權(quán)重,為偏置函數(shù),函數(shù)為激活函數(shù)。激活函數(shù)和權(quán)重點將輸入數(shù)據(jù)向量映射到單個標(biāo)量輸出值。感知器輸出值的取值范圍可通過選擇激活函數(shù)來確定。常見的節(jié)點激活函數(shù)包含以下三種形式:Sigmoid函數(shù)如式(2-2)所示:
第二章圖像內(nèi)容識別技術(shù)9該函數(shù)的定義域為(∞,+∞),值域為(0,1).雙曲正切函數(shù)如式(2-3)所示:(2-3)ReLU函數(shù)如式(2-4)所示:(2-4)其中,ReLU激活函數(shù)更加符合人腦自身對于事物的認(rèn)知形式,其在一定程度上能增加隱層單元的系數(shù)程度,且易于求導(dǎo),因此該激活函數(shù)在深度學(xué)習(xí)的模型中廣泛應(yīng)用。感知機(jī)有一定的信息處理能力,它能通過分類超平面將樣本空間劃分為兩個區(qū)域,因此感知機(jī)是一種判別式的線性分類器。感知機(jī)模型可以當(dāng)成人腦中的一個神經(jīng)元,每個感知機(jī)模型都有自己單個的特殊識別任務(wù)需要完成,然后將許多類似的感知機(jī)模型組合在一起,就能構(gòu)建出能夠?qū)θ我鈴?fù)雜數(shù)據(jù)進(jìn)行處理的非線性分類器。(4)特征學(xué)習(xí)層在計算機(jī)視覺領(lǐng)域中,特征所包含的有用信息量至關(guān)重要。好的特征是階層式的,抽取特征的過程好比由像素到邊,再到局部部分,再到整個物體,最后到整個復(fù)雜場景,因此特征抽取往往都是一層一層完成的;谏疃葘W(xué)習(xí)的框架為抽取特征提供了方便。而且,卷積操作更加接近人眼捕捉特征的生理機(jī)制,該操作還能應(yīng)對圖像的旋轉(zhuǎn)、偏移、尺度縮放等變形。使用卷積神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)深度高層特征,如圖2-2所示[49]:圖2-2特征學(xué)習(xí)層的基本原理圖卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)是一種多層神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)中非常基礎(chǔ)神經(jīng)網(wǎng)絡(luò)。主要有以下特征:(1)通過卷積神經(jīng)網(wǎng)絡(luò)可以抽取圖像特征,并且該網(wǎng)絡(luò)的結(jié)構(gòu)具有很強(qiáng)的自學(xué)習(xí)和并行處理特征的能力。(2)CNN除了擁有神經(jīng)網(wǎng)絡(luò)所擁有的最基礎(chǔ)的結(jié)構(gòu)之外,同時還可以通過局部感知和權(quán)值共享這兩種方式有效降低傳統(tǒng)網(wǎng)絡(luò)的復(fù)雜程度。(3)CNN是一種多層的前饋網(wǎng)絡(luò),這些層是由多個二維平面組成的,并且在每個平
本文編號:3096803
【文章來源】:西安石油大學(xué)陜西省
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
論文組織結(jié)構(gòu)框圖
耐黃芠32][52],在后續(xù)的跟圖像相關(guān)的研究和應(yīng)用中,這種類型的卷積神經(jīng)網(wǎng)絡(luò)倍受歡迎。(2)深度學(xué)習(xí)原理深度學(xué)習(xí)是一種從海量的數(shù)據(jù)中通過自身參數(shù)設(shè)置而自動學(xué)習(xí)數(shù)據(jù)之間的非線性關(guān)系的模型,其中一個重要的問題是怎樣有效的學(xué)習(xí)這些關(guān)系。在建立模型時,如果能夠引入一些更為一般的先驗假設(shè)去表示輸入數(shù)據(jù)的關(guān)系或者分布,將會增加算法的智能化程度。其中深度學(xué)習(xí)中一般的先驗性假設(shè)包括:連續(xù)性、多因素性、分層組織、半監(jiān)督性學(xué)習(xí)、特征共享、流形學(xué)習(xí)、天然聚類、空間時序列一致性、稀疏性、因素依賴簡單性。圖2-1深度學(xué)習(xí)模型在深度學(xué)習(xí)模型中,包含不同的層次,這些不同的層次表示不同尺度上的特定的特征表達(dá),其中靠下層的結(jié)構(gòu)可以反映數(shù)據(jù)中表達(dá)的細(xì)節(jié)信息,而較上層的結(jié)構(gòu)則反映了數(shù)據(jù)所表達(dá)的全局信息。如圖2-1所示,該圖展示了四層,第一層反映的比較細(xì)小的信息,包含大量圖像數(shù)據(jù)訓(xùn)練所得到的深度學(xué)習(xí)模型。第二張圖為第二層則能得到物體的局部信息。第三層就能反映出比較完整的物體輪廓信息。而第四張圖所表達(dá)的第四層則反映了比較清晰符合人類認(rèn)知的信息。這些從不同的抽象程度所得到的特征,其非常強(qiáng)大的表示能力表達(dá)了不同的內(nèi)容,每個特種中還包含著非常豐富的語義信息。(3)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)感知機(jī)是一種二分類的模型,也是深度學(xué)習(xí)的基本結(jié)構(gòu),其中包含一個激活函數(shù),這里的激活函數(shù)主要是用來確定輸入樣本所屬的類別。設(shè)感知機(jī)的輸入數(shù)據(jù)為1,2,3則感知機(jī)的輸出結(jié)果如式(2-1)所示:(2-1)其中為邊的連接權(quán)重,為偏置函數(shù),函數(shù)為激活函數(shù)。激活函數(shù)和權(quán)重點將輸入數(shù)據(jù)向量映射到單個標(biāo)量輸出值。感知器輸出值的取值范圍可通過選擇激活函數(shù)來確定。常見的節(jié)點激活函數(shù)包含以下三種形式:Sigmoid函數(shù)如式(2-2)所示:
第二章圖像內(nèi)容識別技術(shù)9該函數(shù)的定義域為(∞,+∞),值域為(0,1).雙曲正切函數(shù)如式(2-3)所示:(2-3)ReLU函數(shù)如式(2-4)所示:(2-4)其中,ReLU激活函數(shù)更加符合人腦自身對于事物的認(rèn)知形式,其在一定程度上能增加隱層單元的系數(shù)程度,且易于求導(dǎo),因此該激活函數(shù)在深度學(xué)習(xí)的模型中廣泛應(yīng)用。感知機(jī)有一定的信息處理能力,它能通過分類超平面將樣本空間劃分為兩個區(qū)域,因此感知機(jī)是一種判別式的線性分類器。感知機(jī)模型可以當(dāng)成人腦中的一個神經(jīng)元,每個感知機(jī)模型都有自己單個的特殊識別任務(wù)需要完成,然后將許多類似的感知機(jī)模型組合在一起,就能構(gòu)建出能夠?qū)θ我鈴?fù)雜數(shù)據(jù)進(jìn)行處理的非線性分類器。(4)特征學(xué)習(xí)層在計算機(jī)視覺領(lǐng)域中,特征所包含的有用信息量至關(guān)重要。好的特征是階層式的,抽取特征的過程好比由像素到邊,再到局部部分,再到整個物體,最后到整個復(fù)雜場景,因此特征抽取往往都是一層一層完成的;谏疃葘W(xué)習(xí)的框架為抽取特征提供了方便。而且,卷積操作更加接近人眼捕捉特征的生理機(jī)制,該操作還能應(yīng)對圖像的旋轉(zhuǎn)、偏移、尺度縮放等變形。使用卷積神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)深度高層特征,如圖2-2所示[49]:圖2-2特征學(xué)習(xí)層的基本原理圖卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)是一種多層神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)中非常基礎(chǔ)神經(jīng)網(wǎng)絡(luò)。主要有以下特征:(1)通過卷積神經(jīng)網(wǎng)絡(luò)可以抽取圖像特征,并且該網(wǎng)絡(luò)的結(jié)構(gòu)具有很強(qiáng)的自學(xué)習(xí)和并行處理特征的能力。(2)CNN除了擁有神經(jīng)網(wǎng)絡(luò)所擁有的最基礎(chǔ)的結(jié)構(gòu)之外,同時還可以通過局部感知和權(quán)值共享這兩種方式有效降低傳統(tǒng)網(wǎng)絡(luò)的復(fù)雜程度。(3)CNN是一種多層的前饋網(wǎng)絡(luò),這些層是由多個二維平面組成的,并且在每個平
本文編號:3096803
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3096803.html
最近更新
教材專著