基于深度學(xué)習(xí)的人臉識別技術(shù)在會議系統(tǒng)中的應(yīng)用
發(fā)布時間:2021-02-02 12:34
近年來,建立和健全會議系統(tǒng)制度是當(dāng)下大部分企業(yè)和相關(guān)單位所關(guān)注的,因為一套完整的、行之有效的會議系統(tǒng)不僅有利于企業(yè)管理者更好的去管理企業(yè)的職工,而且對于職工個人來說,一套完善的會議系統(tǒng)也能夠?qū)λ麄冏陨砥鸬郊s束作用,從而使企業(yè)和相關(guān)用人單位得到良好的發(fā)展。為了使管理人員擺脫繁重的工作任務(wù),讓會議系統(tǒng)更具自動化和人性化,本文將基于深度學(xué)習(xí)的人臉識別技術(shù)應(yīng)用于會議系統(tǒng)中。在對會議中的人員進行識別過程中,諸如人體在室內(nèi)環(huán)境姿勢、表情以及遮擋等不同條件的制約,將會造成視頻流中人臉圖像模糊,識別困難,降低了人臉識別算法的準(zhǔn)確性。為了能夠有效解決上述問題,本文在基本的人臉識別流程中引入了人臉圖像質(zhì)量評估模型,并通過對預(yù)訓(xùn)練的GoogLeNet網(wǎng)絡(luò)進行微調(diào)的方式對模型進行改進。利用GoogLeNet神經(jīng)網(wǎng)絡(luò)提取的特征和該特征對應(yīng)的MOS分數(shù)訓(xùn)練SVM分類器,最終得到人臉圖像質(zhì)量評估模型。該模型可以對檢測到的人臉圖像進行過濾和選擇,從而提高了所識別圖像的準(zhǔn)確性。并且,對于傳統(tǒng)目標(biāo)檢測方法對圖像的運動模糊、遮擋以及形變等表現(xiàn)出的識別準(zhǔn)確率不高的問題,本文將YOLO目標(biāo)檢測算法應(yīng)用于人臉檢測部分實現(xiàn)人臉檢測...
【文章來源】:煙臺大學(xué)山東省
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【部分圖文】:
CNN網(wǎng)絡(luò)基本結(jié)構(gòu)
煙臺大學(xué)碩士學(xué)位論文92.2.1卷積層卷積層是卷積神經(jīng)網(wǎng)絡(luò)的基本組成部分,同時也是最重要的組成部分。卷積層則由一組大小相同的卷積核組成,具有權(quán)值共享以及局部感知兩大特點。卷積層中的卷積運算是卷積神經(jīng)網(wǎng)絡(luò)的提取特征的一種重要方式。卷積運算主要是通過多個卷積核來實現(xiàn)的。圖2.2卷積計算步驟如圖2.2所示,特征圖的尺寸為6*6,特征圖上的每個方格中的數(shù)字表示特征圖像素的灰度值,范圍是0到255,卷積核的尺寸為3*3,它們中間的“*”號代表卷積運算符號,設(shè)置卷積步長stride=1,經(jīng)過與3*3的卷積核卷積運算之后,可以得到最終4*4大小的特征層。卷積層可以通過設(shè)計多通道卷積的方式進行卷積運算,也就是使用多個卷積核。卷積核不同的大小尺寸能獲得尺度不一的特征信息,通常,卷積核的大小取值為1*1、3*3、5*5或7*7。接下來簡單介紹下局部感知和權(quán)值共享。(1)局部感知在人們的視覺系統(tǒng)里,人眼對于外部世界的感知分為兩步,首先感知局部,進而感知全局。同樣的,在圖像上也是如此,局部像素的相關(guān)性會更高,而疏遠距離的像素相關(guān)性會非常低[23]。因此,神經(jīng)元只需要獲取到局部的像素,最終將所有的局部感知信息融合到一起就能夠得到全局信息。如圖2.4所示,CNN的每個卷積核都只會和輸入圖的部分區(qū)域相連接,卷積核的大小決定了卷積核的參數(shù)量,通過這
2理論技術(shù)和相關(guān)概念10種連接方式來減少網(wǎng)絡(luò)權(quán)重的參數(shù)量,降低了網(wǎng)絡(luò)復(fù)雜度并且可以讓卷積神經(jīng)網(wǎng)絡(luò)具備局部感知能力的特性。(2)權(quán)值共享通過權(quán)值共享方式可以有效減少網(wǎng)絡(luò)的權(quán)重參數(shù),因此,可以將其視作特征提取方式[24],例如,圖像中某兩個不相連的區(qū)域A和B中存在相同的特征表達,那么卷積核在A中學(xué)習(xí)的權(quán)重便可以用在B區(qū)域。因此,對于圖像上的任意位置,卷積核能夠共享相同的權(quán)重參數(shù),通過這種方式實現(xiàn)了權(quán)值共享。圖2.3全連接模式示意圖圖2.4局部連接模式示意圖2.2.2池化層池化層是在一些舊有的CNN網(wǎng)絡(luò)中喜歡設(shè)計的一層處理層[25]。池化層的作用實際上對FeatureMap所做的數(shù)據(jù)處理又進行了一次池化處理。常見的池化層處理有MaxPooling和MeaningPooling兩種方式,從名稱上來看,一個是做了最大化處理,一個是使用了平均化處理。
【參考文獻】:
期刊論文
[1]一種多算法融合的人臉識別方法研究[J]. 姚立平,潘中良. 光電子·激光. 2019(09)
[2]深度學(xué)習(xí)在圖像識別中的應(yīng)用研究綜述[J]. 鄭遠攀,李廣陽,李曄. 計算機工程與應(yīng)用. 2019(12)
[3]基于多任務(wù)學(xué)習(xí)的深層人臉識別算法[J]. 楊恢先,陳凡,甘偉發(fā). 激光與光電子學(xué)進展. 2019(18)
[4]基于難分樣本挖掘的快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)檢測研究[J]. 張燁,許艇,馮定忠,蔣美仙,吳光華. 電子與信息學(xué)報. 2019(06)
[5]基于小波去噪和線性判別分析的人臉識別方法[J]. 栗科峰,盧金燕,黃明明,黃全振. 科技通報. 2018(07)
[6]基于人眼視覺特性的深度學(xué)習(xí)全參考圖像質(zhì)量評價方法[J]. 姚旺,劉云鵬,朱昌波. 紅外與激光工程. 2018(07)
[7]基于捷徑的卷積神經(jīng)網(wǎng)絡(luò)在人臉識別中的應(yīng)用研究[J]. 王飛,張瑩,張東波,邵豪,成超鵬. 電子測量與儀器學(xué)報. 2018(04)
[8]融合YCbCr膚色模型與改進的Adaboost算法的人臉檢測[J]. 崔鵬,燕天天. 哈爾濱理工大學(xué)學(xué)報. 2018(02)
[9]基于深度卷積神經(jīng)網(wǎng)絡(luò)的人臉識別技術(shù)綜述[J]. 景晨凱,宋濤,莊雷,劉剛,王樂,劉凱倫. 計算機應(yīng)用與軟件. 2018(01)
[10]基于SLAM算法和深度神經(jīng)網(wǎng)絡(luò)的語義地圖構(gòu)建研究[J]. 白云漢. 計算機應(yīng)用與軟件. 2018(01)
碩士論文
[1]結(jié)合雙目視覺特性的無參考立體圖像質(zhì)量評價算法[D]. 劉天.武漢科技大學(xué) 2019
[2]基于人臉識別的課堂考勤系統(tǒng)的設(shè)計與實現(xiàn)[D]. 張其帆.重慶師范大學(xué) 2019
[3]基于CNN和特征點分塊的人臉檢測與識別[D]. 許書平.西安電子科技大學(xué) 2019
[4]基于圖像信息熵的無參考圖像質(zhì)量評估算法的研究[D]. 鄭加蘇.北京交通大學(xué) 2015
本文編號:3014704
【文章來源】:煙臺大學(xué)山東省
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【部分圖文】:
CNN網(wǎng)絡(luò)基本結(jié)構(gòu)
煙臺大學(xué)碩士學(xué)位論文92.2.1卷積層卷積層是卷積神經(jīng)網(wǎng)絡(luò)的基本組成部分,同時也是最重要的組成部分。卷積層則由一組大小相同的卷積核組成,具有權(quán)值共享以及局部感知兩大特點。卷積層中的卷積運算是卷積神經(jīng)網(wǎng)絡(luò)的提取特征的一種重要方式。卷積運算主要是通過多個卷積核來實現(xiàn)的。圖2.2卷積計算步驟如圖2.2所示,特征圖的尺寸為6*6,特征圖上的每個方格中的數(shù)字表示特征圖像素的灰度值,范圍是0到255,卷積核的尺寸為3*3,它們中間的“*”號代表卷積運算符號,設(shè)置卷積步長stride=1,經(jīng)過與3*3的卷積核卷積運算之后,可以得到最終4*4大小的特征層。卷積層可以通過設(shè)計多通道卷積的方式進行卷積運算,也就是使用多個卷積核。卷積核不同的大小尺寸能獲得尺度不一的特征信息,通常,卷積核的大小取值為1*1、3*3、5*5或7*7。接下來簡單介紹下局部感知和權(quán)值共享。(1)局部感知在人們的視覺系統(tǒng)里,人眼對于外部世界的感知分為兩步,首先感知局部,進而感知全局。同樣的,在圖像上也是如此,局部像素的相關(guān)性會更高,而疏遠距離的像素相關(guān)性會非常低[23]。因此,神經(jīng)元只需要獲取到局部的像素,最終將所有的局部感知信息融合到一起就能夠得到全局信息。如圖2.4所示,CNN的每個卷積核都只會和輸入圖的部分區(qū)域相連接,卷積核的大小決定了卷積核的參數(shù)量,通過這
2理論技術(shù)和相關(guān)概念10種連接方式來減少網(wǎng)絡(luò)權(quán)重的參數(shù)量,降低了網(wǎng)絡(luò)復(fù)雜度并且可以讓卷積神經(jīng)網(wǎng)絡(luò)具備局部感知能力的特性。(2)權(quán)值共享通過權(quán)值共享方式可以有效減少網(wǎng)絡(luò)的權(quán)重參數(shù),因此,可以將其視作特征提取方式[24],例如,圖像中某兩個不相連的區(qū)域A和B中存在相同的特征表達,那么卷積核在A中學(xué)習(xí)的權(quán)重便可以用在B區(qū)域。因此,對于圖像上的任意位置,卷積核能夠共享相同的權(quán)重參數(shù),通過這種方式實現(xiàn)了權(quán)值共享。圖2.3全連接模式示意圖圖2.4局部連接模式示意圖2.2.2池化層池化層是在一些舊有的CNN網(wǎng)絡(luò)中喜歡設(shè)計的一層處理層[25]。池化層的作用實際上對FeatureMap所做的數(shù)據(jù)處理又進行了一次池化處理。常見的池化層處理有MaxPooling和MeaningPooling兩種方式,從名稱上來看,一個是做了最大化處理,一個是使用了平均化處理。
【參考文獻】:
期刊論文
[1]一種多算法融合的人臉識別方法研究[J]. 姚立平,潘中良. 光電子·激光. 2019(09)
[2]深度學(xué)習(xí)在圖像識別中的應(yīng)用研究綜述[J]. 鄭遠攀,李廣陽,李曄. 計算機工程與應(yīng)用. 2019(12)
[3]基于多任務(wù)學(xué)習(xí)的深層人臉識別算法[J]. 楊恢先,陳凡,甘偉發(fā). 激光與光電子學(xué)進展. 2019(18)
[4]基于難分樣本挖掘的快速區(qū)域卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)檢測研究[J]. 張燁,許艇,馮定忠,蔣美仙,吳光華. 電子與信息學(xué)報. 2019(06)
[5]基于小波去噪和線性判別分析的人臉識別方法[J]. 栗科峰,盧金燕,黃明明,黃全振. 科技通報. 2018(07)
[6]基于人眼視覺特性的深度學(xué)習(xí)全參考圖像質(zhì)量評價方法[J]. 姚旺,劉云鵬,朱昌波. 紅外與激光工程. 2018(07)
[7]基于捷徑的卷積神經(jīng)網(wǎng)絡(luò)在人臉識別中的應(yīng)用研究[J]. 王飛,張瑩,張東波,邵豪,成超鵬. 電子測量與儀器學(xué)報. 2018(04)
[8]融合YCbCr膚色模型與改進的Adaboost算法的人臉檢測[J]. 崔鵬,燕天天. 哈爾濱理工大學(xué)學(xué)報. 2018(02)
[9]基于深度卷積神經(jīng)網(wǎng)絡(luò)的人臉識別技術(shù)綜述[J]. 景晨凱,宋濤,莊雷,劉剛,王樂,劉凱倫. 計算機應(yīng)用與軟件. 2018(01)
[10]基于SLAM算法和深度神經(jīng)網(wǎng)絡(luò)的語義地圖構(gòu)建研究[J]. 白云漢. 計算機應(yīng)用與軟件. 2018(01)
碩士論文
[1]結(jié)合雙目視覺特性的無參考立體圖像質(zhì)量評價算法[D]. 劉天.武漢科技大學(xué) 2019
[2]基于人臉識別的課堂考勤系統(tǒng)的設(shè)計與實現(xiàn)[D]. 張其帆.重慶師范大學(xué) 2019
[3]基于CNN和特征點分塊的人臉檢測與識別[D]. 許書平.西安電子科技大學(xué) 2019
[4]基于圖像信息熵的無參考圖像質(zhì)量評估算法的研究[D]. 鄭加蘇.北京交通大學(xué) 2015
本文編號:3014704
本文鏈接:http://sikaile.net/jingjilunwen/xmjj/3014704.html
最近更新
教材專著