表情識(shí)別算法研究與抑郁癥智能診斷標(biāo)注系統(tǒng)設(shè)計(jì)
發(fā)布時(shí)間:2021-12-31 20:16
抑郁癥作為一種精神疾病,會(huì)對(duì)患者、患者家人及社會(huì)造成嚴(yán)重影響。在抑郁癥診斷中,醫(yī)生利用量表對(duì)患者提問(wèn),通過(guò)分析患者回答的內(nèi)容、行為表現(xiàn)等進(jìn)行診斷。本文針對(duì)抑郁癥診斷中具有重要意義的表情識(shí)別開展研究,為了模仿醫(yī)生診斷過(guò)程建立智能化診斷方案,進(jìn)一步建立了抑郁癥智能診斷標(biāo)注系統(tǒng)。本文的主要工作如下:(1)建立基于協(xié)方差池化和注意力機(jī)制的表情識(shí)別模型VBLCA。針對(duì)CNN-RNN表情識(shí)別算法無(wú)法很好提取二階特征與較長(zhǎng)時(shí)序信息的問(wèn)題,利用協(xié)方差池化實(shí)現(xiàn)臉部二階變化特征的提取,同時(shí)利用自注意力機(jī)制,實(shí)現(xiàn)對(duì)時(shí)序有效信息的更好捕捉,從而有效提高識(shí)別準(zhǔn)確率。VBLCA在七分類的AFEW驗(yàn)證集達(dá)到51.05%的準(zhǔn)確率,相比最新單模型算法提升了2.05%。此外,流淚作為表情程度較深的一種體現(xiàn),對(duì)抑郁癥診斷非常重要,本文通過(guò)網(wǎng)絡(luò)搜索和多人標(biāo)注的方法自建立了流淚數(shù)據(jù)集,VBLCA在二分類的流淚數(shù)據(jù)集達(dá)到92.04%的準(zhǔn)確率。(2)建立基于時(shí)間轉(zhuǎn)移模塊和注意力機(jī)制的表情識(shí)別模型RNTA并進(jìn)行模型融合研究。針對(duì)3DCNN表情識(shí)別算法參數(shù)量巨大,計(jì)算復(fù)雜的問(wèn)題,利用時(shí)間轉(zhuǎn)移模塊實(shí)現(xiàn)不增加2DCNN計(jì)算量的情況下提取時(shí)...
【文章來(lái)源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:77 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
傳統(tǒng)表情識(shí)別過(guò)程
傳統(tǒng)表
第一章緒論5了模型的準(zhǔn)確率[32]。在傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)中加入一些模塊,可以使網(wǎng)絡(luò)更好的提取表情特征,Cai等人提出針對(duì)表情識(shí)別問(wèn)題的ISLandloss,在CK+等多個(gè)數(shù)據(jù)集上均取得了較高的識(shí)別準(zhǔn)確率[33]。RanJan等人,提出一體化卷積神經(jīng)網(wǎng)絡(luò)模型來(lái)同時(shí)解決包括微笑檢測(cè)在內(nèi)的各種面部分析任務(wù)[34]。Kim等人利用集成學(xué)習(xí)的方法,將多個(gè)網(wǎng)絡(luò)提取出的特征融合,取得了高于單模型的分類準(zhǔn)確率[35]。Liu等人則將多個(gè)網(wǎng)絡(luò)通過(guò)級(jí)聯(lián)的形式組合起來(lái),用于提取特征,并將支持向量機(jī)作為分類器,有效提升了模型的識(shí)別能力[36]。圖1-2深度學(xué)習(xí)表情識(shí)別方法早起的視頻表情識(shí)別方法是逐幀對(duì)圖片分類,并利用集成策略將結(jié)果匯總,這種方法沒(méi)有考慮幀與幀之間的時(shí)間連續(xù)性,因而應(yīng)用較少。網(wǎng)絡(luò)級(jí)聯(lián)是將多個(gè)網(wǎng)絡(luò)連接,利用多個(gè)網(wǎng)絡(luò)的優(yōu)點(diǎn)提取更有效的特征,從而提高識(shí)別準(zhǔn)確率。3D卷積神經(jīng)網(wǎng)絡(luò)(3DConvolutionalNeuralNetworks,3DCNN)的卷積核是3D卷積核,可以提取時(shí)間維度的信息。面部五官標(biāo)志點(diǎn)運(yùn)動(dòng)軌跡,是對(duì)五官的變化軌跡進(jìn)行分析。網(wǎng)絡(luò)集成可以有效綜合多個(gè)模型的優(yōu)點(diǎn),可以獲得高于單模型的準(zhǔn)確率,因此在視頻表情識(shí)別中應(yīng)用很廣。Zhang等人根據(jù)五官將五官標(biāo)志點(diǎn)分成4塊,然后利用基于3DCNN建立的模型對(duì)視頻流進(jìn)行分類,在多個(gè)表情數(shù)據(jù)集上取得了優(yōu)秀的識(shí)別結(jié)果[37]。Fan等人將VGG-LSTM、3DCNN、音頻分析模型融合進(jìn)行視頻表情識(shí)別,模型融合進(jìn)一步提高了模型的準(zhǔn)確率[38]。在視頻表情識(shí)別方法中,逐幀處理后匯總無(wú)法提取時(shí)間信息,所以現(xiàn)在使用的越來(lái)
【參考文獻(xiàn)】:
期刊論文
[1]基于跨連接LeNet-5網(wǎng)絡(luò)的面部表情識(shí)別[J]. 李勇,林小竹,蔣夢(mèng)瑩. 自動(dòng)化學(xué)報(bào). 2018(01)
[2]基于幾何和紋理特征的表情層級(jí)分類方法[J]. 胡敏,江河,王曉華,許良鳳,黃曉音,程軼紅. 電子學(xué)報(bào). 2017(01)
[3]中醫(yī)藥知識(shí)圖譜構(gòu)建與應(yīng)用[J]. 阮彤,孫程琳,王昊奮,方之家,殷亦超. 醫(yī)學(xué)信息學(xué)雜志. 2016(04)
[4]知識(shí)圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計(jì)算機(jī)研究與發(fā)展. 2016(03)
[5]一個(gè)測(cè)量抑郁癥的重要神經(jīng)指標(biāo):靜息額葉腦電活動(dòng)的不對(duì)稱性[J]. 劉雷,周仁來(lái). 心理科學(xué)進(jìn)展. 2015(06)
[6]抑郁癥臨床研究進(jìn)展[J]. 和昱辰,張波. 國(guó)際檢驗(yàn)醫(yī)學(xué)雜志. 2013(07)
[7]命名實(shí)體識(shí)別研究進(jìn)展綜述[J]. 孫鎮(zhèn),王惠臨. 現(xiàn)代圖書情報(bào)技術(shù). 2010(06)
[8]抑郁障礙的病因、診斷與鑒別診斷[J]. 楊放如. 中國(guó)醫(yī)刊. 2005(09)
博士論文
[1]基于二元模式的人臉識(shí)別與表情識(shí)別研究[D]. 付曉峰.浙江大學(xué) 2008
本文編號(hào):3560905
【文章來(lái)源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:77 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
傳統(tǒng)表情識(shí)別過(guò)程
傳統(tǒng)表
第一章緒論5了模型的準(zhǔn)確率[32]。在傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)中加入一些模塊,可以使網(wǎng)絡(luò)更好的提取表情特征,Cai等人提出針對(duì)表情識(shí)別問(wèn)題的ISLandloss,在CK+等多個(gè)數(shù)據(jù)集上均取得了較高的識(shí)別準(zhǔn)確率[33]。RanJan等人,提出一體化卷積神經(jīng)網(wǎng)絡(luò)模型來(lái)同時(shí)解決包括微笑檢測(cè)在內(nèi)的各種面部分析任務(wù)[34]。Kim等人利用集成學(xué)習(xí)的方法,將多個(gè)網(wǎng)絡(luò)提取出的特征融合,取得了高于單模型的分類準(zhǔn)確率[35]。Liu等人則將多個(gè)網(wǎng)絡(luò)通過(guò)級(jí)聯(lián)的形式組合起來(lái),用于提取特征,并將支持向量機(jī)作為分類器,有效提升了模型的識(shí)別能力[36]。圖1-2深度學(xué)習(xí)表情識(shí)別方法早起的視頻表情識(shí)別方法是逐幀對(duì)圖片分類,并利用集成策略將結(jié)果匯總,這種方法沒(méi)有考慮幀與幀之間的時(shí)間連續(xù)性,因而應(yīng)用較少。網(wǎng)絡(luò)級(jí)聯(lián)是將多個(gè)網(wǎng)絡(luò)連接,利用多個(gè)網(wǎng)絡(luò)的優(yōu)點(diǎn)提取更有效的特征,從而提高識(shí)別準(zhǔn)確率。3D卷積神經(jīng)網(wǎng)絡(luò)(3DConvolutionalNeuralNetworks,3DCNN)的卷積核是3D卷積核,可以提取時(shí)間維度的信息。面部五官標(biāo)志點(diǎn)運(yùn)動(dòng)軌跡,是對(duì)五官的變化軌跡進(jìn)行分析。網(wǎng)絡(luò)集成可以有效綜合多個(gè)模型的優(yōu)點(diǎn),可以獲得高于單模型的準(zhǔn)確率,因此在視頻表情識(shí)別中應(yīng)用很廣。Zhang等人根據(jù)五官將五官標(biāo)志點(diǎn)分成4塊,然后利用基于3DCNN建立的模型對(duì)視頻流進(jìn)行分類,在多個(gè)表情數(shù)據(jù)集上取得了優(yōu)秀的識(shí)別結(jié)果[37]。Fan等人將VGG-LSTM、3DCNN、音頻分析模型融合進(jìn)行視頻表情識(shí)別,模型融合進(jìn)一步提高了模型的準(zhǔn)確率[38]。在視頻表情識(shí)別方法中,逐幀處理后匯總無(wú)法提取時(shí)間信息,所以現(xiàn)在使用的越來(lái)
【參考文獻(xiàn)】:
期刊論文
[1]基于跨連接LeNet-5網(wǎng)絡(luò)的面部表情識(shí)別[J]. 李勇,林小竹,蔣夢(mèng)瑩. 自動(dòng)化學(xué)報(bào). 2018(01)
[2]基于幾何和紋理特征的表情層級(jí)分類方法[J]. 胡敏,江河,王曉華,許良鳳,黃曉音,程軼紅. 電子學(xué)報(bào). 2017(01)
[3]中醫(yī)藥知識(shí)圖譜構(gòu)建與應(yīng)用[J]. 阮彤,孫程琳,王昊奮,方之家,殷亦超. 醫(yī)學(xué)信息學(xué)雜志. 2016(04)
[4]知識(shí)圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計(jì)算機(jī)研究與發(fā)展. 2016(03)
[5]一個(gè)測(cè)量抑郁癥的重要神經(jīng)指標(biāo):靜息額葉腦電活動(dòng)的不對(duì)稱性[J]. 劉雷,周仁來(lái). 心理科學(xué)進(jìn)展. 2015(06)
[6]抑郁癥臨床研究進(jìn)展[J]. 和昱辰,張波. 國(guó)際檢驗(yàn)醫(yī)學(xué)雜志. 2013(07)
[7]命名實(shí)體識(shí)別研究進(jìn)展綜述[J]. 孫鎮(zhèn),王惠臨. 現(xiàn)代圖書情報(bào)技術(shù). 2010(06)
[8]抑郁障礙的病因、診斷與鑒別診斷[J]. 楊放如. 中國(guó)醫(yī)刊. 2005(09)
博士論文
[1]基于二元模式的人臉識(shí)別與表情識(shí)別研究[D]. 付曉峰.浙江大學(xué) 2008
本文編號(hào):3560905
本文鏈接:http://sikaile.net/yixuelunwen/jsb/3560905.html
最近更新
教材專著