視覺(jué)語(yǔ)言識(shí)別的嘴唇分割及特征提取方法研究
發(fā)布時(shí)間:2023-06-03 11:32
近年來(lái),隨著人機(jī)交互技術(shù)的日益發(fā)展,各種智能設(shè)備紛紛出現(xiàn),人工智能已經(jīng)正式成為信息領(lǐng)域的研究熱點(diǎn)。作為人機(jī)交互技術(shù)中相對(duì)成熟的語(yǔ)音識(shí)別技術(shù),已逐步滲透到社會(huì)生活的各個(gè)領(lǐng)域,改變著人們的生活方式。但是在周?chē)性肼暤那闆r下,基于音頻的語(yǔ)音識(shí)別的識(shí)別率就會(huì)急劇下降,甚至完全無(wú)法識(shí)別說(shuō)話者所說(shuō)的話語(yǔ)內(nèi)容。人們?cè)谶M(jìn)行對(duì)話交流時(shí),視覺(jué)唇動(dòng)信息也可以反映話語(yǔ)內(nèi)容信息。因此,研究者們開(kāi)始致力于基于唇動(dòng)視覺(jué)特征的話語(yǔ)內(nèi)容識(shí)別研究,也就是視覺(jué)語(yǔ)言識(shí)別技術(shù)研究。該技術(shù)將在彌補(bǔ)語(yǔ)音識(shí)別技術(shù)的缺陷方面發(fā)揮重要作用。本文重點(diǎn)研究視覺(jué)語(yǔ)言識(shí)別系統(tǒng)中兩個(gè)關(guān)鍵技術(shù),即嘴唇分割和特征提取。在嘴唇分割方面,首先利用OpenCV檢測(cè)技術(shù)對(duì)包含有人臉的圖像進(jìn)行檢測(cè),分割出嘴唇區(qū)域,并進(jìn)行色彩空間的變換。然后在三個(gè)色彩空間RGB、HSV和chromatic中進(jìn)行色彩增強(qiáng),色彩分割和嘴角定位等操作。最后利用細(xì)菌覓食優(yōu)化算法和以Kapur最大熵法為適應(yīng)度函數(shù)對(duì)輸入圖像求取最佳閾值并分割,得到精確的嘴唇二值圖像。在唇部視覺(jué)特征提取方面,由于不同種族膚色的差異,以及同一人在不同光照強(qiáng)度和不同色光下映射膚色不同等因素,使得圖像的像素特征失...
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 選題背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀和發(fā)展
1.3 本文研究的主要內(nèi)容
1.4 本文的組織結(jié)構(gòu)
第二章 嘴唇區(qū)域定位
2.1 人臉區(qū)域的檢測(cè)與提取
2.1.1 OpenCV技術(shù)
2.1.2 人臉圖像Haar特征介紹
2.1.3 AdaBoost級(jí)聯(lián)分類(lèi)器
2.1.4 人臉區(qū)域的檢測(cè)和定位
2.2 嘴唇區(qū)域的定位和提取
2.3 本章小結(jié)
第三章 細(xì)菌覓食優(yōu)化算法
3.1 細(xì)菌覓食算法原理
3.2 自適應(yīng)步長(zhǎng)的細(xì)菌覓食優(yōu)化算法的基本步驟
3.3 適應(yīng)度函數(shù)的設(shè)計(jì)-最優(yōu)閾值法
3.4 本章小結(jié)
第四章 嘴唇的精確分割
4.1 基于三色彩空間中的嘴唇分割
4.1.1 在RGB色彩空間中的嘴唇區(qū)域分割
4.1.2 在HSV色彩空間中的嘴唇區(qū)域分割
4.1.3 在chromatic色彩空間中的嘴唇區(qū)域分割
4.2 本章小結(jié)
第五章 唇部視覺(jué)特征提取
5.1 嘴唇邊緣關(guān)鍵點(diǎn)提取
5.1.1 外嘴唇邊緣關(guān)鍵點(diǎn)提取
5.1.2 內(nèi)嘴唇邊緣關(guān)鍵點(diǎn)提取
5.2 最小二乘法簡(jiǎn)介
5.3 嘴唇外輪廓的提取
5.3.1 建立嘴唇輪廓模型
5.3.2 凸包算法
5.3.3 嘴唇外輪廓提取
5.4 嘴唇視覺(jué)動(dòng)態(tài)特征提取
5.5 經(jīng)典的GVF Snake嘴唇輪廓模型算法
5.6 實(shí)驗(yàn)結(jié)果與分析
5.7 本章小結(jié)
第六章 結(jié)論
參考文獻(xiàn)
在學(xué)期間的研究成果
致謝
本文編號(hào):3829253
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 選題背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀和發(fā)展
1.3 本文研究的主要內(nèi)容
1.4 本文的組織結(jié)構(gòu)
第二章 嘴唇區(qū)域定位
2.1 人臉區(qū)域的檢測(cè)與提取
2.1.1 OpenCV技術(shù)
2.1.2 人臉圖像Haar特征介紹
2.1.3 AdaBoost級(jí)聯(lián)分類(lèi)器
2.1.4 人臉區(qū)域的檢測(cè)和定位
2.2 嘴唇區(qū)域的定位和提取
2.3 本章小結(jié)
第三章 細(xì)菌覓食優(yōu)化算法
3.1 細(xì)菌覓食算法原理
3.2 自適應(yīng)步長(zhǎng)的細(xì)菌覓食優(yōu)化算法的基本步驟
3.3 適應(yīng)度函數(shù)的設(shè)計(jì)-最優(yōu)閾值法
3.4 本章小結(jié)
第四章 嘴唇的精確分割
4.1 基于三色彩空間中的嘴唇分割
4.1.1 在RGB色彩空間中的嘴唇區(qū)域分割
4.1.2 在HSV色彩空間中的嘴唇區(qū)域分割
4.1.3 在chromatic色彩空間中的嘴唇區(qū)域分割
4.2 本章小結(jié)
第五章 唇部視覺(jué)特征提取
5.1 嘴唇邊緣關(guān)鍵點(diǎn)提取
5.1.1 外嘴唇邊緣關(guān)鍵點(diǎn)提取
5.1.2 內(nèi)嘴唇邊緣關(guān)鍵點(diǎn)提取
5.2 最小二乘法簡(jiǎn)介
5.3 嘴唇外輪廓的提取
5.3.1 建立嘴唇輪廓模型
5.3.2 凸包算法
5.3.3 嘴唇外輪廓提取
5.4 嘴唇視覺(jué)動(dòng)態(tài)特征提取
5.5 經(jīng)典的GVF Snake嘴唇輪廓模型算法
5.6 實(shí)驗(yàn)結(jié)果與分析
5.7 本章小結(jié)
第六章 結(jié)論
參考文獻(xiàn)
在學(xué)期間的研究成果
致謝
本文編號(hào):3829253
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3829253.html
最近更新
教材專(zhuān)著