基于深度學(xué)習(xí)的人體骨架動(dòng)作識(shí)別
發(fā)布時(shí)間:2021-08-20 06:16
隨著現(xiàn)代信息技術(shù)的發(fā)展,視頻信息獲取設(shè)備得到廣泛應(yīng)用;趫D像、視頻和骨架等數(shù)據(jù)集的計(jì)算機(jī)視覺研究得到快速發(fā)展。特別基于深度學(xué)習(xí)方法的人體動(dòng)作識(shí)別逐漸成為計(jì)算機(jī)視覺領(lǐng)域的研究熱點(diǎn),在自動(dòng)駕駛、手勢(shì)控制和人機(jī)交互等領(lǐng)域具有廣泛的應(yīng)用價(jià)值;诠羌軘(shù)據(jù)集的人體動(dòng)作識(shí)別相比于視頻圖像人體行為識(shí)別方法魯棒性強(qiáng),不受光照、遮擋和背景顏色混入等因素影響。越來(lái)越多的研究者投入到基于人體骨架數(shù)據(jù)的動(dòng)作識(shí)別當(dāng)中并取得了顯著的成果。本文基于深度學(xué)習(xí)的人體骨架數(shù)據(jù)提出三種不同的模型:基于雙流卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)模型、基于卷積和循環(huán)神經(jīng)網(wǎng)絡(luò)相結(jié)合的模型和基于多流卷積神經(jīng)網(wǎng)絡(luò)的模型。(1)針對(duì)傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)模型動(dòng)作信息提取不充分的問(wèn)題,本文根據(jù)雙流結(jié)構(gòu)思想,提出基于雙流卷積神經(jīng)網(wǎng)絡(luò)的人體骨架動(dòng)作識(shí)別網(wǎng)絡(luò)模型。原始骨架序列作為一支流的輸入數(shù)據(jù),注意力機(jī)制增強(qiáng)骨架序列或骨架時(shí)域差分序列作為另一支流的輸入數(shù)據(jù)。雙流卷積神經(jīng)網(wǎng)絡(luò)從兩支流輸入數(shù)據(jù)中充分提取動(dòng)作特征信息,并選擇合適的融合方式進(jìn)行特征融合,證明雙流特征融合的卷積網(wǎng)絡(luò)模型對(duì)于檢測(cè)結(jié)果的提升具有很大的幫助。(2)針對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)過(guò)度關(guān)注骨架的時(shí)間依賴關(guān)系,但對(duì)空...
【文章來(lái)源】:中國(guó)礦業(yè)大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:84 頁(yè)
【學(xué)位級(jí)別】:碩士
【圖文】:
深度學(xué)習(xí)研究領(lǐng)域
碩士學(xué)位論文2研究以人為中心對(duì)象的計(jì)算機(jī)視覺技術(shù)相關(guān)領(lǐng)域主要包括:人體動(dòng)作識(shí)別、人體運(yùn)動(dòng)分析、人員檢測(cè)與跟蹤等。早在語(yǔ)言產(chǎn)生之前,遠(yuǎn)古人類通過(guò)簡(jiǎn)單的肢體動(dòng)作和聲音等進(jìn)行群體簡(jiǎn)單溝通與協(xié)作,維持正常的生產(chǎn)生活。心理學(xué)家研究表明人體動(dòng)作在溝通中占有重要的比重[1]。上世紀(jì)開始,語(yǔ)音識(shí)別和自然語(yǔ)言處理取得快速發(fā)展,目前隨著人工智能以及計(jì)算機(jī)技術(shù)的成熟,在對(duì)話機(jī)器人、文本理解和推理、情感分析等學(xué)習(xí)生活中得到廣泛應(yīng)用。相對(duì)于語(yǔ)音識(shí)別和自然語(yǔ)言處理方面,人體動(dòng)作識(shí)別作為一種全新的技術(shù),主要通過(guò)肢體語(yǔ)方式即姿態(tài)和動(dòng)作來(lái)傳達(dá)信息。人體動(dòng)作識(shí)別作為人體行為預(yù)測(cè)和跟蹤的基礎(chǔ),同時(shí)也是計(jì)算機(jī)視覺領(lǐng)域的重要研究?jī)?nèi)容,在智能監(jiān)控、國(guó)防安全、人機(jī)交互、公共安全、生產(chǎn)安全等各領(lǐng)域具有廣泛的應(yīng)用前景。例如在工廠、機(jī)場(chǎng)和車站等嘈雜的戶外環(huán)境中,采用人體姿態(tài)、手勢(shì)等人機(jī)交互方式能夠獲得比語(yǔ)音更準(zhǔn)確的信息輸入。人體動(dòng)作識(shí)別廣泛應(yīng)用前景如下圖1-2所示。圖1-2人體動(dòng)作識(shí)別未來(lái)應(yīng)用場(chǎng)景Figure1-2Humanactionrecognitionfutureapplicationscenarios近年來(lái)雖然人體行為識(shí)別在計(jì)算機(jī)視覺領(lǐng)域研究取得了飛速發(fā)展,但限于行為表現(xiàn)、環(huán)境和時(shí)間等各種差異性,人體動(dòng)作識(shí)別和檢測(cè)[2][3]仍是計(jì)算機(jī)視覺中一項(xiàng)基礎(chǔ)且具有挑戰(zhàn)性的任務(wù)。例如基于RGB視頻幀序列的人體識(shí)別技術(shù)和檢測(cè)準(zhǔn)確率得到很大的提高和顯著的研究成果。但由于人體動(dòng)作的靈活多樣性,受到光照明暗條件,圖片尺寸大孝拍攝角度、顏色及遮擋、缺乏三維空間信息等
1緒論3不可避免因素的影響,使得目前人體動(dòng)作識(shí)別面臨重要挑戰(zhàn)和難題。如下圖1-3所示,不同環(huán)境對(duì)人物識(shí)別的影響。(a)運(yùn)動(dòng)速度(b)光照強(qiáng)度(c)背景色混入(d)拍攝角度(e)肢體形狀(f)遮擋圖1-3人體識(shí)別的影響因素Figure1-3Influencingfactorsofhumanrecognition此外人體動(dòng)作識(shí)別在運(yùn)動(dòng)分析、人機(jī)交互、智能監(jiān)控和視頻檢索等領(lǐng)域逐漸實(shí)現(xiàn)了應(yīng)用,未來(lái)具有巨大的應(yīng)用需求和廣泛的應(yīng)用前景。人體動(dòng)作識(shí)別作為計(jì)算機(jī)視覺領(lǐng)域的研究熱點(diǎn),同時(shí)也是人體行為預(yù)測(cè)和人員跟蹤的基礎(chǔ),近年來(lái)在無(wú)人駕駛、手勢(shì)識(shí)別、人機(jī)交互、游戲控制和機(jī)器人視覺等領(lǐng)域得到廣泛應(yīng)用。(a)自動(dòng)駕駛(b)手勢(shì)控制(c)人機(jī)交互(d)機(jī)器人視覺圖1-4人體動(dòng)作識(shí)別的應(yīng)用Figure1-4Applicationofhumanactionrecognition(1)自動(dòng)駕駛,如圖1-4(a)中所示。自動(dòng)汽車駕駛(Autonomousvehicles)也稱為無(wú)人駕駛,通過(guò)智能系統(tǒng)實(shí)現(xiàn)無(wú)人駕駛功能。目前隨著計(jì)算機(jī)視覺和深度學(xué)習(xí)技術(shù)的發(fā)展,近年來(lái)正逐漸實(shí)現(xiàn)實(shí)用化。我國(guó)每年80%以上的交通事故是由
【參考文獻(xiàn)】:
期刊論文
[1]基于圖卷積的骨架行為識(shí)別[J]. 董安,左劼,孫頻捷. 現(xiàn)代計(jì)算機(jī). 2020(02)
[2]基于深度學(xué)習(xí)的人體行為識(shí)別[J]. 樊恒,徐俊,鄧勇,向金海. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版). 2016(04)
本文編號(hào):3352979
【文章來(lái)源】:中國(guó)礦業(yè)大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:84 頁(yè)
【學(xué)位級(jí)別】:碩士
【圖文】:
深度學(xué)習(xí)研究領(lǐng)域
碩士學(xué)位論文2研究以人為中心對(duì)象的計(jì)算機(jī)視覺技術(shù)相關(guān)領(lǐng)域主要包括:人體動(dòng)作識(shí)別、人體運(yùn)動(dòng)分析、人員檢測(cè)與跟蹤等。早在語(yǔ)言產(chǎn)生之前,遠(yuǎn)古人類通過(guò)簡(jiǎn)單的肢體動(dòng)作和聲音等進(jìn)行群體簡(jiǎn)單溝通與協(xié)作,維持正常的生產(chǎn)生活。心理學(xué)家研究表明人體動(dòng)作在溝通中占有重要的比重[1]。上世紀(jì)開始,語(yǔ)音識(shí)別和自然語(yǔ)言處理取得快速發(fā)展,目前隨著人工智能以及計(jì)算機(jī)技術(shù)的成熟,在對(duì)話機(jī)器人、文本理解和推理、情感分析等學(xué)習(xí)生活中得到廣泛應(yīng)用。相對(duì)于語(yǔ)音識(shí)別和自然語(yǔ)言處理方面,人體動(dòng)作識(shí)別作為一種全新的技術(shù),主要通過(guò)肢體語(yǔ)方式即姿態(tài)和動(dòng)作來(lái)傳達(dá)信息。人體動(dòng)作識(shí)別作為人體行為預(yù)測(cè)和跟蹤的基礎(chǔ),同時(shí)也是計(jì)算機(jī)視覺領(lǐng)域的重要研究?jī)?nèi)容,在智能監(jiān)控、國(guó)防安全、人機(jī)交互、公共安全、生產(chǎn)安全等各領(lǐng)域具有廣泛的應(yīng)用前景。例如在工廠、機(jī)場(chǎng)和車站等嘈雜的戶外環(huán)境中,采用人體姿態(tài)、手勢(shì)等人機(jī)交互方式能夠獲得比語(yǔ)音更準(zhǔn)確的信息輸入。人體動(dòng)作識(shí)別廣泛應(yīng)用前景如下圖1-2所示。圖1-2人體動(dòng)作識(shí)別未來(lái)應(yīng)用場(chǎng)景Figure1-2Humanactionrecognitionfutureapplicationscenarios近年來(lái)雖然人體行為識(shí)別在計(jì)算機(jī)視覺領(lǐng)域研究取得了飛速發(fā)展,但限于行為表現(xiàn)、環(huán)境和時(shí)間等各種差異性,人體動(dòng)作識(shí)別和檢測(cè)[2][3]仍是計(jì)算機(jī)視覺中一項(xiàng)基礎(chǔ)且具有挑戰(zhàn)性的任務(wù)。例如基于RGB視頻幀序列的人體識(shí)別技術(shù)和檢測(cè)準(zhǔn)確率得到很大的提高和顯著的研究成果。但由于人體動(dòng)作的靈活多樣性,受到光照明暗條件,圖片尺寸大孝拍攝角度、顏色及遮擋、缺乏三維空間信息等
1緒論3不可避免因素的影響,使得目前人體動(dòng)作識(shí)別面臨重要挑戰(zhàn)和難題。如下圖1-3所示,不同環(huán)境對(duì)人物識(shí)別的影響。(a)運(yùn)動(dòng)速度(b)光照強(qiáng)度(c)背景色混入(d)拍攝角度(e)肢體形狀(f)遮擋圖1-3人體識(shí)別的影響因素Figure1-3Influencingfactorsofhumanrecognition此外人體動(dòng)作識(shí)別在運(yùn)動(dòng)分析、人機(jī)交互、智能監(jiān)控和視頻檢索等領(lǐng)域逐漸實(shí)現(xiàn)了應(yīng)用,未來(lái)具有巨大的應(yīng)用需求和廣泛的應(yīng)用前景。人體動(dòng)作識(shí)別作為計(jì)算機(jī)視覺領(lǐng)域的研究熱點(diǎn),同時(shí)也是人體行為預(yù)測(cè)和人員跟蹤的基礎(chǔ),近年來(lái)在無(wú)人駕駛、手勢(shì)識(shí)別、人機(jī)交互、游戲控制和機(jī)器人視覺等領(lǐng)域得到廣泛應(yīng)用。(a)自動(dòng)駕駛(b)手勢(shì)控制(c)人機(jī)交互(d)機(jī)器人視覺圖1-4人體動(dòng)作識(shí)別的應(yīng)用Figure1-4Applicationofhumanactionrecognition(1)自動(dòng)駕駛,如圖1-4(a)中所示。自動(dòng)汽車駕駛(Autonomousvehicles)也稱為無(wú)人駕駛,通過(guò)智能系統(tǒng)實(shí)現(xiàn)無(wú)人駕駛功能。目前隨著計(jì)算機(jī)視覺和深度學(xué)習(xí)技術(shù)的發(fā)展,近年來(lái)正逐漸實(shí)現(xiàn)實(shí)用化。我國(guó)每年80%以上的交通事故是由
【參考文獻(xiàn)】:
期刊論文
[1]基于圖卷積的骨架行為識(shí)別[J]. 董安,左劼,孫頻捷. 現(xiàn)代計(jì)算機(jī). 2020(02)
[2]基于深度學(xué)習(xí)的人體行為識(shí)別[J]. 樊恒,徐俊,鄧勇,向金海. 武漢大學(xué)學(xué)報(bào)(信息科學(xué)版). 2016(04)
本文編號(hào):3352979
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3352979.html
最近更新
教材專著