人工智能中面向人類的行為分析
發(fā)布時(shí)間:2022-01-02 07:16
隨著海量訓(xùn)練數(shù)據(jù)的獲得、深度學(xué)習(xí)技術(shù)的進(jìn)步和相關(guān)知識(shí)的積累,人工智能在近十年里取得了舉世矚目的進(jìn)步。在接下來的幾年里,人們將迫切地需要以人為中心的人工智能應(yīng)用。該文希望通過對(duì)行為識(shí)別相關(guān)研究的介紹,讓讀者了解在開發(fā)面向理解人類的人工智能應(yīng)用上所取得的進(jìn)步。首先,從行為檢測和行為識(shí)別兩個(gè)子任務(wù)概述了行為分析,并討論了該任務(wù)中的難點(diǎn);其次,列舉了可用于行為分析的數(shù)據(jù)模態(tài)以及當(dāng)前被廣泛使用的數(shù)據(jù)庫;然后,介紹了當(dāng)前用于行為識(shí)別研究的主要工具,如卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò);最后,總結(jié)了近十年典型的行為識(shí)別方法,包括深度學(xué)習(xí)出現(xiàn)之前的傳統(tǒng)方法和深度學(xué)習(xí)方法。
【文章來源】:西北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2020,50(03)北大核心CSCD
【文章頁數(shù)】:10 頁
【部分圖文】:
行為檢測和識(shí)別舉例
在人工智能任務(wù)里,構(gòu)建智能系統(tǒng)與人工標(biāo)注的數(shù)據(jù)是密不可分的。近年來我們所使用的主要數(shù)據(jù)模態(tài)分別是視頻、光流、深度圖像和骨骼坐標(biāo)數(shù)據(jù),其中,光流可以被認(rèn)為是基于視頻數(shù)據(jù)的衍生。而從數(shù)據(jù)的采集條件來看,當(dāng)前數(shù)據(jù)主要有實(shí)驗(yàn)室條件下和in-the-wild條件下采集的兩種(帶有深度圖像的數(shù)據(jù)庫基本都是在實(shí)驗(yàn)室條件下采集的)。行為分析中被廣泛應(yīng)用的4種模態(tài)如圖2所示。圖2(a),(b),(d)3種模態(tài)實(shí)例來自Chalearn Looking At People(LAP)2014數(shù)據(jù)庫[9],圖2(c)來自于UCF-101數(shù)據(jù)庫[6]。2.1 圖像/視頻
卷積神經(jīng)網(wǎng)絡(luò)是機(jī)器視覺任務(wù)中最為流行的深度學(xué)習(xí)工具之一,已經(jīng)被廣泛應(yīng)用于物體識(shí)別、目標(biāo)檢測和行為分析等任務(wù)中。目前常用的卷積神經(jīng)網(wǎng)絡(luò)有常被用于語音信號(hào)處理的一維卷積模型、用于圖片分析的二維卷積模型和用于視頻分析的三維卷積模型。以二維神經(jīng)網(wǎng)絡(luò)為例,它使用一組濾波器對(duì)輸入數(shù)據(jù)以滑窗的方式進(jìn)行濾波,整個(gè)過程正如將輸入數(shù)據(jù)和濾波器權(quán)重做卷積操作,故得名卷積神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)特點(diǎn)使得它只能處理規(guī)則的網(wǎng)格結(jié)構(gòu)的數(shù)據(jù),這一點(diǎn)天然與機(jī)器視覺契合。再加上每一個(gè)濾波器使用的參數(shù)較少,通常在每層可以使用數(shù)百個(gè)濾波器對(duì)圖像進(jìn)行濾波,這使得它已經(jīng)成為機(jī)器視覺任務(wù)中主要的空間特征提取手段。圖3描述了二維卷積網(wǎng)絡(luò)的運(yùn)算過程。3.3 圖卷積網(wǎng)絡(luò)
本文編號(hào):3563734
【文章來源】:西北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2020,50(03)北大核心CSCD
【文章頁數(shù)】:10 頁
【部分圖文】:
行為檢測和識(shí)別舉例
在人工智能任務(wù)里,構(gòu)建智能系統(tǒng)與人工標(biāo)注的數(shù)據(jù)是密不可分的。近年來我們所使用的主要數(shù)據(jù)模態(tài)分別是視頻、光流、深度圖像和骨骼坐標(biāo)數(shù)據(jù),其中,光流可以被認(rèn)為是基于視頻數(shù)據(jù)的衍生。而從數(shù)據(jù)的采集條件來看,當(dāng)前數(shù)據(jù)主要有實(shí)驗(yàn)室條件下和in-the-wild條件下采集的兩種(帶有深度圖像的數(shù)據(jù)庫基本都是在實(shí)驗(yàn)室條件下采集的)。行為分析中被廣泛應(yīng)用的4種模態(tài)如圖2所示。圖2(a),(b),(d)3種模態(tài)實(shí)例來自Chalearn Looking At People(LAP)2014數(shù)據(jù)庫[9],圖2(c)來自于UCF-101數(shù)據(jù)庫[6]。2.1 圖像/視頻
卷積神經(jīng)網(wǎng)絡(luò)是機(jī)器視覺任務(wù)中最為流行的深度學(xué)習(xí)工具之一,已經(jīng)被廣泛應(yīng)用于物體識(shí)別、目標(biāo)檢測和行為分析等任務(wù)中。目前常用的卷積神經(jīng)網(wǎng)絡(luò)有常被用于語音信號(hào)處理的一維卷積模型、用于圖片分析的二維卷積模型和用于視頻分析的三維卷積模型。以二維神經(jīng)網(wǎng)絡(luò)為例,它使用一組濾波器對(duì)輸入數(shù)據(jù)以滑窗的方式進(jìn)行濾波,整個(gè)過程正如將輸入數(shù)據(jù)和濾波器權(quán)重做卷積操作,故得名卷積神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)特點(diǎn)使得它只能處理規(guī)則的網(wǎng)格結(jié)構(gòu)的數(shù)據(jù),這一點(diǎn)天然與機(jī)器視覺契合。再加上每一個(gè)濾波器使用的參數(shù)較少,通常在每層可以使用數(shù)百個(gè)濾波器對(duì)圖像進(jìn)行濾波,這使得它已經(jīng)成為機(jī)器視覺任務(wù)中主要的空間特征提取手段。圖3描述了二維卷積網(wǎng)絡(luò)的運(yùn)算過程。3.3 圖卷積網(wǎng)絡(luò)
本文編號(hào):3563734
本文鏈接:http://sikaile.net/kejilunwen/rengongzhinen/3563734.html
最近更新
教材專著