基于深度強化學(xué)習(xí)的主動人臉感知技術(shù)研究
本文選題:服務(wù)機器人 + 主動人臉感知。 參考:《山東大學(xué)》2017年碩士論文
【摘要】:服務(wù)機器人是機器人行業(yè)重要的一個研究方向。近幾年,面向教育、醫(yī)療、家居等行業(yè)的服務(wù)機器人在市場上涌現(xiàn),但是當(dāng)前服務(wù)機器人行業(yè)普遍沒有得到用戶的良好反應(yīng),其主要原因在于技術(shù)積淀不足,很多技術(shù)問題尚未解決。例如服務(wù)機器人為了和人進行友好的交互,一般需要服務(wù)機器人的感知器能夠主動對準(zhǔn)人臉,實現(xiàn)面對面交流的效果。然而現(xiàn)有的方法只能在人臉已經(jīng)進入機器人視野后,機器人才能意識到已經(jīng)有人出現(xiàn),不能通過人的其他身體部位進行判斷。另外,服務(wù)機器人的陌生人報警和面向不同用戶進行個性化交流的功能,都需要機器人進行人臉識別,這就要求機器人能夠主動感知人臉?biāo)谖恢谩_@樣不僅能夠在感官上提升人和機器人的交互體驗,更是正確識別不同人身份信息的重要條件。在現(xiàn)有的技術(shù)方案中,通常需要人配合機器人,自主移動到機器人的視野中,然而在大部分情況下,人只是走進了機器人的視野,機器人卻沒有或者很難感知到完整的人臉信息。如何讓機器人主動的進行人臉感知,并通過調(diào)整自身姿態(tài)來獲取更多有用的信息,這個問題就是本課題著重解決的問題。針對上文所提出的問題,我們希望通過訓(xùn)練得到一個決策網(wǎng)絡(luò),該網(wǎng)絡(luò)能夠根據(jù)當(dāng)前機器人所獲得的信息推斷目標(biāo)位置并執(zhí)行相關(guān)動作。這一過程被定義為主動人臉感知問題。主動人臉感知問題可以建模為馬爾可夫決策過程,從而采用深度強化學(xué)習(xí)算法訓(xùn)練智能體完成主動人臉感知任務(wù)。本文基于深度強化學(xué)習(xí)算法,實現(xiàn)了主動人臉感知,完成的工作可以分為以下幾個方面:1、介紹了主動人臉感知問題的研究現(xiàn)狀,通過分析國內(nèi)外的研究成果,結(jié)合服務(wù)機器人的實際情況,歸納出本文所解決的問題:在人臉未進入機器人視野的情況下,如何主動尋找人臉。通過對強化學(xué)習(xí)、深度學(xué)習(xí)和深度強化學(xué)習(xí)的理論研究,本文提出了一種采用深度強化學(xué)習(xí)算法進行主動人臉感知的方法。2、詳細介紹了深度強化學(xué)習(xí)的基礎(chǔ)算法深度學(xué)習(xí)和強化學(xué)習(xí),在總結(jié)他們的算法原理和優(yōu)缺點的基礎(chǔ)上,概況了深度強化學(xué)習(xí)在解決主動人臉感知問題中的優(yōu)勢。3、將主動人臉感知問題建模為馬爾可夫過程。從理論上論證,本課題提出的深度強化學(xué)習(xí)方法能夠訓(xùn)練策略網(wǎng)絡(luò)來解決人臉感知問題。4、由于在實際場景中驗證算法會花費大量的人力物力,本工作先構(gòu)建了一個仿真的實驗場景。在仿真場景中對算法進行驗證,確保算法可行性的基礎(chǔ)上,再將算法移植到實際場景中進行驗證。5、本文把深度強化學(xué)習(xí)算法應(yīng)用在實際的場景中。采用一個主動相機來模擬服務(wù)機器人,訓(xùn)練機器人在只看到人腳的時候,能夠主動地尋找到人臉。通過實驗驗證,本文提出的方法有效地解決了主動人臉感知問題,通過仿真和離線兩種訓(xùn)練方式,有效的推動了主動人臉感知技術(shù)在實際場景中的應(yīng)用。
[Abstract]:Service robot is an important research direction in robot industry. In recent years, service robots for education, medical, home and other industries have emerged in the market, but the current service robot industry has generally failed to get a good response from users. The main reason is that the technology accumulation is insufficient. Many technical problems remain unresolved. For example, in order to conduct friendly interaction with people, service robots usually need the sensor of service robots to be able to actively target the face and realize the effect of face to face communication. However, the existing methods only after the human face has entered the robot field of vision, the robot can realize that someone has appeared, can not be judged by other parts of the human body. In addition, the functions of strangers alarm and personalized communication for different users require robot face recognition, which requires the robot to actively perceive the location of the face. This not only can enhance the interaction experience between human and robot in sense, but also is an important condition to correctly identify the identity information of different people. In the existing technical scheme, people are usually required to cooperate with the robot and move autonomously into the robot's field of vision. However, in most cases, people just walk into the field of vision of the robot. But the robot has no or very difficult to perceive the complete face information. How to make the robot active face perception and adjust its own posture to obtain more useful information, this problem is the focus of this topic. In order to solve the above problems, we hope to obtain a decision network through training, which can infer the position of the target and perform related actions based on the information obtained by the current robot. This process is defined as an active face perception problem. The active face perception problem can be modeled as a Markov decision process, and then the agent can be trained to accomplish the task of active face perception by using the depth reinforcement learning algorithm. Based on the deep reinforcement learning algorithm, the active face perception is realized in this paper. The work can be divided into the following aspects: 1. This paper introduces the research status of active face perception, and analyzes the research results at home and abroad. Combined with the actual situation of the service robot, the problem that this paper solves is summarized: how to find the human face actively without entering the robot field of vision. Through the theoretical research of intensive learning, deep learning and deep reinforcement learning, In this paper, a method of active face perception using depth reinforcement learning algorithm is proposed. The basic algorithm of depth reinforcement learning and reinforcement learning are introduced in detail. The principle, advantages and disadvantages of these algorithms are summarized. The advantage of deep reinforcement learning in solving active face perception problem is summarized, and the active face perception problem is modeled as Markov process. It is proved theoretically that the depth reinforcement learning method proposed in this paper can train the strategy network to solve the face perception problem .4. because it takes a lot of manpower and material resources to verify the algorithm in the actual scene. In this paper, a simulation experiment scene is constructed. On the basis of verifying the algorithm in the simulation scene and ensuring the feasibility of the algorithm, the algorithm is transplanted to the actual scene to verify .5. this paper applies the depth reinforcement learning algorithm to the actual scene. An active camera is used to simulate the service robot, and the robot is trained to find the human face actively when it sees only the human foot. The experimental results show that the proposed method can effectively solve the problem of active face perception and promote the application of active face perception technology in the actual scene effectively through simulation and offline training.
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP242;TP18
【相似文獻】
相關(guān)期刊論文 前10條
1 蔡鶴皋;機器人將是21世紀(jì)技術(shù)發(fā)展的熱點[J];中國機械工程;2000年Z1期
2 ;世界機器人最新統(tǒng)計數(shù)據(jù)[J];機器人技術(shù)與應(yīng)用;2000年01期
3 ;警衛(wèi)和保潔兩用機器人[J];機器人技術(shù)與應(yīng)用;2000年03期
4 ;案例分析之四 機器人碼垛單元[J];機器人技術(shù)與應(yīng)用;2000年04期
5 李成桐;對中國機器人產(chǎn)業(yè)的思考(之二) 未來之路[J];機器人技術(shù)與應(yīng)用;2000年05期
6 賈培發(fā),王全福;團結(jié)奮斗努力實現(xiàn)中國機器人產(chǎn)業(yè)化[J];機器人技術(shù)與應(yīng)用;2000年06期
7 李開生,張慧慧,費仁元,宗光華;國外服務(wù)機器人的發(fā)展動態(tài)和前景[J];制造業(yè)自動化;2000年06期
8 淑芳;機器人種菜[J];湖南農(nóng)業(yè);2000年09期
9 長路;機器人技術(shù)在發(fā)展[J];世界制造技術(shù)與裝備市場;2001年01期
10 賈一;機器人外科手術(shù)的必要技術(shù)條件[J];機器人技術(shù)與應(yīng)用;2002年04期
相關(guān)會議論文 前10條
1 胡春華;范勇;朱紀(jì)洪;孫增圻;;空中機器人的研究現(xiàn)狀與發(fā)展趨勢[A];2005年中國智能自動化會議論文集[C];2005年
2 陳衛(wèi)東;;服務(wù)機器人的技術(shù)發(fā)展及微特電機在其中的應(yīng)用[A];第十屆中國小電機技術(shù)研討會論文集[C];2005年
3 肖玉林;侍才洪;陳煒;李浩;張西正;;救援機器人的現(xiàn)狀及發(fā)展趨勢(綜述)[A];天津市生物醫(yī)學(xué)工程學(xué)會第三十四屆學(xué)術(shù)年會論文集[C];2014年
4 鄭亞青;吳建坡;;岸邊集裝箱宏-微起重機器人的機構(gòu)、結(jié)構(gòu)設(shè)計及運動仿真[A];2009海峽兩岸機械科技論壇論文集[C];2009年
5 王靜;邊繼東;張大慧;林峰華;張宏;;管道定量采樣機器人系統(tǒng)設(shè)計[A];2009全國虛擬儀器大會論文集(二)[C];2009年
6 黃海明;楊雷;宋躍;賴思沅;;智能保安巡邏機器人[A];2009全國虛擬儀器大會論文集(二)[C];2009年
7 王明輝;馬書根;李斌;;獨立操作型可重構(gòu)機器人群體的動態(tài)層次體系結(jié)構(gòu)研究[A];第八屆全國信息獲取與處理學(xué)術(shù)會議論文集[C];2010年
8 譚金林;劉明英;梁建民;;機器人硬件電路設(shè)計[A];1995年中國智能自動化學(xué)術(shù)會議暨智能自動化專業(yè)委員會成立大會論文集(下冊)[C];1995年
9 許家中;孔祥冰;尤波;李長峰;禹鑫q,
本文編號:2099231
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2099231.html