面向機(jī)器人操作的示教學(xué)習(xí)與智能控制方法研究
發(fā)布時(shí)間:2021-01-11 17:47
機(jī)器人操作的應(yīng)用場景廣泛、潛力巨大。但就現(xiàn)階段而言大部分機(jī)器人部署在結(jié)構(gòu)化環(huán)境中按照人工預(yù)定義的規(guī)則從事單一、重復(fù)和具有規(guī)律性的工作。如何結(jié)合人工智能與機(jī)器人技術(shù),實(shí)現(xiàn)機(jī)器人對操作技能的理解、學(xué)習(xí),而無需繁瑣的手工編程與調(diào)試是提高機(jī)器人智能化水平、降低機(jī)器人使用門檻和部署周期、促進(jìn)產(chǎn)業(yè)升級(jí)的重要途徑。當(dāng)前,隨著人工智能技術(shù)的快速發(fā)展,機(jī)器人操作學(xué)習(xí)技術(shù)已成為機(jī)器人前沿領(lǐng)域的研究熱點(diǎn);谏鲜鲅芯勘尘,本學(xué)位論文主要研究如何讓機(jī)器人理解學(xué)習(xí)任務(wù)操作中的基本運(yùn)動(dòng),包括點(diǎn)到點(diǎn)運(yùn)動(dòng)、軌跡追蹤運(yùn)動(dòng)、柔順運(yùn)動(dòng)以及手眼協(xié)調(diào)運(yùn)動(dòng)等,有效解決了點(diǎn)到點(diǎn)運(yùn)動(dòng)學(xué)習(xí)快速性、精度與魯棒性的權(quán)衡問題,軌跡追蹤運(yùn)動(dòng)學(xué)習(xí)的泛化問題,柔順運(yùn)動(dòng)中力位混合學(xué)習(xí)與模型參數(shù)遞歸更新問題等。總體而言,本論文主要研究內(nèi)容與貢獻(xiàn)如下:(1)提出了一種基于前饋神經(jīng)網(wǎng)絡(luò)的點(diǎn)對點(diǎn)運(yùn)動(dòng)學(xué)習(xí)框架,該方法采用了超限學(xué)習(xí)機(jī)對人類示教動(dòng)作進(jìn)行建模和學(xué)習(xí),并通過將李雅普諾夫穩(wěn)定性判據(jù)融入到神經(jīng)網(wǎng)絡(luò)最優(yōu)化過程的約束條件中,以確保到點(diǎn)運(yùn)動(dòng)穩(wěn)定收斂到期望位置。所提出的方法不僅能夠提高學(xué)習(xí)的速度,還在復(fù)現(xiàn)中展示出較高的魯棒性和精度,相比于其他方法具有結(jié)構(gòu)簡單、...
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院深圳先進(jìn)技術(shù)研究院)廣東省
【文章頁數(shù)】:105 頁
【學(xué)位級(jí)別】:博士
【部分圖文】:
機(jī)器人軌跡追蹤運(yùn)動(dòng)的兩種典型應(yīng)用場景
在之前的研究中,學(xué)者們大多采用機(jī)器人示教學(xué)習(xí)技術(shù)來建模軌跡生成策略,然后將策略模型用于任務(wù)執(zhí)行中機(jī)器人運(yùn)動(dòng)軌跡的生成。例如動(dòng)態(tài)運(yùn)動(dòng)基元(Dynamic movement primitives,DMP)[21,22],動(dòng)態(tài)系統(tǒng)的穩(wěn)定估計(jì)器(Stable estimator of dynamical systems,SEDS)方法[8,15],動(dòng)態(tài)系統(tǒng)的快速穩(wěn)定建模[57]等方法。然而,在實(shí)際應(yīng)用中出現(xiàn)了兩個(gè)問題:首先,這些方法以離線方式收集并建模機(jī)器人的運(yùn)動(dòng)軌跡,這些過程很耗時(shí),有時(shí)甚至比手動(dòng)編程耗時(shí)還要長,因此采用離線方式的RLfD技術(shù)優(yōu)勢在少批量多品種生產(chǎn)線中并不理想。其次,這些方法通常用于學(xué)習(xí)機(jī)器人的運(yùn)動(dòng)軌跡,然而單純的位置控制器不足以實(shí)現(xiàn)精巧和柔順的機(jī)器人操作[58]。柔順操作任務(wù)不僅包含運(yùn)動(dòng)軌跡的生成,而且還需要與環(huán)境進(jìn)行力交互,如圖1.3所示。在該圖中,紅線表示一段機(jī)器人運(yùn)動(dòng)軌跡,帶狀橢圓形表示末端執(zhí)行器和計(jì)算機(jī)屏幕之間的交互力。圖中的Motion指的是在任務(wù)執(zhí)行中生成的一條從起點(diǎn)到終點(diǎn)的運(yùn)動(dòng)軌跡。圖中的Interaction指的是機(jī)器人與環(huán)境的相互作用是指機(jī)器人在其接觸點(diǎn)/表面上動(dòng)態(tài)調(diào)節(jié)機(jī)器人的柔順行為(例如在必要時(shí)使機(jī)器人柔順或僵硬)。因此,軌跡生成與柔順等級(jí)調(diào)節(jié)這兩項(xiàng)技能對于安全、成功地執(zhí)行許多機(jī)器人任務(wù)至關(guān)重要。在圖1.3所示的例子中,僅僅依靠機(jī)器人的位置控制來清潔計(jì)算機(jī)屏幕很難保證任務(wù)的成功完成,因?yàn)檩p微的擾動(dòng)就可能導(dǎo)致用力過大或用力不足,并最終導(dǎo)致屏幕破裂或無法擦除污垢。此外,日常中常見的操作任務(wù)很多都涉及接觸或是需要對不可預(yù)見的擾動(dòng)做出適當(dāng)?shù)姆磻?yīng),采用示教學(xué)習(xí)技術(shù)學(xué)習(xí)如何調(diào)整柔順行為以滿足任務(wù)需求仍是一個(gè)亟待解決的問題[59]。研究者們?yōu)榱耸沟脵C(jī)器人具有滿足任務(wù)要求的柔順性,提出了很多解決方案:文獻(xiàn)[60,61]根據(jù)傳感器(人工觸覺皮膚或力/扭矩傳感器)獲得的實(shí)時(shí)力/觸反饋設(shè)計(jì)了相應(yīng)的柔順控制器。文獻(xiàn)[62,63]通過減少機(jī)器人結(jié)構(gòu)的重量和硬度或采用彈性元件設(shè)計(jì)來滿足任務(wù)需求的柔順行為,這類方法被稱為被動(dòng)柔順控制。此外,一些研究者通過設(shè)計(jì)主動(dòng)轉(zhuǎn)矩控制策略來讓機(jī)器人智能地產(chǎn)生柔順行為[64–66]。由于主動(dòng)柔順控制方法的智能性和精確性[67],所以被認(rèn)為是應(yīng)用前景更為廣泛的柔順控制方法。阻抗控制可以通過在末端執(zhí)行器上建立適當(dāng)?shù)奶摂M質(zhì)量彈簧阻尼器系統(tǒng)來調(diào)節(jié)機(jī)器人對相互作用力的動(dòng)態(tài)響應(yīng)[64]。與人體肢體阻抗調(diào)整相似,在任務(wù)執(zhí)行中阻抗控制模型的參數(shù)應(yīng)根據(jù)任務(wù)需求進(jìn)行調(diào)整[68]。通過模仿人類行為的方式讓機(jī)器人領(lǐng)會(huì)和學(xué)習(xí)阻抗變化曲線和技巧是一種行之有效的方法[69–72]。
與其他兩類視覺伺服方法相比,基于圖像的視覺伺服不需要進(jìn)行3D的位姿估計(jì),并且對深度估計(jì)誤差具有魯棒性。因此,本文擬在基于圖像的視覺伺服框架下開展機(jī)器人視覺伺服的抓取操作學(xué)習(xí)研究,此外,為了避免機(jī)械臂抓取過程中對相機(jī)的遮擋問題,本文采用眼在手上(Eye-in-Hand)的機(jī)器人視覺伺服系統(tǒng)配置方式,如圖1.4所示。視覺引導(dǎo)的機(jī)器人抓取操作是機(jī)器人應(yīng)用中最基本、最常見的應(yīng)用之一,是一個(gè)已被廣泛研究且不斷發(fā)展的領(lǐng)域。在之前的研究工作中很多聚焦在基于物體幾何形狀的抓取方法研究[84–86]和基于數(shù)據(jù)驅(qū)動(dòng)的手指放置位置學(xué)習(xí)[87–92],更為全面的機(jī)器人抓取綜述請參見文獻(xiàn)[93]。本文并不研究基于物體幾何形狀的抓取規(guī)劃問題,而是研究抓取的另一個(gè)方面,如何基于視覺反饋信息完成抓取的問題[94–96]。針對這個(gè)問題,在事先標(biāo)定的情形下,研究者們提出了很多行之有效的基于視覺的機(jī)器人操作方法[83,97]。然而此類視覺伺服方法實(shí)現(xiàn)成功抓取的一個(gè)非常基礎(chǔ)且關(guān)鍵的步驟是預(yù)先標(biāo)定相機(jī)(亦即機(jī)器人的眼)與機(jī)器人(亦即機(jī)器人的手)坐標(biāo)系之間的轉(zhuǎn)換關(guān)系(圖像雅克比矩陣),但是機(jī)器人視覺伺服系統(tǒng)標(biāo)定通常較為繁瑣,需要專門的標(biāo)定環(huán)節(jié)和工具,因此研究無手眼標(biāo)定下的伺服抓取是非常有意義的課題。
【參考文獻(xiàn)】:
期刊論文
[1]機(jī)器人操作技能模型綜述[J]. 秦方博,徐德. 自動(dòng)化學(xué)報(bào). 2019(08)
[2]機(jī)器人操作技能學(xué)習(xí)方法綜述[J]. 劉乃軍,魯濤,蔡瑩皓,王碩. 自動(dòng)化學(xué)報(bào). 2019(03)
[3]機(jī)器人無標(biāo)定視覺伺服控制研究進(jìn)展[J]. 陶波,龔澤宇,丁漢. 力學(xué)學(xué)報(bào). 2016(04)
[4]基于ELM的機(jī)器人自適應(yīng)跟蹤控制[J]. 李軍,乃永強(qiáng). 電機(jī)與控制學(xué)報(bào). 2015(04)
[5]基于自適應(yīng)kalman濾波的機(jī)器人6DOF無標(biāo)定視覺定位[J]. 辛菁,白蕾,劉丁. 系統(tǒng)仿真學(xué)報(bào). 2014(03)
[6]采用SVR-雅可比估計(jì)器的焊接機(jī)器人視覺導(dǎo)引[J]. 李鶴喜,石永華,王國榮. 華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(07)
[7]帶有時(shí)延補(bǔ)償?shù)膱D像雅可比矩陣估計(jì)方法[J]. 高振東,蘇劍波. 控制理論與應(yīng)用. 2009(01)
本文編號(hào):2971215
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院深圳先進(jìn)技術(shù)研究院)廣東省
【文章頁數(shù)】:105 頁
【學(xué)位級(jí)別】:博士
【部分圖文】:
機(jī)器人軌跡追蹤運(yùn)動(dòng)的兩種典型應(yīng)用場景
在之前的研究中,學(xué)者們大多采用機(jī)器人示教學(xué)習(xí)技術(shù)來建模軌跡生成策略,然后將策略模型用于任務(wù)執(zhí)行中機(jī)器人運(yùn)動(dòng)軌跡的生成。例如動(dòng)態(tài)運(yùn)動(dòng)基元(Dynamic movement primitives,DMP)[21,22],動(dòng)態(tài)系統(tǒng)的穩(wěn)定估計(jì)器(Stable estimator of dynamical systems,SEDS)方法[8,15],動(dòng)態(tài)系統(tǒng)的快速穩(wěn)定建模[57]等方法。然而,在實(shí)際應(yīng)用中出現(xiàn)了兩個(gè)問題:首先,這些方法以離線方式收集并建模機(jī)器人的運(yùn)動(dòng)軌跡,這些過程很耗時(shí),有時(shí)甚至比手動(dòng)編程耗時(shí)還要長,因此采用離線方式的RLfD技術(shù)優(yōu)勢在少批量多品種生產(chǎn)線中并不理想。其次,這些方法通常用于學(xué)習(xí)機(jī)器人的運(yùn)動(dòng)軌跡,然而單純的位置控制器不足以實(shí)現(xiàn)精巧和柔順的機(jī)器人操作[58]。柔順操作任務(wù)不僅包含運(yùn)動(dòng)軌跡的生成,而且還需要與環(huán)境進(jìn)行力交互,如圖1.3所示。在該圖中,紅線表示一段機(jī)器人運(yùn)動(dòng)軌跡,帶狀橢圓形表示末端執(zhí)行器和計(jì)算機(jī)屏幕之間的交互力。圖中的Motion指的是在任務(wù)執(zhí)行中生成的一條從起點(diǎn)到終點(diǎn)的運(yùn)動(dòng)軌跡。圖中的Interaction指的是機(jī)器人與環(huán)境的相互作用是指機(jī)器人在其接觸點(diǎn)/表面上動(dòng)態(tài)調(diào)節(jié)機(jī)器人的柔順行為(例如在必要時(shí)使機(jī)器人柔順或僵硬)。因此,軌跡生成與柔順等級(jí)調(diào)節(jié)這兩項(xiàng)技能對于安全、成功地執(zhí)行許多機(jī)器人任務(wù)至關(guān)重要。在圖1.3所示的例子中,僅僅依靠機(jī)器人的位置控制來清潔計(jì)算機(jī)屏幕很難保證任務(wù)的成功完成,因?yàn)檩p微的擾動(dòng)就可能導(dǎo)致用力過大或用力不足,并最終導(dǎo)致屏幕破裂或無法擦除污垢。此外,日常中常見的操作任務(wù)很多都涉及接觸或是需要對不可預(yù)見的擾動(dòng)做出適當(dāng)?shù)姆磻?yīng),采用示教學(xué)習(xí)技術(shù)學(xué)習(xí)如何調(diào)整柔順行為以滿足任務(wù)需求仍是一個(gè)亟待解決的問題[59]。研究者們?yōu)榱耸沟脵C(jī)器人具有滿足任務(wù)要求的柔順性,提出了很多解決方案:文獻(xiàn)[60,61]根據(jù)傳感器(人工觸覺皮膚或力/扭矩傳感器)獲得的實(shí)時(shí)力/觸反饋設(shè)計(jì)了相應(yīng)的柔順控制器。文獻(xiàn)[62,63]通過減少機(jī)器人結(jié)構(gòu)的重量和硬度或采用彈性元件設(shè)計(jì)來滿足任務(wù)需求的柔順行為,這類方法被稱為被動(dòng)柔順控制。此外,一些研究者通過設(shè)計(jì)主動(dòng)轉(zhuǎn)矩控制策略來讓機(jī)器人智能地產(chǎn)生柔順行為[64–66]。由于主動(dòng)柔順控制方法的智能性和精確性[67],所以被認(rèn)為是應(yīng)用前景更為廣泛的柔順控制方法。阻抗控制可以通過在末端執(zhí)行器上建立適當(dāng)?shù)奶摂M質(zhì)量彈簧阻尼器系統(tǒng)來調(diào)節(jié)機(jī)器人對相互作用力的動(dòng)態(tài)響應(yīng)[64]。與人體肢體阻抗調(diào)整相似,在任務(wù)執(zhí)行中阻抗控制模型的參數(shù)應(yīng)根據(jù)任務(wù)需求進(jìn)行調(diào)整[68]。通過模仿人類行為的方式讓機(jī)器人領(lǐng)會(huì)和學(xué)習(xí)阻抗變化曲線和技巧是一種行之有效的方法[69–72]。
與其他兩類視覺伺服方法相比,基于圖像的視覺伺服不需要進(jìn)行3D的位姿估計(jì),并且對深度估計(jì)誤差具有魯棒性。因此,本文擬在基于圖像的視覺伺服框架下開展機(jī)器人視覺伺服的抓取操作學(xué)習(xí)研究,此外,為了避免機(jī)械臂抓取過程中對相機(jī)的遮擋問題,本文采用眼在手上(Eye-in-Hand)的機(jī)器人視覺伺服系統(tǒng)配置方式,如圖1.4所示。視覺引導(dǎo)的機(jī)器人抓取操作是機(jī)器人應(yīng)用中最基本、最常見的應(yīng)用之一,是一個(gè)已被廣泛研究且不斷發(fā)展的領(lǐng)域。在之前的研究工作中很多聚焦在基于物體幾何形狀的抓取方法研究[84–86]和基于數(shù)據(jù)驅(qū)動(dòng)的手指放置位置學(xué)習(xí)[87–92],更為全面的機(jī)器人抓取綜述請參見文獻(xiàn)[93]。本文并不研究基于物體幾何形狀的抓取規(guī)劃問題,而是研究抓取的另一個(gè)方面,如何基于視覺反饋信息完成抓取的問題[94–96]。針對這個(gè)問題,在事先標(biāo)定的情形下,研究者們提出了很多行之有效的基于視覺的機(jī)器人操作方法[83,97]。然而此類視覺伺服方法實(shí)現(xiàn)成功抓取的一個(gè)非常基礎(chǔ)且關(guān)鍵的步驟是預(yù)先標(biāo)定相機(jī)(亦即機(jī)器人的眼)與機(jī)器人(亦即機(jī)器人的手)坐標(biāo)系之間的轉(zhuǎn)換關(guān)系(圖像雅克比矩陣),但是機(jī)器人視覺伺服系統(tǒng)標(biāo)定通常較為繁瑣,需要專門的標(biāo)定環(huán)節(jié)和工具,因此研究無手眼標(biāo)定下的伺服抓取是非常有意義的課題。
【參考文獻(xiàn)】:
期刊論文
[1]機(jī)器人操作技能模型綜述[J]. 秦方博,徐德. 自動(dòng)化學(xué)報(bào). 2019(08)
[2]機(jī)器人操作技能學(xué)習(xí)方法綜述[J]. 劉乃軍,魯濤,蔡瑩皓,王碩. 自動(dòng)化學(xué)報(bào). 2019(03)
[3]機(jī)器人無標(biāo)定視覺伺服控制研究進(jìn)展[J]. 陶波,龔澤宇,丁漢. 力學(xué)學(xué)報(bào). 2016(04)
[4]基于ELM的機(jī)器人自適應(yīng)跟蹤控制[J]. 李軍,乃永強(qiáng). 電機(jī)與控制學(xué)報(bào). 2015(04)
[5]基于自適應(yīng)kalman濾波的機(jī)器人6DOF無標(biāo)定視覺定位[J]. 辛菁,白蕾,劉丁. 系統(tǒng)仿真學(xué)報(bào). 2014(03)
[6]采用SVR-雅可比估計(jì)器的焊接機(jī)器人視覺導(dǎo)引[J]. 李鶴喜,石永華,王國榮. 華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(07)
[7]帶有時(shí)延補(bǔ)償?shù)膱D像雅可比矩陣估計(jì)方法[J]. 高振東,蘇劍波. 控制理論與應(yīng)用. 2009(01)
本文編號(hào):2971215
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/2971215.html
最近更新
教材專著