基于深度學(xué)習(xí)的智能汽車容錯感知與決策控制方法研究
發(fā)布時間:2020-03-21 04:21
【摘要】:隨著硬件設(shè)備和人工智能算法的不斷發(fā)展,人工智能已經(jīng)滲透到生活的各個方面,人工智能輔助甚至完全替代人類操作成為一種趨勢。智能汽車(IV)搭載的先進駕駛輔助系統(tǒng)(Advanced Driving Assistance System,ADAS)利用安裝在車上的多種傳感器,在汽車行駛過程中實時感應(yīng)周圍的環(huán)境,采集數(shù)據(jù),進行靜態(tài)、動態(tài)目標的識別、檢測與追蹤,并結(jié)合導(dǎo)航儀地圖數(shù)據(jù),進行系統(tǒng)的運算與分析,從而預(yù)先讓駕駛者察覺到可能發(fā)生的危險,有效地增加了汽車駕駛的舒適性和安全性。ADAS系統(tǒng)被中國汽車行業(yè)視為“彎道超車”歐美及日本等汽車強國的最佳途徑。然而,傳統(tǒng)ADAS系統(tǒng)結(jié)構(gòu)往往以其中所有環(huán)節(jié)正常工作為前提所設(shè)計,實際應(yīng)用中缺乏容錯機制。2016年7月發(fā)生的特斯拉自動駕駛致人死亡事故,依賴于攝像頭傳感器的系統(tǒng)將白色卡車車身上的反光判別成天空區(qū)域;2018年發(fā)生的Uber自動駕駛系統(tǒng)碰撞行人導(dǎo)致行人死亡的事故,由于夜晚,攝像頭發(fā)現(xiàn)行人的時間過晚,Lidar系統(tǒng)發(fā)現(xiàn)行人卻沒有被系統(tǒng)采信,而最后時刻發(fā)現(xiàn)行人準備采取緊急制動時,系統(tǒng)為了保持汽車姿態(tài)沒有采取行動。針對出現(xiàn)的種種問題,ADAS系統(tǒng)亟需在容錯上取得進展。本文在ADAS系統(tǒng)的傳統(tǒng)架構(gòu)“數(shù)據(jù)采集—目標檢測—決策”中融入容錯思想,改進為“數(shù)據(jù)采集—數(shù)據(jù)恢復(fù)/增強—場景預(yù)測—目標檢測一增強學(xué)習(xí)決策”架構(gòu),以實現(xiàn)智能汽車的容錯感知與決策控制的目的。具體內(nèi)容如下:1.針對惡劣天氣(雨霧天氣)對攝像頭傳感器產(chǎn)生干擾的問題,提出三種改進的圖像去霧霾算法。首先,針對傳統(tǒng)方法實時性不佳的問題,提出一種改進的基于暗通道優(yōu)先(Dark Channel Prior,DCP)的去霧算法,優(yōu)化區(qū)域計算為像素計算,使之能夠在一次遍歷中評估出所有參數(shù),并通過數(shù)據(jù)統(tǒng)計對產(chǎn)生的誤差和按照通道(RGB通道)進行補償。實驗結(jié)果表明改進算法的速度是原始算法的10倍以上。其次,為了克服傳統(tǒng)基于先驗經(jīng)驗的方法存在適用范圍的局限性,引入深度學(xué)習(xí)方法對霧霾圖像進行恢復(fù)。為了克服深層網(wǎng)絡(luò)在傳播數(shù)據(jù)過程中產(chǎn)生的數(shù)據(jù)損失,采用淺層網(wǎng)絡(luò),逐“部”(block)逼近的方法,并改進損失函數(shù)為峰值信噪比(Peak Signal to Noise Ratio,PSNR)和結(jié)構(gòu)相似性(structural similarity index measurement,SSIM)的加權(quán)和。實驗數(shù)據(jù)由深度圖片數(shù)據(jù)庫(Make3D和NYU Dataset)和霧霾模型構(gòu)造而成,結(jié)果顯示網(wǎng)絡(luò)在堆疊到3層時,恢復(fù)效果和運算速度會達到最佳平衡點。最后,為了克服去霧數(shù)據(jù)樣本少,端對端模型泛化能力弱的問題,采用條件生成式對抗網(wǎng)絡(luò)(Conditional Generative Adversarial Networks,CGAN)的方法恢復(fù)霧霾圖像,實驗表明基于條件生成式對抗神經(jīng)網(wǎng)絡(luò)能夠在數(shù)量較少的訓(xùn)練數(shù)據(jù)集中獲得足夠的泛化能力。2.為了向ADAS系統(tǒng)決策提供更多的依據(jù),為傳感器提供冗余數(shù)據(jù),保證ADAS在面對傳感器故障時有足夠的時間進行應(yīng)急操作,利用循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)對場景(雷達信號和視頻信號)進行預(yù)測。首先,傳統(tǒng)RNN在學(xué)習(xí)長序列時,由于梯度隨時間反向傳播(Backpropagation Through Time,BPTT)時會產(chǎn)生梯度衰減和梯度爆炸問題。傳統(tǒng)的解決方法包括使用改進的激活函數(shù)(如Rectified Linear Unit,ReLU),增加L2-正則化,使用“門”控制(如 Long Short-term Memory,LSTM和Gated Recurrent Unit,GRU)。本文將殘差學(xué)習(xí)引入到RNN中,提出了一種殘差循環(huán)神經(jīng)網(wǎng)絡(luò)(Residual RNN,Res-RNN)。殘差學(xué)習(xí)將梯度傳遞從連乘轉(zhuǎn)化為連加,使梯度傳遞變?yōu)楹愕扔成。實驗表明Res-RNN能夠在大大縮短訓(xùn)練時間和預(yù)測時間的前提下,提供與LSTM和GRU相同的網(wǎng)絡(luò)能力。其次,在場景預(yù)測中,將傳感器采集到的信號視為時間序列,則雷達信號為一維時間序列,Res-RNN能夠有效的預(yù)測雷達信號,繼而將視頻信號視為二維時間序列,將Res-RNN中的全連接部分替換為卷積操作提出Res-rCNN,預(yù)測視頻信號,實驗表明殘差學(xué)習(xí)和RNN的結(jié)合為RNN的梯度問題提供了新的解決方案,并且能夠有效地預(yù)測場景。最后,前文以及前人的場景預(yù)測方法是以短時間內(nèi)智能汽車的運動狀態(tài)保持穩(wěn)定為前提,考慮到智能汽車有自主改變運動狀態(tài)的能力,提出一種將視頻信號和操作信號作為輸入的視頻信號預(yù)測網(wǎng)絡(luò)——移動預(yù)測網(wǎng)絡(luò),該網(wǎng)絡(luò)能夠根據(jù)駕駛員的操作對預(yù)測信號進行調(diào)整。實驗表明移動預(yù)測網(wǎng)絡(luò)能夠準確預(yù)測運動狀態(tài)突變時的場景。3.為了給ADAS系統(tǒng)提供更多的環(huán)境感知信息,對雷達類主動傳感器提供信息冗余,甚至在雷達傳感器工作失效時加以替代,提出一種加強的目標檢測方法。該方法將序列學(xué)習(xí)和目標檢測結(jié)合,從一段視頻中預(yù)測目標種類,位置信息,以及相對位置和相對速度。在數(shù)據(jù)方面,使用Kitti數(shù)據(jù)庫、Prescan產(chǎn)生的數(shù)據(jù)庫以及Carla仿真環(huán)境標注目標類型、位置、相對距離和相對速度。在模型方面,序列學(xué)習(xí)使用上文提出的Res-rCNN,其中,殘差部分引入Inception結(jié)構(gòu),為模型增加尺度不變性。模型通過一系列改進,使檢測能力和速度預(yù)測能力達到較高水平。實驗表明加強的目標檢測方法能夠準確地預(yù)測目標的種類,位置,以及相對距離和相對速度。4.為了提高ADAS系統(tǒng)的決策能力,克服傳統(tǒng)決策方法依賴于規(guī)則庫和端對端駕駛控制中的開環(huán)映射問題,提出一種基于深度學(xué)習(xí)的決策控制方法解決方案。首先,為了克服智能汽車無法理解文本交通法規(guī),且現(xiàn)行算法沒有對交通規(guī)則進行特別的關(guān)注,提出一種文本邊界增強學(xué)習(xí)決策控制方法。該算法集合了GAN網(wǎng)絡(luò)非監(jiān)督學(xué)習(xí)的特點和梯度優(yōu)化能在連續(xù)域中做出決策的特點。除此之外,文章引入自然語言學(xué)習(xí)的理念,使增強學(xué)習(xí)能夠?qū)W習(xí)交通法規(guī)。具體地,神經(jīng)網(wǎng)絡(luò)通過采集的正負樣本學(xué)習(xí)交通法規(guī)得到交通法規(guī)文本的特征,并將此表示作為條件,訓(xùn)練神經(jīng)網(wǎng)絡(luò)做出的決策實現(xiàn)控制目標并不違反交通規(guī)則。實驗表明文本邊界增強學(xué)習(xí)方法能夠很好地操作汽車,并且遵守文本法律。另外,為了克服基于深度學(xué)習(xí)普遍是前饋控制,狀態(tài)和指令無法做到一一映射,利用內(nèi)容2中對場景的預(yù)測,將預(yù)測網(wǎng)絡(luò)加入到閉環(huán)回路中,與實際場景進行對比,為訓(xùn)練駕駛系統(tǒng)提供更多的信息和限制,提高了駕駛的安全性。實驗表明閉環(huán)的端對端方法控制更加準確,對輸入噪聲的魯棒性更強。論文通過Prescan,Carla等仿真環(huán)境,以及Kitti等公開數(shù)據(jù)集,分步展示實驗結(jié)果和本文方法的性能,并與當前主流算法進行對比。在數(shù)據(jù)使用方面,綜合使用公開數(shù)據(jù)集和仿真場景提高訓(xùn)練效果。
【圖文】:
在具體實現(xiàn)中,由于模型的耦合和共享,智能汽車的框架會簡化為“數(shù)據(jù)采逡逑集一一環(huán)境感知一一決策控制'其中:逡逑?數(shù)據(jù)采集模塊:數(shù)據(jù)采集模塊從各個傳感器中采集數(shù)據(jù),,感知周圍環(huán)境逡逑信息(道路信息,車輛信息,行人信息),智能汽車本身狀態(tài)(行駛狀態(tài),逡逑汽車系統(tǒng)狀態(tài),智能信息系統(tǒng)狀態(tài))和駕駛員狀態(tài)(生理狀態(tài)等)的原逡逑始數(shù)據(jù),并將它們按照一定的形式融合起來。逡逑*環(huán)境感知模塊:環(huán)境感知模塊從數(shù)據(jù)懫集模塊中獲得的海量數(shù)據(jù),并完逡逑成目標檢測,路標識別,駕駛員疲勞狀態(tài)感知等任務(wù)。環(huán)境感知模塊將逡逑原始數(shù)據(jù)轉(zhuǎn)化為系統(tǒng)可以理解數(shù)據(jù),為決策做準備。逡逑*決策控制模塊:決策控制模塊根據(jù)環(huán)境感知模塊提取的環(huán)境信息、駕駛逡逑員偏好、汽車車況和狀態(tài)等做出決策,并生成控制信號傳輸給執(zhí)行機構(gòu)。逡逑針對各個模塊的軟硬件實現(xiàn)一直是研究的熱門領(lǐng)域,在這一方面,傳統(tǒng)方法逡逑與深度學(xué)習(xí)方法^1交織,呈現(xiàn)出互相促進、互相吸收的局面。逡逑
出預(yù)測量和標記等。逡逑1.3.1多層感知器逡逑典型的多層多層感知器模型如圖1.3所示[81]。第A:層網(wǎng)絡(luò)的輸出向量逡逑上一層的輸出向量hf計算得到,輸入向量x可以被視為,逡逑h'二邋tanh(bfc邋+W.-'),邐(1.1)逡逑其中,為偏置向量,M為權(quán)重矩陣。其中tanh是逐元素計算的,可以被其他逡逑激活函數(shù)替代,如sigmoid函數(shù),ReLU函數(shù),eLU函數(shù),SeLU函數(shù)等。在輸出逡逑層,為了表示分類類別,一般使用softmax函數(shù),逡逑eb!邋+邋MW逡逑 ̄邐eb;,+w^b--',邐(L2)逡逑其中,M為權(quán)重矩陣W的第j行,h丨為正,.hj邋=邋I。逡逑h逡逑圖1.3多層感知器結(jié)構(gòu)示意圖逡逑13逡逑
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2018
【分類號】:TP18;U463.6
【圖文】:
在具體實現(xiàn)中,由于模型的耦合和共享,智能汽車的框架會簡化為“數(shù)據(jù)采逡逑集一一環(huán)境感知一一決策控制'其中:逡逑?數(shù)據(jù)采集模塊:數(shù)據(jù)采集模塊從各個傳感器中采集數(shù)據(jù),,感知周圍環(huán)境逡逑信息(道路信息,車輛信息,行人信息),智能汽車本身狀態(tài)(行駛狀態(tài),逡逑汽車系統(tǒng)狀態(tài),智能信息系統(tǒng)狀態(tài))和駕駛員狀態(tài)(生理狀態(tài)等)的原逡逑始數(shù)據(jù),并將它們按照一定的形式融合起來。逡逑*環(huán)境感知模塊:環(huán)境感知模塊從數(shù)據(jù)懫集模塊中獲得的海量數(shù)據(jù),并完逡逑成目標檢測,路標識別,駕駛員疲勞狀態(tài)感知等任務(wù)。環(huán)境感知模塊將逡逑原始數(shù)據(jù)轉(zhuǎn)化為系統(tǒng)可以理解數(shù)據(jù),為決策做準備。逡逑*決策控制模塊:決策控制模塊根據(jù)環(huán)境感知模塊提取的環(huán)境信息、駕駛逡逑員偏好、汽車車況和狀態(tài)等做出決策,并生成控制信號傳輸給執(zhí)行機構(gòu)。逡逑針對各個模塊的軟硬件實現(xiàn)一直是研究的熱門領(lǐng)域,在這一方面,傳統(tǒng)方法逡逑與深度學(xué)習(xí)方法^1交織,呈現(xiàn)出互相促進、互相吸收的局面。逡逑
出預(yù)測量和標記等。逡逑1.3.1多層感知器逡逑典型的多層多層感知器模型如圖1.3所示[81]。第A:層網(wǎng)絡(luò)的輸出向量逡逑上一層的輸出向量hf計算得到,輸入向量x可以被視為,逡逑h'二邋tanh(bfc邋+W.-'),邐(1.1)逡逑其中,為偏置向量,M為權(quán)重矩陣。其中tanh是逐元素計算的,可以被其他逡逑激活函數(shù)替代,如sigmoid函數(shù),ReLU函數(shù),eLU函數(shù),SeLU函數(shù)等。在輸出逡逑層,為了表示分類類別,一般使用softmax函數(shù),逡逑eb!邋+邋MW逡逑 ̄邐eb;,+w^b--',邐(L2)逡逑其中,M為權(quán)重矩陣W的第j行,h丨為正,.hj邋=邋I。逡逑h逡逑圖1.3多層感知器結(jié)構(gòu)示意圖逡逑13逡逑
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2018
【分類號】:TP18;U463.6
【相似文獻】
相關(guān)期刊論文 前10條
1 董鵬;楊光;鄭奧柯;;我國智能汽車的現(xiàn)狀和解決對策及未來發(fā)展趨勢[J];武漢學(xué)刊;2018年01期
2 孫娜;;智能汽車未來的發(fā)展趨勢分析[J];中外企業(yè)家;2018年25期
3 董鵬;王昊;謝峰波;劉大慶;;我國智能汽車發(fā)展中的困境與出路[J];客車技術(shù);2018年01期
4 羅紅梅;周逸凡;;智能汽車產(chǎn)業(yè)的發(fā)展情況[J];摩托車技術(shù);2019年03期
5 沈廣輝;郝藝源;馮莉;;中國智能汽車發(fā)展研究[J];內(nèi)燃機與配件;2019年04期
6 王杰;;智能汽車未來發(fā)展趨勢分析[J];現(xiàn)代制造技術(shù)與裝備;2019年02期
7 許中緣;;論智能汽車侵權(quán)責任立法——以工具性人格為中心[J];法學(xué);2019年04期
8 喬劍峰;李德s
本文編號:2592744
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2592744.html
最近更新
教材專著