基于自動(dòng)駕駛城市場景的語義分割研究
發(fā)布時(shí)間:2023-05-06 20:55
隨著人工智能技術(shù)的飛速發(fā)展,車輛的自動(dòng)駕駛離人們的生活越來越近。自動(dòng)駕駛整個(gè)運(yùn)行流程中首先需要依賴各種車載傳感器收集車輛周圍的各種環(huán)境數(shù)據(jù),進(jìn)而利用各種分析算法分析得到計(jì)算機(jī)可感知的環(huán)境信息,然后利用感知到的信息指導(dǎo)車輛規(guī)劃決策。然而目前車輛使用的激光雷達(dá)等傳感器大多成本高昂,不利于自動(dòng)駕駛車輛的大規(guī)模普及。相比較而言,攝像頭成本低廉且可以獲得大量的周圍環(huán)境信息,因此,研究基于攝像頭的自動(dòng)駕駛感知算法具有重要的意義。圖像語義分割是自動(dòng)駕駛感知中最重要的技術(shù)之一,利用圖像語義分割的結(jié)果可以得到車輛的可行駛區(qū)域信息、前方障礙物信息等。在深度學(xué)習(xí)與卷積神經(jīng)網(wǎng)絡(luò)在近幾年興起之后,涌現(xiàn)了眾多以深度學(xué)習(xí)為基礎(chǔ)的圖像語義分割算法,基本都能實(shí)現(xiàn)端到端的圖像語義分割輸出。但目前距離圖像語義分割算法真正使用到自動(dòng)駕駛系統(tǒng)中還存在著一些問題:(1)許多算法不能實(shí)時(shí)運(yùn)行,這無法滿足安全性為主的自動(dòng)駕駛的需求;(2)自動(dòng)駕駛場景中場景復(fù)雜、種類眾多造成訓(xùn)練數(shù)據(jù)樣本不均衡,許多算法對于小樣本的檢測效果不好。因此自動(dòng)駕駛城市場景的圖像語義分割還存在許多問題需要解決,本文的研究重點(diǎn)是基于自動(dòng)駕駛場景中的可實(shí)時(shí)的圖像語...
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景與研究意義
1.2 研究現(xiàn)狀與發(fā)展趨勢
1.2.1 前深度學(xué)習(xí)時(shí)代語義分割研究
1.2.2 深度學(xué)習(xí)時(shí)代語義分割研究
1.3 本文主要研究內(nèi)容
第2章 基于CNN的圖像語義分割算法與評價(jià)指標(biāo)
2.1 經(jīng)典特征提取網(wǎng)絡(luò)
2.1.1 VGG系列
2.1.2 ResNet網(wǎng)絡(luò)
2.1.3 空洞卷積與深度可分離卷積
2.2 基于CNN的圖像語義分割算法
2.2.1 全卷積神將網(wǎng)絡(luò)(FCN)
2.2.2 編碼-解碼結(jié)構(gòu)U-Net
2.2.3 DeepLab系列
2.3 圖像語義分割評價(jià)指標(biāo)
2.3.1 基于像素的精度
2.3.2 mIoU
2.4 本章小結(jié)
第3章 構(gòu)建輕量級可實(shí)時(shí)圖像語義分割網(wǎng)絡(luò)
3.1 圖像語義分割算法在自動(dòng)駕駛中的問題
3.2 圖像語義分割算法存在問題分析
3.2.1 實(shí)時(shí)運(yùn)行問題分析
3.2.2 種類不均衡問題分析
3.2.3 模型在移動(dòng)端或嵌入式端運(yùn)行問題分析
3.3 輕量級圖像語義分割網(wǎng)絡(luò)構(gòu)建
3.3.1 多分支結(jié)構(gòu)
3.3.2 downsampling模塊
3.3.3 金字塔池化尺度融合模塊
3.3.4 Add模塊
3.3.5 殘差結(jié)構(gòu)
3.3.6 激活函數(shù)的選擇
3.3.7 upsampling方法
3.4 多級監(jiān)督損失函數(shù)以及損失函數(shù)改進(jìn)
3.4.1 輔助監(jiān)督損失計(jì)算
3.4.2 抑制性交叉熵?fù)p失函數(shù)
3.5 本章小結(jié)
第4章 算法模型的實(shí)現(xiàn)與實(shí)驗(yàn)結(jié)果分析
4.1 算法實(shí)驗(yàn)平臺
4.2 實(shí)驗(yàn)數(shù)據(jù)集
4.2.1 Cityscapes數(shù)據(jù)集
4.2.2 自制作城市道路場景數(shù)據(jù)集
4.3 實(shí)驗(yàn)前期準(zhǔn)備與策略設(shè)計(jì)
4.3.1 數(shù)據(jù)預(yù)處理
4.3.2 模型訓(xùn)練參數(shù)設(shè)置
4.3.3 模型分級訓(xùn)練
4.4 對比實(shí)驗(yàn)及結(jié)果
4.4.2在自制作數(shù)據(jù)集上的實(shí)驗(yàn)
4.5 嵌入式平臺中模型的加速
4.5.1 TensorRT簡介
4.5.2 TensorRT加速原理
4.5.3 TensorRT加速效果比較
4.6 模型的實(shí)車測試
4.7 本章小結(jié)
第5章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來研究方向
參考文獻(xiàn)
致謝
本文編號:3809599
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景與研究意義
1.2 研究現(xiàn)狀與發(fā)展趨勢
1.2.1 前深度學(xué)習(xí)時(shí)代語義分割研究
1.2.2 深度學(xué)習(xí)時(shí)代語義分割研究
1.3 本文主要研究內(nèi)容
第2章 基于CNN的圖像語義分割算法與評價(jià)指標(biāo)
2.1 經(jīng)典特征提取網(wǎng)絡(luò)
2.1.1 VGG系列
2.1.2 ResNet網(wǎng)絡(luò)
2.1.3 空洞卷積與深度可分離卷積
2.2 基于CNN的圖像語義分割算法
2.2.1 全卷積神將網(wǎng)絡(luò)(FCN)
2.2.2 編碼-解碼結(jié)構(gòu)U-Net
2.2.3 DeepLab系列
2.3 圖像語義分割評價(jià)指標(biāo)
2.3.1 基于像素的精度
2.3.2 mIoU
2.4 本章小結(jié)
第3章 構(gòu)建輕量級可實(shí)時(shí)圖像語義分割網(wǎng)絡(luò)
3.1 圖像語義分割算法在自動(dòng)駕駛中的問題
3.2 圖像語義分割算法存在問題分析
3.2.1 實(shí)時(shí)運(yùn)行問題分析
3.2.2 種類不均衡問題分析
3.2.3 模型在移動(dòng)端或嵌入式端運(yùn)行問題分析
3.3 輕量級圖像語義分割網(wǎng)絡(luò)構(gòu)建
3.3.1 多分支結(jié)構(gòu)
3.3.2 downsampling模塊
3.3.3 金字塔池化尺度融合模塊
3.3.4 Add模塊
3.3.5 殘差結(jié)構(gòu)
3.3.6 激活函數(shù)的選擇
3.3.7 upsampling方法
3.4 多級監(jiān)督損失函數(shù)以及損失函數(shù)改進(jìn)
3.4.1 輔助監(jiān)督損失計(jì)算
3.4.2 抑制性交叉熵?fù)p失函數(shù)
3.5 本章小結(jié)
第4章 算法模型的實(shí)現(xiàn)與實(shí)驗(yàn)結(jié)果分析
4.1 算法實(shí)驗(yàn)平臺
4.2 實(shí)驗(yàn)數(shù)據(jù)集
4.2.1 Cityscapes數(shù)據(jù)集
4.2.2 自制作城市道路場景數(shù)據(jù)集
4.3 實(shí)驗(yàn)前期準(zhǔn)備與策略設(shè)計(jì)
4.3.1 數(shù)據(jù)預(yù)處理
4.3.2 模型訓(xùn)練參數(shù)設(shè)置
4.3.3 模型分級訓(xùn)練
4.4 對比實(shí)驗(yàn)及結(jié)果
4.4.2在自制作數(shù)據(jù)集上的實(shí)驗(yàn)
4.5 嵌入式平臺中模型的加速
4.5.1 TensorRT簡介
4.5.2 TensorRT加速原理
4.5.3 TensorRT加速效果比較
4.6 模型的實(shí)車測試
4.7 本章小結(jié)
第5章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來研究方向
參考文獻(xiàn)
致謝
本文編號:3809599
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3809599.html
最近更新
教材專著