基于深度遷移學(xué)習(xí)方法的盲文識別技術(shù)研究
發(fā)布時間:2020-12-12 12:11
盲文識別是盲文信息處理研究中非常關(guān)鍵的一步。不僅對盲文工作者有十分重要的意義,在實際生活中,也有助于促進(jìn)盲人和明眼人間的溝通交流,推動我國信息無障礙事業(yè)的發(fā)展。由于傳統(tǒng)的盲文識別方法受到環(huán)境和設(shè)備的影響較大,且人力標(biāo)注樣本成本過高,不能實現(xiàn)盲文的自動識別,因此發(fā)展有效的盲文識別方法對于我國信息無障礙的發(fā)展具有重要意義。目前已有深度學(xué)習(xí)方法應(yīng)用于盲文識別的研究,且實現(xiàn)了盲文的自動識別,但是目前深度學(xué)習(xí)在盲文識別領(lǐng)域的研究還是基于研究者自己制作的數(shù)據(jù)集,盲文圖片相對規(guī)范,尚未有公開的盲文公共數(shù)據(jù)集來驗證算法的有效性。考慮到采集盲文圖片時局限性較多且有一定的條件限制,因而現(xiàn)實中得到的盲文圖像數(shù)據(jù)集通常規(guī)模較小且識別難度較大,進(jìn)而需要研發(fā)一個盲文識別模塊來解決公共盲文圖像數(shù)據(jù)集的制作及現(xiàn)實場景下的盲文圖像數(shù)據(jù)集識別問題。深度遷移學(xué)習(xí),作為目前主流的機(jī)器學(xué)習(xí)算法,已經(jīng)在很多實際場景應(yīng)用中都取得了成功,因此,本文在已有的盲文識別算法的基礎(chǔ)上,從現(xiàn)實場景下盲文圖像數(shù)據(jù)集識別的角度出發(fā),利用現(xiàn)有的規(guī)模較大、規(guī)范程度較高的盲文圖像數(shù)據(jù)集,引入深度遷移學(xué)習(xí)方法,建立了實用性更強(qiáng)的盲文圖像識別模型。本文主要...
【文章來源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.3 本文主要工作介紹
1.4 論文體系結(jié)構(gòu)
第二章 盲文識別相關(guān)技術(shù)
2.1 圖像識別及盲文圖像識別的發(fā)展
2.2 深度學(xué)習(xí)
2.2.1 深度學(xué)習(xí)介紹
2.2.2 卷積神經(jīng)網(wǎng)絡(luò)
2.2.3 深度學(xué)習(xí)在圖像識別領(lǐng)域的應(yīng)用
2.3 深度遷移學(xué)習(xí)
2.3.1 遷移學(xué)習(xí)介紹
2.3.2 深度遷移學(xué)習(xí)在圖像識別領(lǐng)域的應(yīng)用
2.4 本章小結(jié)
第三章 基于域自對齊的深度遷移學(xué)習(xí)方法
3.1 引言
3.1.1 領(lǐng)域自對齊
3.1.2 最大均值差異
3.1.3 聯(lián)合最大均值差異
3.2 基于域自對齊的深度遷移學(xué)習(xí)算法(DAA)
3.3 實驗設(shè)置
3.3.1 環(huán)境搭建
3.3.2 超參數(shù)設(shè)置
3.3.3 數(shù)據(jù)集介紹
3.4 遷移網(wǎng)絡(luò)模型搭建
3.4.1 第一種遷移網(wǎng)絡(luò)模型(GoogleNet+4MMD)
3.4.2 第二種遷移網(wǎng)絡(luò)模型(GoogleNet+4MMD+all DA)
3.4.3 第三種遷移網(wǎng)絡(luò)模型(GoogleNet+4MMD+4DA)
3.4.4 第四種遷移網(wǎng)絡(luò)模型(GoogleNet+4MMD+1DA)
3.4.5 第五種遷移網(wǎng)絡(luò)模型(GoogleNet+4JMMD)
3.4.6 第六種遷移網(wǎng)絡(luò)模型(GoogleNet+4JMMD+1DA)
3.4.7 模型分析
3.5 結(jié)果討論
3.5.1 參數(shù)敏感性測試
3.5.2 實驗結(jié)果及分析
size的選取"> 3.5.3 batchsize的選取
3.6 本章小結(jié)
第四章 盲文信息無障礙建設(shè)中的盲文圖片識別研究
4.1 盲文信息無障礙建設(shè)
4.2 盲文圖像識別
4.2.1 數(shù)據(jù)集
4.2.2 數(shù)據(jù)集預(yù)處理
4.2.3 實驗軟硬件環(huán)境介紹
4.2.4 深度學(xué)習(xí)框架Caffe
4.2.5 實驗思路
4.2.6 實驗細(xì)節(jié)及參數(shù)設(shè)置
4.3 深度遷移學(xué)習(xí)方法用于盲文圖像識別
4.3.1 利用AlexNet網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行盲文圖像識別
4.3.2 利用GoogleNet網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行盲文圖像識別
4.3.3 實驗分析
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 論文工作總結(jié)
5.2 展望
參考文獻(xiàn)
在學(xué)期間的研究成果
致謝
本文編號:2912535
【文章來源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.3 本文主要工作介紹
1.4 論文體系結(jié)構(gòu)
第二章 盲文識別相關(guān)技術(shù)
2.1 圖像識別及盲文圖像識別的發(fā)展
2.2 深度學(xué)習(xí)
2.2.1 深度學(xué)習(xí)介紹
2.2.2 卷積神經(jīng)網(wǎng)絡(luò)
2.2.3 深度學(xué)習(xí)在圖像識別領(lǐng)域的應(yīng)用
2.3 深度遷移學(xué)習(xí)
2.3.1 遷移學(xué)習(xí)介紹
2.3.2 深度遷移學(xué)習(xí)在圖像識別領(lǐng)域的應(yīng)用
2.4 本章小結(jié)
第三章 基于域自對齊的深度遷移學(xué)習(xí)方法
3.1 引言
3.1.1 領(lǐng)域自對齊
3.1.2 最大均值差異
3.1.3 聯(lián)合最大均值差異
3.2 基于域自對齊的深度遷移學(xué)習(xí)算法(DAA)
3.3 實驗設(shè)置
3.3.1 環(huán)境搭建
3.3.2 超參數(shù)設(shè)置
3.3.3 數(shù)據(jù)集介紹
3.4 遷移網(wǎng)絡(luò)模型搭建
3.4.1 第一種遷移網(wǎng)絡(luò)模型(GoogleNet+4MMD)
3.4.2 第二種遷移網(wǎng)絡(luò)模型(GoogleNet+4MMD+all DA)
3.4.3 第三種遷移網(wǎng)絡(luò)模型(GoogleNet+4MMD+4DA)
3.4.4 第四種遷移網(wǎng)絡(luò)模型(GoogleNet+4MMD+1DA)
3.4.5 第五種遷移網(wǎng)絡(luò)模型(GoogleNet+4JMMD)
3.4.6 第六種遷移網(wǎng)絡(luò)模型(GoogleNet+4JMMD+1DA)
3.4.7 模型分析
3.5 結(jié)果討論
3.5.1 參數(shù)敏感性測試
3.5.2 實驗結(jié)果及分析
size的選取"> 3.5.3 batchsize的選取
3.6 本章小結(jié)
第四章 盲文信息無障礙建設(shè)中的盲文圖片識別研究
4.1 盲文信息無障礙建設(shè)
4.2 盲文圖像識別
4.2.1 數(shù)據(jù)集
4.2.2 數(shù)據(jù)集預(yù)處理
4.2.3 實驗軟硬件環(huán)境介紹
4.2.4 深度學(xué)習(xí)框架Caffe
4.2.5 實驗思路
4.2.6 實驗細(xì)節(jié)及參數(shù)設(shè)置
4.3 深度遷移學(xué)習(xí)方法用于盲文圖像識別
4.3.1 利用AlexNet網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行盲文圖像識別
4.3.2 利用GoogleNet網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行盲文圖像識別
4.3.3 實驗分析
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 論文工作總結(jié)
5.2 展望
參考文獻(xiàn)
在學(xué)期間的研究成果
致謝
本文編號:2912535
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2912535.html
最近更新
教材專著