嵌入式盲人閱讀器系統(tǒng)設(shè)計(jì)與開發(fā)
發(fā)布時(shí)間:2017-07-01 14:14
本文關(guān)鍵詞:嵌入式盲人閱讀器系統(tǒng)設(shè)計(jì)與開發(fā),,由筆耕文化傳播整理發(fā)布。
【摘要】:人們?nèi)粘I钪薪佑|到的多數(shù)信息都以圖像的形式進(jìn)行傳遞,盲人以及視力障礙人士由于視力缺陷在沒有正常人幫助下根本無法獲取這些信息,這很大程度上限制了盲人認(rèn)知世界的機(jī)會(huì)。盲人閱讀器是一款融合了光學(xué)字符識(shí)別(OCR)和語音合成(TTS)技術(shù)、實(shí)現(xiàn)圖像文字到語音轉(zhuǎn)換的設(shè)備,能幫助盲人自由獲取紙質(zhì)以及電子版文字信息。本文所實(shí)現(xiàn)的盲人閱讀器系統(tǒng)使用QT進(jìn)行界面編寫,可分為以下模塊:(1) 視頻圖像采集與預(yù)處理模塊。該模塊主要完成攝像頭視頻待識(shí)別文檔的采集以及包括灰度化、二值化、去噪、版面分析、傾斜校正、字符切分等的圖像預(yù)處理。本文通過比較分析,選取了合適的算法,取得了良好的實(shí)驗(yàn)效果。該模塊是整個(gè)盲人閱讀器系統(tǒng)的基礎(chǔ),其性能穩(wěn)定與否直接關(guān)系到系統(tǒng)識(shí)別率的高低。(2) 文本識(shí)別模塊。該模塊由字符預(yù)處理、特征提取和文本識(shí)別組成,是整個(gè)系統(tǒng)的核心。本文介紹了細(xì)化和歸一化字符預(yù)處理算法,并詳細(xì)介紹了漢字識(shí)別中常用的幾種漢字特征提取過程?紤]到漢字?jǐn)?shù)量巨大,屬于超大類別模式識(shí)別,本文利用漢字各種特征的互補(bǔ)性,采取了多級(jí)粗分類和細(xì)分類相結(jié)合的多特征多分類器漢字識(shí)別方法,粗分類縮小了待匹配字符范圍,有效減少了計(jì)算量,細(xì)分類利用多種特征進(jìn)行聯(lián)合判別,漢字識(shí)別準(zhǔn)確率得到很大提升。(3) 語音播報(bào)模塊。針對(duì)軟件使用環(huán)境的不同,本文實(shí)現(xiàn)了基于Microsoft SpeechSDK、科大訊飛MSP、自制語音庫三種語音播報(bào)方法,都取得了較好效果,其中自制語音庫語音播報(bào)適用于各種平臺(tái),但語音不夠流暢,且占據(jù)較大存儲(chǔ)空間。此外,為增加軟件的交互性,Windows下軟件中添加了語音識(shí)別模塊,方便盲人通過語音的方式使用軟件。結(jié)果表明,軟件系統(tǒng)智能友好地完成了盲人閱讀基本功能,對(duì)印刷體中文文檔識(shí)別準(zhǔn)確率達(dá)到99.67%,達(dá)到了軟件設(shè)計(jì)要求。本文中實(shí)現(xiàn)了盲人閱讀器系統(tǒng)的嵌入式開發(fā),選用合眾達(dá)DVS6446為硬件平臺(tái),QT/Embedded為嵌入式圖形界面開發(fā)_工具(主要為方便調(diào)試引入)。本文完成了嵌入式Linux開發(fā)環(huán)境的搭建過程,包括搭建交叉編譯環(huán)境、內(nèi)核的配置與移植、QT/Embedded移植等。通過交叉編譯嵌入式盲人閱讀器應(yīng)用程序,得到可執(zhí)行文件,利用掛載網(wǎng)絡(luò)文件系統(tǒng)NFS方式實(shí)現(xiàn)了程序在目標(biāo)平臺(tái)的運(yùn)行,經(jīng)過反復(fù)調(diào)試,該系統(tǒng)能夠完成盲人閱讀功能日運(yùn)行良好。
【關(guān)鍵詞】:盲人閱讀 漢字識(shí)別 DVS6446 QT/Embedded 語音合成
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.41;TN873
【目錄】:
- 摘要4-5
- Abstract5-9
- 1 緒論9-13
- 1.1 課題研究背景及意義9
- 1.2 國內(nèi)外研究現(xiàn)狀9-11
- 1.2.1 文字識(shí)別(OCR)技術(shù)發(fā)展歷程10-11
- 1.2.2 語音合成(TTS)技術(shù)發(fā)展歷程11
- 1.3 面臨技術(shù)挑戰(zhàn)11-12
- 1.4 論文章節(jié)安排12-13
- 2 盲人閱讀器系統(tǒng)相關(guān)理論知識(shí)介紹13-34
- 2.1 文本圖像預(yù)處理13-23
- 2.1.1 灰度化、二值化與去噪14-17
- 2.1.2 傾斜校正17-20
- 2.1.3 版面分析20-22
- 2.1.4 文本定位22-23
- 2.2 字符特征提取與識(shí)別23-31
- 2.2.1 字符預(yù)處理24-25
- 2.2.2 漢字特征提取25-28
- 2.2.3 特征匹配與識(shí)別28-31
- 2.3 語音識(shí)別與合成31-34
- 2.3.1 語音識(shí)別基本原理31-32
- 2.3.2 語音合成基本原理32-34
- 3 嵌入式盲人閱讀器系統(tǒng)平臺(tái)概述與開發(fā)環(huán)境搭建34-47
- 3.1 系統(tǒng)硬件平臺(tái)概述34-35
- 3.2 系統(tǒng)軟件平臺(tái)概述35-38
- 3.2.1 嵌入式操作系統(tǒng)的選擇35-36
- 3.2.2 嵌入式GUI的選擇36-38
- 3.3 盲人閱讀器嵌入式Linux開發(fā)環(huán)境搭建38-40
- 3.3.1 交叉編譯環(huán)境搭建與配置38-39
- 3.3.2 配置NFS服務(wù)39
- 3.3.3 配置TFTP服務(wù)39-40
- 3.4 內(nèi)核編譯與移植40-43
- 3.5 嵌入式GUI開發(fā)環(huán)境搭建43-47
- 3.5.1 QT編程概述43-44
- 3.5.2 Host Linux下QT4開發(fā)環(huán)境搭建44-47
- 4 盲人閱讀器系統(tǒng)設(shè)計(jì)與結(jié)果分析47-61
- 4.1 Windows平臺(tái)下盲人閱讀器軟件設(shè)計(jì)與實(shí)現(xiàn)49-55
- 4.2 基于DVS6446的嵌入式盲人閱讀器系統(tǒng)實(shí)現(xiàn)55-58
- 4.2.1 攝像頭圖片獲取模塊設(shè)計(jì)55-56
- 4.2.2 閱讀模塊設(shè)計(jì)56-57
- 4.2.3 嵌入式程序運(yùn)行、移植與測試57-58
- 4.3 實(shí)驗(yàn)與結(jié)果分析58-61
- 結(jié)論61-62
- 參考文獻(xiàn)62-65
- 致謝65-66
【參考文獻(xiàn)】
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 霍超;嵌入式OCR系統(tǒng)的研究[D];北方工業(yè)大學(xué);2010年
本文關(guān)鍵詞:嵌入式盲人閱讀器系統(tǒng)設(shè)計(jì)與開發(fā),由筆耕文化傳播整理發(fā)布。
本文編號(hào):506236
本文鏈接:http://sikaile.net/kejilunwen/wltx/506236.html
最近更新
教材專著