基于圖像拼接的助視算法研究和軟件設(shè)計(jì)
發(fā)布時間:2020-05-17 13:00
【摘要】:電子助視系統(tǒng)是一種運(yùn)用實(shí)時圖像處理技術(shù)來提高低視力患者閱讀能力的儀器。由于傳統(tǒng)助視器功能單一,且采用單攝像頭采集圖像,采集視角較小,圖像分辨率較低。在使用時只有移動助視設(shè)備或者目標(biāo)書籍才能閱讀完整篇章,用戶體驗(yàn)不佳。針對上述問題,本文首先采用雙攝像頭采集圖像并進(jìn)行拼接,可獲得廣視角、高分辨率的圖像。然后對拼接后的圖像使用布局分析,以分割文檔圖像中不同段落的信息。最后對分割后的圖像采用OCR識別,實(shí)現(xiàn)字符無失真放大和變色的功能。主要工作內(nèi)容如下:(1)基于圖像拼接的助視系統(tǒng)的整體設(shè)計(jì)。對不同的圖像拼接算法、布局分析算法、OCR算法進(jìn)行對比,確定算法的設(shè)計(jì)需求,確定本系統(tǒng)開發(fā)的軟硬件環(huán)境。(2)提出了適用于助視系統(tǒng)的文檔圖像拼接算法。在圖像配準(zhǔn)步驟,提出了針對文檔圖像的區(qū)域特征描述方法,提取單個文字區(qū)域作為特征區(qū)域,其質(zhì)心作為特征點(diǎn),通過描述特征區(qū)域的紋理信息完成特征點(diǎn)的描述,提高了特征匹配效率。在圖像融合步驟,采用了利用文檔圖像字符間隙的最優(yōu)拼接縫搜索算法,消除了拼接鬼影。構(gòu)建多尺度的圖像金字塔,使用多分辨率融合算法,抑制了融合圖像的曝光差異。(3)研究了版面分析算法和OCR算法的原理。針對算法應(yīng)用到助視系統(tǒng)存在的問題,提出了復(fù)雜文本的分割優(yōu)化策略,并且使用了置信度對版面分析和OCR識別的結(jié)果進(jìn)行分析,剔除錯誤識別,提高了識別的準(zhǔn)確率。此外,介紹了兩種訓(xùn)練數(shù)據(jù)制作方法,三種訓(xùn)練模式,可以適應(yīng)于不同情況的模型訓(xùn)練。(4)設(shè)計(jì)了基于Qt的助視GUI軟件。該軟件實(shí)現(xiàn)了視頻的拼接功能,對不同分辨率的拼接性能進(jìn)行測試。結(jié)果表明該軟件能夠滿足實(shí)時的需求。同時,該軟件實(shí)現(xiàn)了對單字符分割、行布局分割以及段布局分割的功能。實(shí)現(xiàn)了針對不同分割模式的OCR識別功能。實(shí)現(xiàn)了對識別結(jié)果進(jìn)行字符的無失真放大和變色功能。
【圖文】:
本文章節(jié)安排示意圖
圖 2-1 算法流程圖軟件設(shè)計(jì)方面,本文設(shè)計(jì)的助視軟件主要適用于低視力人群的閱讀。軟件功電子助視系統(tǒng)的放縮、變色和存儲等基礎(chǔ)功能。針對多攝像頭拼接的方案,,局分析、字符識別等功能。整個過程包含了大量的圖像處理算法,且該軟件平臺上實(shí)現(xiàn),因此對嵌入式平臺的性能和軟件的性能要求較高。像拼接算法設(shè)計(jì)像拼接的方法很多,一般包括圖像配準(zhǔn)和圖像融合兩個步驟。圖像配準(zhǔn)是確的相對關(guān)系,目的是為了獲取在同一坐標(biāo)系下的變換關(guān)系的單應(yīng)矩陣。圖像定圖像融合的效果,而現(xiàn)有精度較高的配準(zhǔn)算法的計(jì)算量一般較大,因此圖發(fā)展主要取決于算法效率的提高。圖像融合是將配準(zhǔn)后的圖像融合為一種圖
【學(xué)位授予單位】:浙江工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP391.41;TH77
本文編號:2668590
【圖文】:
本文章節(jié)安排示意圖
圖 2-1 算法流程圖軟件設(shè)計(jì)方面,本文設(shè)計(jì)的助視軟件主要適用于低視力人群的閱讀。軟件功電子助視系統(tǒng)的放縮、變色和存儲等基礎(chǔ)功能。針對多攝像頭拼接的方案,,局分析、字符識別等功能。整個過程包含了大量的圖像處理算法,且該軟件平臺上實(shí)現(xiàn),因此對嵌入式平臺的性能和軟件的性能要求較高。像拼接算法設(shè)計(jì)像拼接的方法很多,一般包括圖像配準(zhǔn)和圖像融合兩個步驟。圖像配準(zhǔn)是確的相對關(guān)系,目的是為了獲取在同一坐標(biāo)系下的變換關(guān)系的單應(yīng)矩陣。圖像定圖像融合的效果,而現(xiàn)有精度較高的配準(zhǔn)算法的計(jì)算量一般較大,因此圖發(fā)展主要取決于算法效率的提高。圖像融合是將配準(zhǔn)后的圖像融合為一種圖
【學(xué)位授予單位】:浙江工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP391.41;TH77
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 金繁;崔培雷;;嵌入式Qt中信號與槽機(jī)制的研究[J];電子設(shè)計(jì)工程;2014年24期
2 李亮;顧國華;錢惟賢;陳錢;任建樂;;基于特征點(diǎn)和泊松融合的紅外序列圖像拼接[J];紅外與激光工程;2013年09期
3 張建光;李永霞;;基于區(qū)域的圖像分割[J];科技資訊;2011年26期
4 楊海鋼;孫嘉斌;王慰;;FPGA器件設(shè)計(jì)技術(shù)發(fā)展綜述[J];電子與信息學(xué)報;2010年03期
5 陳方昕;;基于區(qū)域生長法的圖像分割技術(shù)[J];科技信息(科學(xué)教研);2008年15期
6 王蘊(yùn)平;;講述電子助視器的視界[J];中國殘疾人;2007年07期
7 單欣;王耀明;董建萍;;基于RANSAC算法的基本矩陣估計(jì)的匹配方法[J];上海電機(jī)學(xué)院學(xué)報;2006年04期
8 陳光;助視器的發(fā)展[J];中國殘疾人;2004年06期
9 趙向陽,杜利民;一種全自動穩(wěn)健的圖像拼接融合算法[J];中國圖象圖形學(xué)報;2004年04期
10 陳明;丁曉青;吳佑壽;;多層次可信度指導(dǎo)下的自底向上的版面分析算法[J];模式識別與人工智能;2003年02期
本文編號:2668590
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2668590.html
最近更新
教材專著