基于光譜成像的褪色文字信息提取和識別研究
發(fā)布時間:2021-10-23 15:15
我國擁有大量的文物,包括壁畫、書畫等,它們作為中國的傳統(tǒng)文物,可以記載古人的精神文化生活和重要的歷史事件。其中,最能直觀的了解文物所承載信息的當(dāng)屬文字。中華文明源遠(yuǎn)流長,早在舊石器時,就發(fā)現(xiàn)有文字的存在,從古代甲骨文到現(xiàn)代簡體字,文字一直是人類記錄事件和表達(dá)情緒的重要符號。古人留給我們眾多珍貴文物,且大都會用文字加以描述和修飾,探索文字的信息能更好的還原真實(shí)歷史,了解不同時期文化。然而,由于自然和人為因素影響,一些文物表面出現(xiàn)了褪色,影響外觀,導(dǎo)致文字難以辨認(rèn)。因此,在文物保護(hù)工作中提取文字信息尤為重要。傳統(tǒng)方式多為人眼辨別,依賴文物工作者的經(jīng)驗(yàn),但褪色的文字依靠人眼難以辨別。所以,需要利用現(xiàn)代科學(xué)技術(shù)輔助提取文物中褪色或者隱藏的文字信息。高光譜技術(shù)具有非接觸、“圖譜合一”、光譜范圍廣等特點(diǎn),能夠?qū)ξ奈镞M(jìn)行更深層次的數(shù)據(jù)留存與分析,利用高光譜獨(dú)特的優(yōu)勢,可以捕捉到人眼觀察不到的信息,對于文字提取和解讀具有重要意義。本文研究數(shù)據(jù)為采集的國畫、石刻以及墓葬底部的高光譜數(shù)據(jù),三處文物均受到了不同程度的損傷,導(dǎo)致文物表面的信息難以辨識,在進(jìn)行數(shù)據(jù)預(yù)處理后,對其中的褪色信息進(jìn)行提取,再利用卷積神...
【文章來源】:北京建筑大學(xué)北京市
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【部分圖文】:
研究技術(shù)路線
卣魈崛》椒?(1)主成分分析與最小噪聲分離由于采集的高光譜影像波段數(shù)較多,所包含的信息量十分豐富,但同樣也會產(chǎn)生數(shù)據(jù)冗余的問題,在本文中用到的高光譜圖像有1040個波段,許多數(shù)據(jù)相關(guān)性較高,要從眾多波段中尋找特征明顯的波段比較困難。并且,當(dāng)圖像維數(shù)達(dá)到一定數(shù)量后,圖像的提取效果反而會隨著維數(shù)增多而下降,出現(xiàn)Hughes現(xiàn)象[44]。因此,常需要進(jìn)行特征提齲特征提取方法也就是將高光譜影像按照一定的數(shù)學(xué)變換把圖像特征重新進(jìn)行整合,組成一組新的變換空間,將原始數(shù)據(jù)中有價值的信息很好的保留下來的過程。如圖2-3所示[45],Xn為高光譜圖像的各個波段,Ym為進(jìn)行數(shù)學(xué)變換后按照一定順序進(jìn)行排列的各個主成分。常用的特征提取方法有主成分分析[46]和最小噪聲分離方法[47],最后得到降維后的數(shù)據(jù),提取圖像的主要信息。圖2-3特征提取方法Fig.2-3Featureextractionmethod主成分分析(PrincipleComponentAnalysis,PCA),是高光譜圖像處理中常用的方法之一,可以用來進(jìn)行高光譜數(shù)據(jù)的壓縮,消除噪聲和特征提取等操作[48]。它通過統(tǒng)計(jì)變量的方差,將變換后數(shù)據(jù)按照方差的大小進(jìn)行排列組合,這樣可以把圖像的大部分有效信息集中在前幾個主成分分量中表現(xiàn)出來,以此來達(dá)到特征提取的目的。首先設(shè)X=[1,2,,]為P×N的矩陣,其中A=[1,2,,]則為系數(shù)矩陣,對其進(jìn)行線性變換形成一個矩陣方程Z=AX,得到一組新的變量Z=[z1,z2,,zp]T,有方程Z=AX=[12]=[12]=[111+212++11121+222++2111+22++1](2-1)其中新的變量Z大小與X相同,zi與zj(i≠j且i,j∈1,2,…p)向量兩兩無關(guān),再計(jì)算各個向量的方差和向量間?
卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和特點(diǎn)有所不同,但都是通過相同的基本元素組合進(jìn)行搭建的,其基本元素如下:(1)輸入層輸入層可以向卷積神經(jīng)網(wǎng)絡(luò)中輸入要訓(xùn)練的數(shù)據(jù),一般的,根據(jù)卷積神經(jīng)網(wǎng)絡(luò)維數(shù)的不同可以輸入不同維數(shù)的數(shù)據(jù),也可以規(guī)定數(shù)據(jù)輸入時的尺寸大校(2)卷積層能夠用于提取輸入數(shù)據(jù)特征的是卷積層。每個卷積層包括了卷積核的大孝步長和填充,這三個參數(shù)的設(shè)置決定一層卷積層運(yùn)算后得到的特征圖的尺寸和數(shù)量。卷積就是對輸入的數(shù)據(jù)進(jìn)行特征提取,卷積核種類和個數(shù)就代表神經(jīng)網(wǎng)絡(luò)提取特征的種類和個數(shù)。基本的卷積運(yùn)算如圖2-4所示,左側(cè)藍(lán)色矩陣代表輸入的一張圖像數(shù)據(jù),假設(shè)規(guī)定圖像的大。6*6),中間的黃色矩陣是卷積核(3*3),卷積核在圖像上進(jìn)行卷積運(yùn)算,每運(yùn)算一次就可以得到一個元素,最終形成一張卷積后特征圖像,如圖是第一步運(yùn)算,也就是2*1+2*2+1*(-2)+1*(-1)=3,依次進(jìn)行運(yùn)算后得到4*4的一個特征圖像,卷積層上設(shè)置卷積核的個數(shù)就是運(yùn)算后特征圖像的個數(shù)。圖2-4卷積運(yùn)算示意圖Fig.2-4Diagramofconvolutionoperation卷積神經(jīng)網(wǎng)絡(luò)首先認(rèn)知的是簡單的特征,例如顏色、亮度、邊緣等,深層的是更加復(fù)雜的結(jié)構(gòu)特征,例如紋理,最后是對整體的認(rèn)識[62]。每一個卷積核都相當(dāng)于一個特征提取器,提取的特征參數(shù)越多計(jì)算就會越復(fù)雜,對計(jì)算機(jī)的性能要求更高。所以,隨著
【參考文獻(xiàn)】:
期刊論文
[1]一種基于水族瀕危文字的圖像增強(qiáng)及識別方法[J]. 楊秀璋,夏換,于小民. 計(jì)算機(jī)科學(xué). 2019(S2)
[2]基于高光譜影像的瞿曇寺壁畫顏料層脫落病害評估[J]. 劉曉琴,侯妙樂,董友強(qiáng),汪萬福,呂書強(qiáng). 地理信息世界. 2019(05)
[3]改進(jìn)LeNet-5網(wǎng)絡(luò)在圖像分類中的應(yīng)用[J]. 劉金利,張培玲. 計(jì)算機(jī)工程與應(yīng)用. 2019(15)
[4]淺析文物研究工作中的文字釋讀[J]. 裴德文. 文物春秋. 2018(S1)
[5]一種基于深度學(xué)習(xí)的青銅器銘文識別方法[J]. 李文英,曹斌,曹春水,黃永禎. 自動化學(xué)報(bào). 2018(11)
[6]中國古畫礦物顏料光譜混合模型初探——以石青和石綠為例[J]. 李大朋,趙恒謙,張立福,趙學(xué)勝. 光譜學(xué)與光譜分析. 2018(08)
[7]卷積神經(jīng)網(wǎng)絡(luò)的多字體漢字識別[J]. 柴偉佳,王連明. 中國圖象圖形學(xué)報(bào). 2018(03)
[8]基于像素鄰域點(diǎn)信息的藏文圖像細(xì)化算法研究[J]. 劉芳,張?jiān)蒲? 計(jì)算機(jī)技術(shù)與發(fā)展. 2018(04)
[9]高光譜成像技術(shù)在彩繪文物分析中的研究綜述[J]. 侯妙樂,潘寧,馬清林,何海平,呂書強(qiáng),胡云崗. 光譜學(xué)與光譜分析. 2017(06)
[10]高光譜成像技術(shù)在故宮書畫文物保護(hù)中的應(yīng)用[J]. 史寧昌,李廣華,雷勇,吳太夏. 文物保護(hù)與考古科學(xué). 2017(03)
博士論文
[1]光散射與文物彩繪的褪色與顯現(xiàn)研究[D]. 鄭麗珍.陜西師范大學(xué) 2018
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的肺實(shí)質(zhì)分割與肺結(jié)節(jié)檢測方法研究[D]. 陳強(qiáng)銳.南京郵電大學(xué) 2019
[2]基于深度卷積神經(jīng)網(wǎng)絡(luò)的文字識別算法研究[D]. 張達(dá)峰.貴州大學(xué) 2019
[3]高光譜影像的降維方法研究[D]. 姚嬈.遼寧師范大學(xué) 2018
[4]基于卷積神經(jīng)網(wǎng)絡(luò)改進(jìn)算法的藏文識別系統(tǒng)的設(shè)計(jì)與分析[D]. 張瑛.吉林大學(xué) 2018
[5]基于圖模型匹配的印章文字識別研究[D]. 華紹君.湖南大學(xué) 2018
[6]基于多元屬性的媒體熱度預(yù)測算法[D]. 蔡宏翔.上海交通大學(xué) 2018
[7]中國文字的發(fā)展與文字載體的演變[D]. 王熙林.山西師范大學(xué) 2017
[8]基于深度學(xué)習(xí)的圖像識別與文字推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 王雨辰.北京交通大學(xué) 2017
[9]基于遙感影像水體提取方法研究[D]. 張艷超.西北大學(xué) 2016
[10]基于LBP和PCA的脫機(jī)手寫藏文字符識別系統(tǒng)[D]. 蔡曉娟.青海師范大學(xué) 2016
本文編號:3453417
【文章來源】:北京建筑大學(xué)北京市
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【部分圖文】:
研究技術(shù)路線
卣魈崛》椒?(1)主成分分析與最小噪聲分離由于采集的高光譜影像波段數(shù)較多,所包含的信息量十分豐富,但同樣也會產(chǎn)生數(shù)據(jù)冗余的問題,在本文中用到的高光譜圖像有1040個波段,許多數(shù)據(jù)相關(guān)性較高,要從眾多波段中尋找特征明顯的波段比較困難。并且,當(dāng)圖像維數(shù)達(dá)到一定數(shù)量后,圖像的提取效果反而會隨著維數(shù)增多而下降,出現(xiàn)Hughes現(xiàn)象[44]。因此,常需要進(jìn)行特征提齲特征提取方法也就是將高光譜影像按照一定的數(shù)學(xué)變換把圖像特征重新進(jìn)行整合,組成一組新的變換空間,將原始數(shù)據(jù)中有價值的信息很好的保留下來的過程。如圖2-3所示[45],Xn為高光譜圖像的各個波段,Ym為進(jìn)行數(shù)學(xué)變換后按照一定順序進(jìn)行排列的各個主成分。常用的特征提取方法有主成分分析[46]和最小噪聲分離方法[47],最后得到降維后的數(shù)據(jù),提取圖像的主要信息。圖2-3特征提取方法Fig.2-3Featureextractionmethod主成分分析(PrincipleComponentAnalysis,PCA),是高光譜圖像處理中常用的方法之一,可以用來進(jìn)行高光譜數(shù)據(jù)的壓縮,消除噪聲和特征提取等操作[48]。它通過統(tǒng)計(jì)變量的方差,將變換后數(shù)據(jù)按照方差的大小進(jìn)行排列組合,這樣可以把圖像的大部分有效信息集中在前幾個主成分分量中表現(xiàn)出來,以此來達(dá)到特征提取的目的。首先設(shè)X=[1,2,,]為P×N的矩陣,其中A=[1,2,,]則為系數(shù)矩陣,對其進(jìn)行線性變換形成一個矩陣方程Z=AX,得到一組新的變量Z=[z1,z2,,zp]T,有方程Z=AX=[12]=[12]=[111+212++11121+222++2111+22++1](2-1)其中新的變量Z大小與X相同,zi與zj(i≠j且i,j∈1,2,…p)向量兩兩無關(guān),再計(jì)算各個向量的方差和向量間?
卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和特點(diǎn)有所不同,但都是通過相同的基本元素組合進(jìn)行搭建的,其基本元素如下:(1)輸入層輸入層可以向卷積神經(jīng)網(wǎng)絡(luò)中輸入要訓(xùn)練的數(shù)據(jù),一般的,根據(jù)卷積神經(jīng)網(wǎng)絡(luò)維數(shù)的不同可以輸入不同維數(shù)的數(shù)據(jù),也可以規(guī)定數(shù)據(jù)輸入時的尺寸大校(2)卷積層能夠用于提取輸入數(shù)據(jù)特征的是卷積層。每個卷積層包括了卷積核的大孝步長和填充,這三個參數(shù)的設(shè)置決定一層卷積層運(yùn)算后得到的特征圖的尺寸和數(shù)量。卷積就是對輸入的數(shù)據(jù)進(jìn)行特征提取,卷積核種類和個數(shù)就代表神經(jīng)網(wǎng)絡(luò)提取特征的種類和個數(shù)。基本的卷積運(yùn)算如圖2-4所示,左側(cè)藍(lán)色矩陣代表輸入的一張圖像數(shù)據(jù),假設(shè)規(guī)定圖像的大。6*6),中間的黃色矩陣是卷積核(3*3),卷積核在圖像上進(jìn)行卷積運(yùn)算,每運(yùn)算一次就可以得到一個元素,最終形成一張卷積后特征圖像,如圖是第一步運(yùn)算,也就是2*1+2*2+1*(-2)+1*(-1)=3,依次進(jìn)行運(yùn)算后得到4*4的一個特征圖像,卷積層上設(shè)置卷積核的個數(shù)就是運(yùn)算后特征圖像的個數(shù)。圖2-4卷積運(yùn)算示意圖Fig.2-4Diagramofconvolutionoperation卷積神經(jīng)網(wǎng)絡(luò)首先認(rèn)知的是簡單的特征,例如顏色、亮度、邊緣等,深層的是更加復(fù)雜的結(jié)構(gòu)特征,例如紋理,最后是對整體的認(rèn)識[62]。每一個卷積核都相當(dāng)于一個特征提取器,提取的特征參數(shù)越多計(jì)算就會越復(fù)雜,對計(jì)算機(jī)的性能要求更高。所以,隨著
【參考文獻(xiàn)】:
期刊論文
[1]一種基于水族瀕危文字的圖像增強(qiáng)及識別方法[J]. 楊秀璋,夏換,于小民. 計(jì)算機(jī)科學(xué). 2019(S2)
[2]基于高光譜影像的瞿曇寺壁畫顏料層脫落病害評估[J]. 劉曉琴,侯妙樂,董友強(qiáng),汪萬福,呂書強(qiáng). 地理信息世界. 2019(05)
[3]改進(jìn)LeNet-5網(wǎng)絡(luò)在圖像分類中的應(yīng)用[J]. 劉金利,張培玲. 計(jì)算機(jī)工程與應(yīng)用. 2019(15)
[4]淺析文物研究工作中的文字釋讀[J]. 裴德文. 文物春秋. 2018(S1)
[5]一種基于深度學(xué)習(xí)的青銅器銘文識別方法[J]. 李文英,曹斌,曹春水,黃永禎. 自動化學(xué)報(bào). 2018(11)
[6]中國古畫礦物顏料光譜混合模型初探——以石青和石綠為例[J]. 李大朋,趙恒謙,張立福,趙學(xué)勝. 光譜學(xué)與光譜分析. 2018(08)
[7]卷積神經(jīng)網(wǎng)絡(luò)的多字體漢字識別[J]. 柴偉佳,王連明. 中國圖象圖形學(xué)報(bào). 2018(03)
[8]基于像素鄰域點(diǎn)信息的藏文圖像細(xì)化算法研究[J]. 劉芳,張?jiān)蒲? 計(jì)算機(jī)技術(shù)與發(fā)展. 2018(04)
[9]高光譜成像技術(shù)在彩繪文物分析中的研究綜述[J]. 侯妙樂,潘寧,馬清林,何海平,呂書強(qiáng),胡云崗. 光譜學(xué)與光譜分析. 2017(06)
[10]高光譜成像技術(shù)在故宮書畫文物保護(hù)中的應(yīng)用[J]. 史寧昌,李廣華,雷勇,吳太夏. 文物保護(hù)與考古科學(xué). 2017(03)
博士論文
[1]光散射與文物彩繪的褪色與顯現(xiàn)研究[D]. 鄭麗珍.陜西師范大學(xué) 2018
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的肺實(shí)質(zhì)分割與肺結(jié)節(jié)檢測方法研究[D]. 陳強(qiáng)銳.南京郵電大學(xué) 2019
[2]基于深度卷積神經(jīng)網(wǎng)絡(luò)的文字識別算法研究[D]. 張達(dá)峰.貴州大學(xué) 2019
[3]高光譜影像的降維方法研究[D]. 姚嬈.遼寧師范大學(xué) 2018
[4]基于卷積神經(jīng)網(wǎng)絡(luò)改進(jìn)算法的藏文識別系統(tǒng)的設(shè)計(jì)與分析[D]. 張瑛.吉林大學(xué) 2018
[5]基于圖模型匹配的印章文字識別研究[D]. 華紹君.湖南大學(xué) 2018
[6]基于多元屬性的媒體熱度預(yù)測算法[D]. 蔡宏翔.上海交通大學(xué) 2018
[7]中國文字的發(fā)展與文字載體的演變[D]. 王熙林.山西師范大學(xué) 2017
[8]基于深度學(xué)習(xí)的圖像識別與文字推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 王雨辰.北京交通大學(xué) 2017
[9]基于遙感影像水體提取方法研究[D]. 張艷超.西北大學(xué) 2016
[10]基于LBP和PCA的脫機(jī)手寫藏文字符識別系統(tǒng)[D]. 蔡曉娟.青海師范大學(xué) 2016
本文編號:3453417
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3453417.html
最近更新
教材專著