基于深度學(xué)習(xí)和遷移學(xué)習(xí)的書法漢字識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2020-12-23 21:08
書法漢字識(shí)別作為計(jì)算機(jī)視覺的分支,隨著圖像數(shù)字化技術(shù)的發(fā)展逐漸為人們所重視,且在書法圖像標(biāo)注、研究名家作品等方面有著不可或缺的價(jià)值。然而,書法圖像數(shù)據(jù)的稀缺性、流傳時(shí)產(chǎn)生的多噪性都給書法識(shí)別增加了難度和挑戰(zhàn)。與此同時(shí),基于深度學(xué)習(xí)和遷移學(xué)習(xí)的圖像識(shí)別技術(shù)憑借識(shí)別準(zhǔn)確度高、對(duì)小數(shù)據(jù)集泛化能力強(qiáng)等優(yōu)勢(shì)躍身為當(dāng)今計(jì)算機(jī)視覺領(lǐng)域研究熱點(diǎn)。將基于深度學(xué)習(xí)和遷移學(xué)習(xí)的圖像識(shí)別技術(shù)與書法漢字圖像相結(jié)合,以分析書法漢字識(shí)別領(lǐng)域的應(yīng)用需求,采集大量書法單字圖像作為數(shù)據(jù)集,使用遷移學(xué)習(xí)后的卷積神經(jīng)網(wǎng)絡(luò)提取圖像高層抽象特征,以完成本課題的書法漢字識(shí)別任務(wù)。首先,對(duì)獲取到的書法圖像數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理,以備后期模型訓(xùn)練;其次,對(duì)大數(shù)據(jù)集上訓(xùn)練完成的模型和權(quán)重進(jìn)行遷移,使其對(duì)書法圖像數(shù)據(jù)進(jìn)行高層抽象特征的提取,構(gòu)建網(wǎng)絡(luò)模型;最后,根據(jù)訓(xùn)練好的網(wǎng)絡(luò)模型對(duì)書法圖像算出的識(shí)別概率值排序,得到書法識(shí)別結(jié)果并對(duì)其漢字釋義、相似書法進(jìn)行展示。該系統(tǒng)將為書法圖像數(shù)字化標(biāo)注或書法作品研究方面帶來(lái)巨大便利。本文從兩方面研究并實(shí)現(xiàn)了該書法漢字識(shí)別系統(tǒng):第一:將深度學(xué)習(xí)中的深度神經(jīng)網(wǎng)絡(luò)與遷移學(xué)習(xí)中的模型遷移思想相結(jié)合。在具備大量圖像...
【文章來(lái)源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1稀疏交互示意圖??
??和許多輸入產(chǎn)生間接交互,如圖2-2所示,可見卷積網(wǎng)絡(luò)更深層單元具有比淺層??單元更大的接受域。??Ov?Q?0.?Q??圖2-2神經(jīng)元與輸入間接交互示意圖??這使得稀疏交互具有代表性,可以間接窺見變量間的復(fù)雜連接內(nèi)容。??參數(shù)共享指的是在同一模型的不同函數(shù)間采用相同的參數(shù)。拿圖像處理舉??例,對(duì)一個(gè)輸入像素為1000?x?1000的圖像而言,假設(shè)隱藏層含有1〇9個(gè)神經(jīng)元。??傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)在進(jìn)行前向傳播時(shí)采用全連接,將產(chǎn)生1000xl000xl09=l0ls個(gè)??權(quán)值參數(shù)。而卷積網(wǎng)絡(luò)中形象化地描述是,隱藏層含有綁定的權(quán)值。因?yàn)榧僭O(shè)隱??藏層的每個(gè)神經(jīng)元僅與5?X?5個(gè)像素相連,那么109個(gè)神經(jīng)元使用的皆是這5?X?5??個(gè)權(quán)值,如同被綁定了一樣。無(wú)論隱藏層含有多少祌經(jīng)元,僅有這5x5個(gè)權(quán)值??被訓(xùn)練(即卷積核大小為5*5)。核的每一個(gè)元素都作用在輸入的每一位置上。??參數(shù)共享使得特征學(xué)習(xí)過(guò)程中只要求習(xí)得一個(gè)參數(shù)集合
??和許多輸入產(chǎn)生間接交互,如圖2-2所示,可見卷積網(wǎng)絡(luò)更深層單元具有比淺層??單元更大的接受域。??Ov?Q?0.?Q??圖2-2神經(jīng)元與輸入間接交互示意圖??這使得稀疏交互具有代表性,可以間接窺見變量間的復(fù)雜連接內(nèi)容。??參數(shù)共享指的是在同一模型的不同函數(shù)間采用相同的參數(shù)。拿圖像處理舉??例,對(duì)一個(gè)輸入像素為1000?x?1000的圖像而言,假設(shè)隱藏層含有1〇9個(gè)神經(jīng)元。??傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)在進(jìn)行前向傳播時(shí)采用全連接,將產(chǎn)生1000xl000xl09=l0ls個(gè)??權(quán)值參數(shù)。而卷積網(wǎng)絡(luò)中形象化地描述是,隱藏層含有綁定的權(quán)值。因?yàn)榧僭O(shè)隱??藏層的每個(gè)神經(jīng)元僅與5?X?5個(gè)像素相連,那么109個(gè)神經(jīng)元使用的皆是這5?X?5??個(gè)權(quán)值,如同被綁定了一樣。無(wú)論隱藏層含有多少祌經(jīng)元,僅有這5x5個(gè)權(quán)值??被訓(xùn)練(即卷積核大小為5*5)。核的每一個(gè)元素都作用在輸入的每一位置上。??參數(shù)共享使得特征學(xué)習(xí)過(guò)程中只要求習(xí)得一個(gè)參數(shù)集合
【參考文獻(xiàn)】:
期刊論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的石刻書法字識(shí)別方法[J]. 溫佩芝,姚航,沈嘉煒. 計(jì)算機(jī)工程與設(shè)計(jì). 2018(03)
[2]基于視覺特征的書法風(fēng)格識(shí)別[J]. 汪瀟,章夏芬,韓德志. 現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2016(21)
[3]小篆文字的自動(dòng)識(shí)別[J]. 戴瓊,周明全,付倩. 計(jì)算機(jī)技術(shù)與發(fā)展. 2016(03)
[4]中國(guó)書法的特征提取及識(shí)別[J]. 王民,曾寶瑩,要趁紅,田湘源,孫向南. 信息通信. 2015(07)
博士論文
[1]計(jì)算機(jī)書法若干關(guān)鍵技術(shù)研究[D]. 俞凱.浙江大學(xué) 2010
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的書法風(fēng)格識(shí)別的研究[D]. 張福成.西安理工大學(xué) 2018
[2]基于CNN的書法風(fēng)格識(shí)別[D]. 燕飛躍.太原理工大學(xué) 2018
[3]中國(guó)書法字識(shí)別算法研究及應(yīng)用[D]. 林媛.浙江大學(xué) 2014
[4]書法字書體風(fēng)格識(shí)別技術(shù)[D]. 毛天驕.浙江大學(xué) 2014
本文編號(hào):2934361
【文章來(lái)源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1稀疏交互示意圖??
??和許多輸入產(chǎn)生間接交互,如圖2-2所示,可見卷積網(wǎng)絡(luò)更深層單元具有比淺層??單元更大的接受域。??Ov?Q?0.?Q??圖2-2神經(jīng)元與輸入間接交互示意圖??這使得稀疏交互具有代表性,可以間接窺見變量間的復(fù)雜連接內(nèi)容。??參數(shù)共享指的是在同一模型的不同函數(shù)間采用相同的參數(shù)。拿圖像處理舉??例,對(duì)一個(gè)輸入像素為1000?x?1000的圖像而言,假設(shè)隱藏層含有1〇9個(gè)神經(jīng)元。??傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)在進(jìn)行前向傳播時(shí)采用全連接,將產(chǎn)生1000xl000xl09=l0ls個(gè)??權(quán)值參數(shù)。而卷積網(wǎng)絡(luò)中形象化地描述是,隱藏層含有綁定的權(quán)值。因?yàn)榧僭O(shè)隱??藏層的每個(gè)神經(jīng)元僅與5?X?5個(gè)像素相連,那么109個(gè)神經(jīng)元使用的皆是這5?X?5??個(gè)權(quán)值,如同被綁定了一樣。無(wú)論隱藏層含有多少祌經(jīng)元,僅有這5x5個(gè)權(quán)值??被訓(xùn)練(即卷積核大小為5*5)。核的每一個(gè)元素都作用在輸入的每一位置上。??參數(shù)共享使得特征學(xué)習(xí)過(guò)程中只要求習(xí)得一個(gè)參數(shù)集合
??和許多輸入產(chǎn)生間接交互,如圖2-2所示,可見卷積網(wǎng)絡(luò)更深層單元具有比淺層??單元更大的接受域。??Ov?Q?0.?Q??圖2-2神經(jīng)元與輸入間接交互示意圖??這使得稀疏交互具有代表性,可以間接窺見變量間的復(fù)雜連接內(nèi)容。??參數(shù)共享指的是在同一模型的不同函數(shù)間采用相同的參數(shù)。拿圖像處理舉??例,對(duì)一個(gè)輸入像素為1000?x?1000的圖像而言,假設(shè)隱藏層含有1〇9個(gè)神經(jīng)元。??傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)在進(jìn)行前向傳播時(shí)采用全連接,將產(chǎn)生1000xl000xl09=l0ls個(gè)??權(quán)值參數(shù)。而卷積網(wǎng)絡(luò)中形象化地描述是,隱藏層含有綁定的權(quán)值。因?yàn)榧僭O(shè)隱??藏層的每個(gè)神經(jīng)元僅與5?X?5個(gè)像素相連,那么109個(gè)神經(jīng)元使用的皆是這5?X?5??個(gè)權(quán)值,如同被綁定了一樣。無(wú)論隱藏層含有多少祌經(jīng)元,僅有這5x5個(gè)權(quán)值??被訓(xùn)練(即卷積核大小為5*5)。核的每一個(gè)元素都作用在輸入的每一位置上。??參數(shù)共享使得特征學(xué)習(xí)過(guò)程中只要求習(xí)得一個(gè)參數(shù)集合
【參考文獻(xiàn)】:
期刊論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的石刻書法字識(shí)別方法[J]. 溫佩芝,姚航,沈嘉煒. 計(jì)算機(jī)工程與設(shè)計(jì). 2018(03)
[2]基于視覺特征的書法風(fēng)格識(shí)別[J]. 汪瀟,章夏芬,韓德志. 現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2016(21)
[3]小篆文字的自動(dòng)識(shí)別[J]. 戴瓊,周明全,付倩. 計(jì)算機(jī)技術(shù)與發(fā)展. 2016(03)
[4]中國(guó)書法的特征提取及識(shí)別[J]. 王民,曾寶瑩,要趁紅,田湘源,孫向南. 信息通信. 2015(07)
博士論文
[1]計(jì)算機(jī)書法若干關(guān)鍵技術(shù)研究[D]. 俞凱.浙江大學(xué) 2010
碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的書法風(fēng)格識(shí)別的研究[D]. 張福成.西安理工大學(xué) 2018
[2]基于CNN的書法風(fēng)格識(shí)別[D]. 燕飛躍.太原理工大學(xué) 2018
[3]中國(guó)書法字識(shí)別算法研究及應(yīng)用[D]. 林媛.浙江大學(xué) 2014
[4]書法字書體風(fēng)格識(shí)別技術(shù)[D]. 毛天驕.浙江大學(xué) 2014
本文編號(hào):2934361
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2934361.html
最近更新
教材專著