基于深度學(xué)習(xí)的電商商品宣傳圖片文字識(shí)別研究
發(fā)布時(shí)間:2021-09-07 03:10
電商平臺(tái)管理者需對(duì)商鋪所售產(chǎn)品的海量商品圖片進(jìn)行信息抽取,進(jìn)而實(shí)現(xiàn)風(fēng)險(xiǎn)管控,因此商品宣傳圖片文字識(shí)別是電商平臺(tái)管理的技術(shù)關(guān)鍵。本文利用深度學(xué)習(xí)技術(shù)實(shí)現(xiàn)對(duì)電商商品宣傳圖片的文字檢測(cè)與識(shí)別,為電商管理提供行之有效的技術(shù)支撐。主要研究內(nèi)容如下:(1)針對(duì)CTPN(Connectionist Text Proposal Network)文字檢測(cè)算法檢測(cè)不同高度文字時(shí)易出現(xiàn)的檢測(cè)框偏移問題,在CTPN的基礎(chǔ)上,提出了融合文字高度特征的文字檢測(cè)算法Hy-CTPN,該方法通過改善CTPN文字框合并機(jī)制,將文字高度信息加入文字檢測(cè)框精修中。在ICDAR2013上的實(shí)驗(yàn)結(jié)果顯示,Hy-CTPN算法的召回率為85%,F1-Measure為89%,檢測(cè)時(shí)間為90ms,相比于原始CTPN,召回率提升了2%,F1-Measure提升了1%,算法平均預(yù)測(cè)時(shí)間縮短了50ms;在自制商品宣傳圖片檢測(cè)數(shù)據(jù)集上HyCTPN也有較為優(yōu)異的表現(xiàn);(2)針對(duì)Hy-CTPN文字檢測(cè)后出現(xiàn)的漏檢問題,提出了一種基于卷積自動(dòng)編碼器特征的隨機(jī)森林文字檢測(cè)后驗(yàn)?zāi)P?該方法將深度學(xué)習(xí)中的卷積自編碼特征與隨機(jī)森林方法相結(jié)合。使用隨機(jī)森林方法...
【文章來源】:河北經(jīng)貿(mào)大學(xué)河北省
【文章頁數(shù)】:69 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
商品宣傳圖片文文字檢測(cè)隨機(jī)森林文字檢測(cè)后驗(yàn)
基于深度學(xué)習(xí)的電商商品宣傳圖片文字識(shí)別研究112系統(tǒng)處理流程與文字檢測(cè)算法研究2.1系統(tǒng)處理流程基于深度學(xué)習(xí)的商品宣傳圖片文字識(shí)別處理流程如圖2-1所示。圖2-1商品宣傳圖片文字識(shí)別系統(tǒng)處理流程如圖所示,商品宣傳圖片的文字檢測(cè)與識(shí)別處理流程為:(1)使用所提出的融合文字高度信息的文字檢測(cè)算法Hy-CTPN進(jìn)行文字檢測(cè);(2)使用所提出的Auto-CNN特征+隨機(jī)森林的文字檢測(cè)后驗(yàn)?zāi)P瓦M(jìn)行文字檢測(cè)后驗(yàn)驗(yàn)證;(3)使用所設(shè)計(jì)基于OP-Niblick的透視變換校正算法對(duì)檢測(cè)后的文字圖像進(jìn)行畸變校正;(4)使用所提出的Simi-DenseNet+CTC特征序列識(shí)別算法進(jìn)行文字序列識(shí)別。2.2數(shù)據(jù)收集及預(yù)處理由于目前還沒有特定的商品宣傳圖片文字檢測(cè)與識(shí)別數(shù)據(jù)集,故本文采用網(wǎng)絡(luò)爬蟲的方式進(jìn)行數(shù)據(jù)收集,去除無效圖片,剩余的圖片共15243幅,使用labelImg進(jìn)行圖像標(biāo)注。標(biāo)注完成后,對(duì)此15243幅圖像進(jìn)行隨機(jī)加噪聲、隨機(jī)旋轉(zhuǎn)一定角度操作后,圖像擴(kuò)增至30000幅。此外,考慮到數(shù)據(jù)量與數(shù)據(jù)分布問題,對(duì)超市商品圖像進(jìn)行拍攝以收集數(shù)據(jù),采取拍攝方式收集的數(shù)據(jù)集圖片包括3000幅超市商品宣傳圖片文字圖片,以此增加數(shù)據(jù)量,提高數(shù)據(jù)分布寬泛性。隨后分別對(duì)數(shù)據(jù)圖片進(jìn)行隨機(jī)旋轉(zhuǎn)一定角度、加椒鹽噪聲、增強(qiáng)圖片對(duì)比度進(jìn)行數(shù)據(jù)擴(kuò)增。經(jīng)歷數(shù)據(jù)擴(kuò)增后,圖像總體數(shù)量變?yōu)?4000幅,與上文自制的圖像數(shù)據(jù)集組成共54000幅商品宣傳圖片文字檢測(cè)數(shù)據(jù)集。對(duì)一幅圖像的數(shù)據(jù)擴(kuò)增效文字檢測(cè)隨機(jī)森林文字檢測(cè)后驗(yàn)文字畸變校正文字序列識(shí)別
RPN網(wǎng)絡(luò)與CTPN網(wǎng)絡(luò)對(duì)比
【參考文獻(xiàn)】:
期刊論文
[1]基于OCR技術(shù)的網(wǎng)店工商信息識(shí)別提取系統(tǒng)[J]. 高洪坤,任煥海. 信息技術(shù)與信息化. 2021(07)
本文編號(hào):3388724
【文章來源】:河北經(jīng)貿(mào)大學(xué)河北省
【文章頁數(shù)】:69 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
商品宣傳圖片文文字檢測(cè)隨機(jī)森林文字檢測(cè)后驗(yàn)
基于深度學(xué)習(xí)的電商商品宣傳圖片文字識(shí)別研究112系統(tǒng)處理流程與文字檢測(cè)算法研究2.1系統(tǒng)處理流程基于深度學(xué)習(xí)的商品宣傳圖片文字識(shí)別處理流程如圖2-1所示。圖2-1商品宣傳圖片文字識(shí)別系統(tǒng)處理流程如圖所示,商品宣傳圖片的文字檢測(cè)與識(shí)別處理流程為:(1)使用所提出的融合文字高度信息的文字檢測(cè)算法Hy-CTPN進(jìn)行文字檢測(cè);(2)使用所提出的Auto-CNN特征+隨機(jī)森林的文字檢測(cè)后驗(yàn)?zāi)P瓦M(jìn)行文字檢測(cè)后驗(yàn)驗(yàn)證;(3)使用所設(shè)計(jì)基于OP-Niblick的透視變換校正算法對(duì)檢測(cè)后的文字圖像進(jìn)行畸變校正;(4)使用所提出的Simi-DenseNet+CTC特征序列識(shí)別算法進(jìn)行文字序列識(shí)別。2.2數(shù)據(jù)收集及預(yù)處理由于目前還沒有特定的商品宣傳圖片文字檢測(cè)與識(shí)別數(shù)據(jù)集,故本文采用網(wǎng)絡(luò)爬蟲的方式進(jìn)行數(shù)據(jù)收集,去除無效圖片,剩余的圖片共15243幅,使用labelImg進(jìn)行圖像標(biāo)注。標(biāo)注完成后,對(duì)此15243幅圖像進(jìn)行隨機(jī)加噪聲、隨機(jī)旋轉(zhuǎn)一定角度操作后,圖像擴(kuò)增至30000幅。此外,考慮到數(shù)據(jù)量與數(shù)據(jù)分布問題,對(duì)超市商品圖像進(jìn)行拍攝以收集數(shù)據(jù),采取拍攝方式收集的數(shù)據(jù)集圖片包括3000幅超市商品宣傳圖片文字圖片,以此增加數(shù)據(jù)量,提高數(shù)據(jù)分布寬泛性。隨后分別對(duì)數(shù)據(jù)圖片進(jìn)行隨機(jī)旋轉(zhuǎn)一定角度、加椒鹽噪聲、增強(qiáng)圖片對(duì)比度進(jìn)行數(shù)據(jù)擴(kuò)增。經(jīng)歷數(shù)據(jù)擴(kuò)增后,圖像總體數(shù)量變?yōu)?4000幅,與上文自制的圖像數(shù)據(jù)集組成共54000幅商品宣傳圖片文字檢測(cè)數(shù)據(jù)集。對(duì)一幅圖像的數(shù)據(jù)擴(kuò)增效文字檢測(cè)隨機(jī)森林文字檢測(cè)后驗(yàn)文字畸變校正文字序列識(shí)別
RPN網(wǎng)絡(luò)與CTPN網(wǎng)絡(luò)對(duì)比
【參考文獻(xiàn)】:
期刊論文
[1]基于OCR技術(shù)的網(wǎng)店工商信息識(shí)別提取系統(tǒng)[J]. 高洪坤,任煥海. 信息技術(shù)與信息化. 2021(07)
本文編號(hào):3388724
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3388724.html
最近更新
教材專著