基于卷積神經網絡的手寫數字識別算法研究與應用
發(fā)布時間:2024-04-14 22:02
手寫數字識別屬于基本的圖像分類問題,在云計算、金融和郵政等領域具有很高的實用價值。由于手寫數字在書寫時存在無限制性問題,實現快速有效識別的難度相對較大。隨著深度學習相關算法的出現和計算機硬件技術的快速發(fā)展,基于卷積神經網絡的圖像分類方法逐漸成為了研究熱點。由于卷積神經網絡具有較強的函數表示能力和網絡泛化能力,識別率往往能超過傳統(tǒng)圖像分類方法,因此應用卷積神經網絡實現手寫數字識別的研究具有重要的意義。本文針對現有的卷積神經網絡實現手寫數字識別方法中存在的問題進行了研究分析,具體內容包括:(1)卷積神經網絡訓練時,針對卷積核隨機初始化導致的收斂速度慢和識別率低的問題,提出一種主成分分析初始化卷積核的卷積神經網絡手寫數字識別算法。實驗結果表明:算法在應用MNIST數據庫訓練時收斂速度快,在迭代次數受限時識別率高,性能優(yōu)于隨機初始化卷積核的卷積神經網絡手寫數字識別算法。(2)空間金字塔池化網絡進行多尺度訓練時,針對空間金字塔池化層到卷積層反向傳播非常低效的問題,提出了一種最大值位置映射的反向傳播方法。實驗結果表明:該方法在應用MNIST數據庫分別進行單尺度和多尺度訓練時,均方誤差曲線均收斂,實...
【文章頁數】:77 頁
【學位級別】:碩士
【文章目錄】:
致謝
摘要
Abstract
1 緒論
1.1 研究背景和意義
1.2 國內外研究現狀
1.2.1 卷積神經網絡的研究現狀
1.2.2 手寫數字識別的基本流程
1.3 研究難點及關鍵問題
1.3.1 手寫數字識別研究的難點
1.3.2 卷積神經網絡存在的問題
1.4 本文主要工作及結構安排
1.4.1 本文主要工作
1.4.2 本文的結構安排
2 卷積神經網絡基本原理
2.1 數據集介紹
2.2 卷積神經網絡的基本結構及前向傳播過程
2.2.1 卷積層
2.2.2 池化層
2.2.3 Flatten層、全連接層與輸出層
2.2.4 激活函數
2.2.5 損失函數
2.3 卷積神經網絡反向傳播過程
2.4 本章小結
3 基于PCA初始化卷積核的CNN手寫數字識別算法
3.1 CNN的卷積核初始化方法概述
3.2 PCA特征提取方法分析
3.3 改進的PCA初始化卷積核原理
3.3.1 基于PCA的卷積核初始化方法
3.3.2 學習速率影響分析
3.4 仿真結果與分析
3.4.1 仿真環(huán)境的設置以及樣本集選取
3.4.2 仿真結果及分析
3.5 本章小結
4 基于最大值位置映射的SPPNet多尺度手寫數字訓練方法
4.1 基于空間金字塔池化的Le Net-5 網絡
4.2 SPPNet訓練概述
4.3 卷積層到SPP層正向傳播
4.3.1 Feature Map填充
4.3.2 獲取不同Bin中最大值及其相應位置
4.4 SPP層到卷積層反向傳播方法
4.5 實驗仿真驗證
4.5.1 單尺度訓練測試驗證
4.5.2 多尺度訓練測試驗證
4.6 本章小結
5 基于卷積神經網絡的試卷分數識別應用系統(tǒng)設計
5.1 試卷分數識別系統(tǒng)流程
5.2 試卷模板設計
5.2.1 試卷卷頭基本定義
5.2.2 試卷卷頭功能單元的分類
5.2.3 試卷卷頭對象之間的邏輯關系
5.3 圖像預處理
5.3.1 試卷分數區(qū)域提取
5.3.2 試卷分數區(qū)域傾斜矯正
5.3.3 試卷分數區(qū)域分割
5.4 卷積神經網絡識別
5.4.1 Caffe卷積神經網絡框架介紹
5.4.2 卷積神經網絡模型設計與參數配置
5.4.3 系統(tǒng)權值微調
5.5 本章小結
6 總結與展望
6.1 總結
6.2 展望
參考文獻
作者簡介
學位論文數據集
本文編號:3955293
【文章頁數】:77 頁
【學位級別】:碩士
【文章目錄】:
致謝
摘要
Abstract
1 緒論
1.1 研究背景和意義
1.2 國內外研究現狀
1.2.1 卷積神經網絡的研究現狀
1.2.2 手寫數字識別的基本流程
1.3 研究難點及關鍵問題
1.3.1 手寫數字識別研究的難點
1.3.2 卷積神經網絡存在的問題
1.4 本文主要工作及結構安排
1.4.1 本文主要工作
1.4.2 本文的結構安排
2 卷積神經網絡基本原理
2.1 數據集介紹
2.2 卷積神經網絡的基本結構及前向傳播過程
2.2.1 卷積層
2.2.2 池化層
2.2.3 Flatten層、全連接層與輸出層
2.2.4 激活函數
2.2.5 損失函數
2.3 卷積神經網絡反向傳播過程
2.4 本章小結
3 基于PCA初始化卷積核的CNN手寫數字識別算法
3.1 CNN的卷積核初始化方法概述
3.2 PCA特征提取方法分析
3.3 改進的PCA初始化卷積核原理
3.3.1 基于PCA的卷積核初始化方法
3.3.2 學習速率影響分析
3.4 仿真結果與分析
3.4.1 仿真環(huán)境的設置以及樣本集選取
3.4.2 仿真結果及分析
3.5 本章小結
4 基于最大值位置映射的SPPNet多尺度手寫數字訓練方法
4.1 基于空間金字塔池化的Le Net-5 網絡
4.2 SPPNet訓練概述
4.3 卷積層到SPP層正向傳播
4.3.1 Feature Map填充
4.3.2 獲取不同Bin中最大值及其相應位置
4.4 SPP層到卷積層反向傳播方法
4.5 實驗仿真驗證
4.5.1 單尺度訓練測試驗證
4.5.2 多尺度訓練測試驗證
4.6 本章小結
5 基于卷積神經網絡的試卷分數識別應用系統(tǒng)設計
5.1 試卷分數識別系統(tǒng)流程
5.2 試卷模板設計
5.2.1 試卷卷頭基本定義
5.2.2 試卷卷頭功能單元的分類
5.2.3 試卷卷頭對象之間的邏輯關系
5.3 圖像預處理
5.3.1 試卷分數區(qū)域提取
5.3.2 試卷分數區(qū)域傾斜矯正
5.3.3 試卷分數區(qū)域分割
5.4 卷積神經網絡識別
5.4.1 Caffe卷積神經網絡框架介紹
5.4.2 卷積神經網絡模型設計與參數配置
5.4.3 系統(tǒng)權值微調
5.5 本章小結
6 總結與展望
6.1 總結
6.2 展望
參考文獻
作者簡介
學位論文數據集
本文編號:3955293
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3955293.html
最近更新
教材專著