基于機器學習的農業(yè)文本分類方法研究
發(fā)布時間:2023-02-19 15:38
隨著網絡技術、數據庫技術、計算機技術的迅速發(fā)展和Internet的日漸普及,特別是大數據時代的到來,在我們的實際生活中,每一個領域都在以史無前例的速度生產著海量的信息和數據,尤其的海量的雜亂無規(guī)則的文本信息,農業(yè)領域也不例外,我國在農業(yè)信息化發(fā)展進程中建設了大量的涉農網站、數據庫、信息系統(tǒng)、專家系統(tǒng)等,積累了豐富的農業(yè)新聞、技術、市場等信息。隨著移動互聯網、智能手機等新技術在偏遠農村的迅猛普及,制約農業(yè)信息化發(fā)展的“最后一公里”問題已經得到有效地解決,農業(yè)信息化服務的模式也將必然從傳統(tǒng)的網站式服務逐步轉為以信息推送為主。而農業(yè)文本的分類及相關預處理是實現農業(yè)信息有效推送的關鍵,因此,如何實現農業(yè)文本的自動分類,迅速挖掘有效信息,為人們所深度利用成為一個迫在眉睫的問題。為了有效地組織和管理雜亂無序的海量農業(yè)信息,針對目前農業(yè)文本分類系統(tǒng)不完善、農業(yè)語料庫稀缺的問題,本文的主要研究內容及研究成果如下:(1)詳細的闡述了農業(yè)文本語料庫的構建以及預處理的過程,設計了基于機器學習的農業(yè)文本分類流程,并按照流程對爬蟲程序獲取的農業(yè)網頁進行清洗,獲取農業(yè)文本,采用Java語言實現了中文文本分詞和預處...
【文章頁數】:64 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 課題的研究背景及意義
1.2 國內外研究現狀
1.3 本文的研究內容
1.4 本文的組織結構
第二章 農業(yè)文本語料庫的構建及預處理
2.1 農業(yè)文本語料庫的構建
2.2 農業(yè)文本語料庫的預處理
2.2.1 基于機器學習的農業(yè)文本分類流程
2.2.2 基于CHI值的特征詞提取
2.2.3 文本分詞
2.2.4 特征詞條的選取
2.2.5 分類性能的評估標準
2.3 農業(yè)文本分類實驗方法
2.4 本章小結
第三章 基于機器學習的農業(yè)文本分類方法分析
3.1 常用文本分類的機器學習方法
3.2 基于樸素貝葉斯的農業(yè)文本分類分析
3.2.1 貝葉斯原理
3.2.2 極大后驗假設與極大似然假設
3.2.3 事件的獨立性
3.2.4 樸素貝葉斯原理
3.2.5 基于樸素貝葉斯的農業(yè)文本分類方法實現
3.2.6 基于樸素貝葉斯的分類器分類性能分析
3.3 基于支持向量機的農業(yè)文本分類分析
3.3.1 最優(yōu)超平面的構建
3.3.2 線性可分支持向量
3.3.3 線性不可分支持向量
3.3.4 核函數的選取
3.3.5 基于支持向量機的分類器分類性能分析
3.4 基于LSTM的農業(yè)文本分類分析
3.4.1 遞歸神經網絡
3.4.2 LSTM原理
3.4.3 基于LSTM的農業(yè)文本分類方法實現
3.4.4 基于LSTM的分類器分類性能分析
3.5 本章小結
第四章 基于機器學習的農業(yè)文本分類實驗結果分析
4.1 分類精度
4.2 訓練速度
4.3 泛化效果
4.4 本章小結
第五章 總結及展望
5.1 總結
5.2 展望
參考文獻
致謝
攻讀碩士期間發(fā)表論文
本文編號:3746488
【文章頁數】:64 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 課題的研究背景及意義
1.2 國內外研究現狀
1.3 本文的研究內容
1.4 本文的組織結構
第二章 農業(yè)文本語料庫的構建及預處理
2.1 農業(yè)文本語料庫的構建
2.2 農業(yè)文本語料庫的預處理
2.2.1 基于機器學習的農業(yè)文本分類流程
2.2.2 基于CHI值的特征詞提取
2.2.3 文本分詞
2.2.4 特征詞條的選取
2.2.5 分類性能的評估標準
2.3 農業(yè)文本分類實驗方法
2.4 本章小結
第三章 基于機器學習的農業(yè)文本分類方法分析
3.1 常用文本分類的機器學習方法
3.2 基于樸素貝葉斯的農業(yè)文本分類分析
3.2.1 貝葉斯原理
3.2.2 極大后驗假設與極大似然假設
3.2.3 事件的獨立性
3.2.4 樸素貝葉斯原理
3.2.5 基于樸素貝葉斯的農業(yè)文本分類方法實現
3.2.6 基于樸素貝葉斯的分類器分類性能分析
3.3 基于支持向量機的農業(yè)文本分類分析
3.3.1 最優(yōu)超平面的構建
3.3.2 線性可分支持向量
3.3.3 線性不可分支持向量
3.3.4 核函數的選取
3.3.5 基于支持向量機的分類器分類性能分析
3.4 基于LSTM的農業(yè)文本分類分析
3.4.1 遞歸神經網絡
3.4.2 LSTM原理
3.4.3 基于LSTM的農業(yè)文本分類方法實現
3.4.4 基于LSTM的分類器分類性能分析
3.5 本章小結
第四章 基于機器學習的農業(yè)文本分類實驗結果分析
4.1 分類精度
4.2 訓練速度
4.3 泛化效果
4.4 本章小結
第五章 總結及展望
5.1 總結
5.2 展望
參考文獻
致謝
攻讀碩士期間發(fā)表論文
本文編號:3746488
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3746488.html