基于機(jī)器學(xué)習(xí)的農(nóng)業(yè)文本分類方法研究
發(fā)布時(shí)間:2023-02-19 15:38
隨著網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)庫技術(shù)、計(jì)算機(jī)技術(shù)的迅速發(fā)展和Internet的日漸普及,特別是大數(shù)據(jù)時(shí)代的到來,在我們的實(shí)際生活中,每一個(gè)領(lǐng)域都在以史無前例的速度生產(chǎn)著海量的信息和數(shù)據(jù),尤其的海量的雜亂無規(guī)則的文本信息,農(nóng)業(yè)領(lǐng)域也不例外,我國(guó)在農(nóng)業(yè)信息化發(fā)展進(jìn)程中建設(shè)了大量的涉農(nóng)網(wǎng)站、數(shù)據(jù)庫、信息系統(tǒng)、專家系統(tǒng)等,積累了豐富的農(nóng)業(yè)新聞、技術(shù)、市場(chǎng)等信息。隨著移動(dòng)互聯(lián)網(wǎng)、智能手機(jī)等新技術(shù)在偏遠(yuǎn)農(nóng)村的迅猛普及,制約農(nóng)業(yè)信息化發(fā)展的“最后一公里”問題已經(jīng)得到有效地解決,農(nóng)業(yè)信息化服務(wù)的模式也將必然從傳統(tǒng)的網(wǎng)站式服務(wù)逐步轉(zhuǎn)為以信息推送為主。而農(nóng)業(yè)文本的分類及相關(guān)預(yù)處理是實(shí)現(xiàn)農(nóng)業(yè)信息有效推送的關(guān)鍵,因此,如何實(shí)現(xiàn)農(nóng)業(yè)文本的自動(dòng)分類,迅速挖掘有效信息,為人們所深度利用成為一個(gè)迫在眉睫的問題。為了有效地組織和管理雜亂無序的海量農(nóng)業(yè)信息,針對(duì)目前農(nóng)業(yè)文本分類系統(tǒng)不完善、農(nóng)業(yè)語料庫稀缺的問題,本文的主要研究?jī)?nèi)容及研究成果如下:(1)詳細(xì)的闡述了農(nóng)業(yè)文本語料庫的構(gòu)建以及預(yù)處理的過程,設(shè)計(jì)了基于機(jī)器學(xué)習(xí)的農(nóng)業(yè)文本分類流程,并按照流程對(duì)爬蟲程序獲取的農(nóng)業(yè)網(wǎng)頁進(jìn)行清洗,獲取農(nóng)業(yè)文本,采用Java語言實(shí)現(xiàn)了中文文本分詞和預(yù)處...
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 課題的研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文的研究?jī)?nèi)容
1.4 本文的組織結(jié)構(gòu)
第二章 農(nóng)業(yè)文本語料庫的構(gòu)建及預(yù)處理
2.1 農(nóng)業(yè)文本語料庫的構(gòu)建
2.2 農(nóng)業(yè)文本語料庫的預(yù)處理
2.2.1 基于機(jī)器學(xué)習(xí)的農(nóng)業(yè)文本分類流程
2.2.2 基于CHI值的特征詞提取
2.2.3 文本分詞
2.2.4 特征詞條的選取
2.2.5 分類性能的評(píng)估標(biāo)準(zhǔn)
2.3 農(nóng)業(yè)文本分類實(shí)驗(yàn)方法
2.4 本章小結(jié)
第三章 基于機(jī)器學(xué)習(xí)的農(nóng)業(yè)文本分類方法分析
3.1 常用文本分類的機(jī)器學(xué)習(xí)方法
3.2 基于樸素貝葉斯的農(nóng)業(yè)文本分類分析
3.2.1 貝葉斯原理
3.2.2 極大后驗(yàn)假設(shè)與極大似然假設(shè)
3.2.3 事件的獨(dú)立性
3.2.4 樸素貝葉斯原理
3.2.5 基于樸素貝葉斯的農(nóng)業(yè)文本分類方法實(shí)現(xiàn)
3.2.6 基于樸素貝葉斯的分類器分類性能分析
3.3 基于支持向量機(jī)的農(nóng)業(yè)文本分類分析
3.3.1 最優(yōu)超平面的構(gòu)建
3.3.2 線性可分支持向量
3.3.3 線性不可分支持向量
3.3.4 核函數(shù)的選取
3.3.5 基于支持向量機(jī)的分類器分類性能分析
3.4 基于LSTM的農(nóng)業(yè)文本分類分析
3.4.1 遞歸神經(jīng)網(wǎng)絡(luò)
3.4.2 LSTM原理
3.4.3 基于LSTM的農(nóng)業(yè)文本分類方法實(shí)現(xiàn)
3.4.4 基于LSTM的分類器分類性能分析
3.5 本章小結(jié)
第四章 基于機(jī)器學(xué)習(xí)的農(nóng)業(yè)文本分類實(shí)驗(yàn)結(jié)果分析
4.1 分類精度
4.2 訓(xùn)練速度
4.3 泛化效果
4.4 本章小結(jié)
第五章 總結(jié)及展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
攻讀碩士期間發(fā)表論文
本文編號(hào):3746488
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 課題的研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文的研究?jī)?nèi)容
1.4 本文的組織結(jié)構(gòu)
第二章 農(nóng)業(yè)文本語料庫的構(gòu)建及預(yù)處理
2.1 農(nóng)業(yè)文本語料庫的構(gòu)建
2.2 農(nóng)業(yè)文本語料庫的預(yù)處理
2.2.1 基于機(jī)器學(xué)習(xí)的農(nóng)業(yè)文本分類流程
2.2.2 基于CHI值的特征詞提取
2.2.3 文本分詞
2.2.4 特征詞條的選取
2.2.5 分類性能的評(píng)估標(biāo)準(zhǔn)
2.3 農(nóng)業(yè)文本分類實(shí)驗(yàn)方法
2.4 本章小結(jié)
第三章 基于機(jī)器學(xué)習(xí)的農(nóng)業(yè)文本分類方法分析
3.1 常用文本分類的機(jī)器學(xué)習(xí)方法
3.2 基于樸素貝葉斯的農(nóng)業(yè)文本分類分析
3.2.1 貝葉斯原理
3.2.2 極大后驗(yàn)假設(shè)與極大似然假設(shè)
3.2.3 事件的獨(dú)立性
3.2.4 樸素貝葉斯原理
3.2.5 基于樸素貝葉斯的農(nóng)業(yè)文本分類方法實(shí)現(xiàn)
3.2.6 基于樸素貝葉斯的分類器分類性能分析
3.3 基于支持向量機(jī)的農(nóng)業(yè)文本分類分析
3.3.1 最優(yōu)超平面的構(gòu)建
3.3.2 線性可分支持向量
3.3.3 線性不可分支持向量
3.3.4 核函數(shù)的選取
3.3.5 基于支持向量機(jī)的分類器分類性能分析
3.4 基于LSTM的農(nóng)業(yè)文本分類分析
3.4.1 遞歸神經(jīng)網(wǎng)絡(luò)
3.4.2 LSTM原理
3.4.3 基于LSTM的農(nóng)業(yè)文本分類方法實(shí)現(xiàn)
3.4.4 基于LSTM的分類器分類性能分析
3.5 本章小結(jié)
第四章 基于機(jī)器學(xué)習(xí)的農(nóng)業(yè)文本分類實(shí)驗(yàn)結(jié)果分析
4.1 分類精度
4.2 訓(xùn)練速度
4.3 泛化效果
4.4 本章小結(jié)
第五章 總結(jié)及展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
攻讀碩士期間發(fā)表論文
本文編號(hào):3746488
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3746488.html
最近更新
教材專著