基于人工智能技術(shù)Naive Bayes文本自動(dòng)分類系統(tǒng)研究
發(fā)布時(shí)間:2021-01-04 00:03
隨著信息時(shí)代的來(lái)臨,特別是因特網(wǎng)對(duì)人們生活的全面介入,大量以文本格式存儲(chǔ)的信息出現(xiàn)在Internet、數(shù)字圖書(shū)館及公司的Intranet上,如何從這些海量信息中快速、準(zhǔn)確而全面地獲取所需要的信息成為信息處理領(lǐng)域的研究熱點(diǎn)。基于人工智能技術(shù)的文本自動(dòng)分類成為研究解決這個(gè)問(wèn)題的重要支撐技術(shù)之一。本文的目標(biāo)就是在文本分類的背景下,從理論、算法改進(jìn)和實(shí)現(xiàn)三個(gè)層次來(lái)討論文本自動(dòng)分類技術(shù)。 本文首先全面分析了當(dāng)前文本自動(dòng)分類領(lǐng)域關(guān)鍵技術(shù)和算法,同時(shí)闡述了典型文本自動(dòng)分類系統(tǒng)的核心技術(shù)和系統(tǒng)結(jié)構(gòu),并對(duì)文本分類的應(yīng)用范疇作了總結(jié)。 從統(tǒng)計(jì)學(xué)角度來(lái)看,傳統(tǒng)的統(tǒng)計(jì)學(xué)文本分類算法盡管強(qiáng)大,但是它們總是基于很強(qiáng)的假設(shè)條件才成立,而實(shí)際應(yīng)用中這些假設(shè)條件大多數(shù)情況下是不成立的,因此,它們所得到的結(jié)果盡管精確但卻難以與實(shí)際應(yīng)用較好地聯(lián)系起來(lái),亦即高精度的結(jié)果卻導(dǎo)致丟失了很多文本固有的結(jié)構(gòu)信息。本文深入研究了基于統(tǒng)計(jì)學(xué)的最為簡(jiǎn)單卻強(qiáng)大的樸素貝葉斯(Na(?)ve Bayes)分類算法,從統(tǒng)計(jì)學(xué)角度研究了其應(yīng)用前提-Na(?)ve Bayes假設(shè),即所有文本特征向量元素服從獨(dú)立同分布。實(shí)際上,文本上下文之...
【文章來(lái)源】:廣東工業(yè)大學(xué)廣東省
【文章頁(yè)數(shù)】:81 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
目錄
Contents
第一章 緒論
1.1 國(guó)內(nèi)外相關(guān)研究概述
1.1.1 文本自動(dòng)分類在國(guó)內(nèi)外的發(fā)展
1.1.2 中文文本分類的發(fā)展與現(xiàn)狀
1.2 文本分類概述
1.2.1 文本分類的定義
1.2.2 文本分類方法
1.2.3 文本分類的應(yīng)用
1.3 文本分類的研究背景和意義
1.4 論文的組織結(jié)構(gòu)
1.5 本章小結(jié)
第二章 文本分類關(guān)鍵技術(shù)
2.1 文本分類過(guò)程
2.1.1 文本信息的預(yù)處理
2.1.2 向量空間模型
2.1.3 空間降維
2.1.4 特征匹配和分類
2.2 文本分類算法
2.2.1 Rocchhio方法
2.2.2 簡(jiǎn)單向量距離分類法
2.2.3 貝葉斯方法(Na(?)ve Bayes)
2.2.4 K最近鄰居方法(K Nearest Neighbor, KNN)
2.2.5 決策樹(shù)方法
2.2.6 支持向量機(jī)(Support Vector Machine, SVM)
2.2.7 神經(jīng)網(wǎng)絡(luò)方法
2.3 本章小結(jié)
第三章 神經(jīng)模糊系統(tǒng)
3.1 模糊邏輯
3.1.1 模糊集合(Fuzzy Sets)
3.1.2 模糊推理(Fuzzy Inference)
3.2 人工神經(jīng)網(wǎng)絡(luò)
3.2.1 人工神經(jīng)網(wǎng)絡(luò)的模型
3.2.2 多層感知器
3.3 神經(jīng)模糊系統(tǒng)(Neuro-Fuzzy System)
3.3.1 神經(jīng)模糊系統(tǒng)背景
3.3.2 神經(jīng)模糊系統(tǒng)定義
3.3.3 神經(jīng)模糊系統(tǒng)結(jié)構(gòu)
3.3.4 神經(jīng)模糊分類描述
3.3.5 神經(jīng)模糊系統(tǒng)分類算法
3.4 本章小結(jié)
第四章 文本分類系統(tǒng)的設(shè)計(jì)
4.1 系統(tǒng)任務(wù)
4.2 系統(tǒng)結(jié)構(gòu)
4.3 文本預(yù)處理
4.4 文本模糊表示
4.5 信息增益(Information Gain, IG)降維
4.6 Na(?)ve Bayes算法
4.6.1 貝葉斯理論
4.6.2 貝葉斯分類問(wèn)題表述
4.6.3 貝葉斯分類器
4.6.4 貝葉斯模型特點(diǎn)
4.7 神經(jīng)模糊系統(tǒng)優(yōu)化Na(?)ve Bayes分類算法
4.7.1 貝葉斯分類器的神經(jīng)模糊優(yōu)化算法
4.7.2 優(yōu)化算法實(shí)現(xiàn)問(wèn)題
4.8 本章小結(jié)
第五章 文本分類系統(tǒng)的實(shí)現(xiàn)
5.1 軟件結(jié)構(gòu)
5.2 分類性能評(píng)估指標(biāo)
5.3 實(shí)驗(yàn)數(shù)據(jù)及其分析
5.3.1 實(shí)驗(yàn)語(yǔ)料分析
5.3.2 實(shí)驗(yàn)結(jié)果及其分析
5.4 本章小結(jié)
課題總結(jié)與展望
一、論文小結(jié)
二、下一步的工作
參考文獻(xiàn)
碩士期間已發(fā)表和錄用的文章
獨(dú)創(chuàng)性聲明
致謝
本文編號(hào):2955747
【文章來(lái)源】:廣東工業(yè)大學(xué)廣東省
【文章頁(yè)數(shù)】:81 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
目錄
Contents
第一章 緒論
1.1 國(guó)內(nèi)外相關(guān)研究概述
1.1.1 文本自動(dòng)分類在國(guó)內(nèi)外的發(fā)展
1.1.2 中文文本分類的發(fā)展與現(xiàn)狀
1.2 文本分類概述
1.2.1 文本分類的定義
1.2.2 文本分類方法
1.2.3 文本分類的應(yīng)用
1.3 文本分類的研究背景和意義
1.4 論文的組織結(jié)構(gòu)
1.5 本章小結(jié)
第二章 文本分類關(guān)鍵技術(shù)
2.1 文本分類過(guò)程
2.1.1 文本信息的預(yù)處理
2.1.2 向量空間模型
2.1.3 空間降維
2.1.4 特征匹配和分類
2.2 文本分類算法
2.2.1 Rocchhio方法
2.2.2 簡(jiǎn)單向量距離分類法
2.2.3 貝葉斯方法(Na(?)ve Bayes)
2.2.4 K最近鄰居方法(K Nearest Neighbor, KNN)
2.2.5 決策樹(shù)方法
2.2.6 支持向量機(jī)(Support Vector Machine, SVM)
2.2.7 神經(jīng)網(wǎng)絡(luò)方法
2.3 本章小結(jié)
第三章 神經(jīng)模糊系統(tǒng)
3.1 模糊邏輯
3.1.1 模糊集合(Fuzzy Sets)
3.1.2 模糊推理(Fuzzy Inference)
3.2 人工神經(jīng)網(wǎng)絡(luò)
3.2.1 人工神經(jīng)網(wǎng)絡(luò)的模型
3.2.2 多層感知器
3.3 神經(jīng)模糊系統(tǒng)(Neuro-Fuzzy System)
3.3.1 神經(jīng)模糊系統(tǒng)背景
3.3.2 神經(jīng)模糊系統(tǒng)定義
3.3.3 神經(jīng)模糊系統(tǒng)結(jié)構(gòu)
3.3.4 神經(jīng)模糊分類描述
3.3.5 神經(jīng)模糊系統(tǒng)分類算法
3.4 本章小結(jié)
第四章 文本分類系統(tǒng)的設(shè)計(jì)
4.1 系統(tǒng)任務(wù)
4.2 系統(tǒng)結(jié)構(gòu)
4.3 文本預(yù)處理
4.4 文本模糊表示
4.5 信息增益(Information Gain, IG)降維
4.6 Na(?)ve Bayes算法
4.6.1 貝葉斯理論
4.6.2 貝葉斯分類問(wèn)題表述
4.6.3 貝葉斯分類器
4.6.4 貝葉斯模型特點(diǎn)
4.7 神經(jīng)模糊系統(tǒng)優(yōu)化Na(?)ve Bayes分類算法
4.7.1 貝葉斯分類器的神經(jīng)模糊優(yōu)化算法
4.7.2 優(yōu)化算法實(shí)現(xiàn)問(wèn)題
4.8 本章小結(jié)
第五章 文本分類系統(tǒng)的實(shí)現(xiàn)
5.1 軟件結(jié)構(gòu)
5.2 分類性能評(píng)估指標(biāo)
5.3 實(shí)驗(yàn)數(shù)據(jù)及其分析
5.3.1 實(shí)驗(yàn)語(yǔ)料分析
5.3.2 實(shí)驗(yàn)結(jié)果及其分析
5.4 本章小結(jié)
課題總結(jié)與展望
一、論文小結(jié)
二、下一步的工作
參考文獻(xiàn)
碩士期間已發(fā)表和錄用的文章
獨(dú)創(chuàng)性聲明
致謝
本文編號(hào):2955747
本文鏈接:http://sikaile.net/kejilunwen/rengongzhinen/2955747.html
最近更新
教材專著