基于價(jià)格投訴舉報(bào)數(shù)據(jù)的文本分類方法研究及應(yīng)用
發(fā)布時(shí)間:2022-02-16 20:01
針對(duì)價(jià)格投訴舉報(bào)信息,辨別舉報(bào)人是否是職業(yè)舉報(bào)人不但效率較低,還需要投入非常多的時(shí)間、精力。隨著自然語(yǔ)言處理技術(shù)的應(yīng)用項(xiàng)目不斷增多,人工智能技術(shù)的應(yīng)用不斷體現(xiàn)出多樣性的特征,尤其是深度學(xué)習(xí)方面,在自然語(yǔ)言處理中的應(yīng)用不斷加深。在這樣的技術(shù)背景下,本課題基于實(shí)際工作中對(duì)價(jià)格投訴舉報(bào)信息分類處理的現(xiàn)實(shí)壓力,通過(guò)對(duì)真實(shí)的投訴文本數(shù)據(jù)進(jìn)行研究和分析,旨在找到適合符合當(dāng)前實(shí)際工作情況的文本分類算法。本文以卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)分類模型為基礎(chǔ),首先對(duì)文本分類方法的相關(guān)技術(shù)進(jìn)行介紹和分析,對(duì)分詞方法進(jìn)行研究,對(duì)原始數(shù)據(jù)進(jìn)行高頻詞的提取、詞性標(biāo)注等進(jìn)行研究,接下來(lái)通過(guò)對(duì)經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)算法的文本分類應(yīng)用進(jìn)行研究,找到和卷積神經(jīng)網(wǎng)絡(luò)算法最合適的特征提取模型和卷積神經(jīng)核心參數(shù),并且選擇兩種特征提取模型結(jié)合卷積神經(jīng)網(wǎng)絡(luò)算法進(jìn)行實(shí)驗(yàn),可自動(dòng)識(shí)別出每類數(shù)據(jù)信息的元特征,有助于數(shù)據(jù)的分類。但是采用單一的模型,所提取的數(shù)據(jù)特征定義不夠清晰。因此將卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)組成混合模型進(jìn)行研究,吸收兩種模型的優(yōu)點(diǎn),實(shí)現(xiàn)快速學(xué)習(xí)并準(zhǔn)確提取特征。為優(yōu)化特征向量權(quán)重,引入了注意力模型思想來(lái)對(duì)模型和算法進(jìn)行改進(jìn),排除無(wú)...
【文章來(lái)源】:北京化工大學(xué)北京市211工程院校教育部直屬院校
【文章頁(yè)數(shù)】:86 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
學(xué)位論文數(shù)據(jù)集
摘要
Abstract
第一章 緒論
1.1 選題背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 國(guó)外研究現(xiàn)狀
1.2.2 國(guó)內(nèi)研究現(xiàn)狀
1.3 主要研究?jī)?nèi)容
第二章 文本分類相關(guān)理論基礎(chǔ)
2.1 文本分類介紹
2.2 文本向量化介紹
2.3 中文分詞技術(shù)介紹
2.4 深度學(xué)習(xí)模型介紹
2.4.1 卷積神經(jīng)網(wǎng)絡(luò)
2.4.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4.3 長(zhǎng)短記憶神經(jīng)網(wǎng)絡(luò)
2.5 本章小結(jié)
第三章 基于價(jià)格投訴舉報(bào)文本的命名實(shí)體識(shí)別
3.1 價(jià)格投訴舉報(bào)文本數(shù)據(jù)集簡(jiǎn)介
3.2 數(shù)據(jù)預(yù)處理
3.2.1 高頻詞提取
3.2.2 詞性標(biāo)注
3.3 基于價(jià)格投訴舉報(bào)文本的命名實(shí)體識(shí)別
3.4 本章小結(jié)
第四章 基于價(jià)格投訴舉報(bào)數(shù)據(jù)文本分類方法研究
4.1 基于卷積神經(jīng)網(wǎng)絡(luò)的文本分類
4.1.1 文本分類流程
4.1.2 整體架構(gòu)
4.1.3 實(shí)驗(yàn)設(shè)計(jì)
4.1.4 實(shí)驗(yàn)結(jié)果分析
4.2 基于卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的文本分類
4.2.1 研究思路
4.2.2 整體框架
4.2.3 算法改進(jìn)
4.3 基于卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的雙通道文本分類混合模型
4.3.1 研究思路
4.3.2 整體框架
4.3.3 模型算法
4.4 實(shí)驗(yàn)及其結(jié)果分析
4.4.1 分類模型評(píng)價(jià)方法
4.4.2 對(duì)比實(shí)驗(yàn)設(shè)計(jì)
4.4.3 分類實(shí)驗(yàn)對(duì)比結(jié)果
4.5 本章小結(jié)
第五章 基于價(jià)格投訴舉報(bào)的文本分類方法應(yīng)用
5.1 價(jià)格投訴舉報(bào)文本分類系統(tǒng)介紹
5.2 價(jià)格投訴舉報(bào)文本分類系統(tǒng)需求分析
5.2.1 注冊(cè)與登錄功能需求分析
5.2.2 分類管理功能需求分析
5.2.3 文本查詢功能需求分析
5.3 價(jià)格投訴舉報(bào)文本分類系統(tǒng)數(shù)據(jù)流圖
5.4 價(jià)格投訴舉報(bào)文本分類系統(tǒng)設(shè)計(jì)
5.4.1 價(jià)格投訴舉報(bào)文本分類系統(tǒng)功能框架
5.4.2 價(jià)格投訴舉報(bào)文本分類系統(tǒng)軟件架構(gòu)設(shè)計(jì)
5.4.3 價(jià)格投訴舉報(bào)文本分類系統(tǒng)功能設(shè)計(jì)
5.4.4 價(jià)格投訴舉報(bào)文本分類系統(tǒng)數(shù)據(jù)庫(kù)設(shè)計(jì)
5.5 價(jià)格投訴舉報(bào)文本分類系統(tǒng)實(shí)現(xiàn)
5.5.1 價(jià)格投訴舉報(bào)文本分類系統(tǒng)實(shí)現(xiàn)技術(shù)介紹
5.5.2 價(jià)格投訴舉報(bào)文本分類系統(tǒng)實(shí)現(xiàn)
5.6 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
附件
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的文本分類系統(tǒng)關(guān)鍵技術(shù)研究與模型驗(yàn)證[J]. 汪少敏,楊迪,任華. 電信科學(xué). 2018(12)
[2]文本分類TF-IDF算法的改進(jìn)研究[J]. 葉雪梅,毛雪岷,夏錦春,王波. 計(jì)算機(jī)工程與應(yīng)用. 2019(02)
[3]基于深度學(xué)習(xí)的文本分類研究進(jìn)展[J]. 劉婷婷,朱文東,劉廣一. 電力信息與通信技術(shù). 2018(03)
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的電力設(shè)備缺陷文本分類模型研究[J]. 劉梓權(quán),王慧芳,曹靖,邱劍. 電網(wǎng)技術(shù). 2018(02)
[5]基于改進(jìn)TF-IDF特征提取的文本分類模型研究[J]. 周源,劉懷蘭,杜朋朋,廖嶺. 情報(bào)科學(xué). 2017(05)
[6]基于卷積神經(jīng)網(wǎng)絡(luò)的互聯(lián)網(wǎng)短文本分類方法[J]. 郭東亮,劉小明,鄭秋生. 計(jì)算機(jī)與現(xiàn)代化. 2017(04)
[7]基于Word2vec的微博短文本分類研究[J]. 張謙,高章敏,劉嘉勇. 信息網(wǎng)絡(luò)安全. 2017(01)
[8]詞向量與LDA相融合的短文本分類方法[J]. 張群,王紅軍,王倫文. 現(xiàn)代圖書(shū)情報(bào)技術(shù). 2016(12)
[9]基于聚類改進(jìn)的KNN文本分類算法[J]. 周慶平,譚長(zhǎng)庚,王宏君,湛淼湘. 計(jì)算機(jī)應(yīng)用研究. 2016(11)
[10]一種改進(jìn)的KNN文本分類算法[J]. 樊存佳,汪友生,邊航. 國(guó)外電子測(cè)量技術(shù). 2015(12)
博士論文
[1]基于深度學(xué)習(xí)的文本表示與分類方法研究[D]. 閆琰.北京科技大學(xué) 2016
[2]文本分類關(guān)鍵技術(shù)及應(yīng)用研究[D]. 鳳麗洲.吉林大學(xué) 2015
[3]文本分類中文本表示模型和特征選擇算法研究[D]. 楊杰明.吉林大學(xué) 2013
碩士論文
[1]基于Attention-Based LSTM模型的文本分類技術(shù)的研究[D]. 張沖.南京大學(xué) 2016
[2]基于深度學(xué)習(xí)混合模型的文本分類研究[D]. 周超.蘭州大學(xué) 2016
[3]基于特征選擇及LDA模型的中文文本分類研究與實(shí)現(xiàn)[D]. 董露露.安徽大學(xué) 2014
本文編號(hào):3628571
【文章來(lái)源】:北京化工大學(xué)北京市211工程院校教育部直屬院校
【文章頁(yè)數(shù)】:86 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
學(xué)位論文數(shù)據(jù)集
摘要
Abstract
第一章 緒論
1.1 選題背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 國(guó)外研究現(xiàn)狀
1.2.2 國(guó)內(nèi)研究現(xiàn)狀
1.3 主要研究?jī)?nèi)容
第二章 文本分類相關(guān)理論基礎(chǔ)
2.1 文本分類介紹
2.2 文本向量化介紹
2.3 中文分詞技術(shù)介紹
2.4 深度學(xué)習(xí)模型介紹
2.4.1 卷積神經(jīng)網(wǎng)絡(luò)
2.4.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4.3 長(zhǎng)短記憶神經(jīng)網(wǎng)絡(luò)
2.5 本章小結(jié)
第三章 基于價(jià)格投訴舉報(bào)文本的命名實(shí)體識(shí)別
3.1 價(jià)格投訴舉報(bào)文本數(shù)據(jù)集簡(jiǎn)介
3.2 數(shù)據(jù)預(yù)處理
3.2.1 高頻詞提取
3.2.2 詞性標(biāo)注
3.3 基于價(jià)格投訴舉報(bào)文本的命名實(shí)體識(shí)別
3.4 本章小結(jié)
第四章 基于價(jià)格投訴舉報(bào)數(shù)據(jù)文本分類方法研究
4.1 基于卷積神經(jīng)網(wǎng)絡(luò)的文本分類
4.1.1 文本分類流程
4.1.2 整體架構(gòu)
4.1.3 實(shí)驗(yàn)設(shè)計(jì)
4.1.4 實(shí)驗(yàn)結(jié)果分析
4.2 基于卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的文本分類
4.2.1 研究思路
4.2.2 整體框架
4.2.3 算法改進(jìn)
4.3 基于卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的雙通道文本分類混合模型
4.3.1 研究思路
4.3.2 整體框架
4.3.3 模型算法
4.4 實(shí)驗(yàn)及其結(jié)果分析
4.4.1 分類模型評(píng)價(jià)方法
4.4.2 對(duì)比實(shí)驗(yàn)設(shè)計(jì)
4.4.3 分類實(shí)驗(yàn)對(duì)比結(jié)果
4.5 本章小結(jié)
第五章 基于價(jià)格投訴舉報(bào)的文本分類方法應(yīng)用
5.1 價(jià)格投訴舉報(bào)文本分類系統(tǒng)介紹
5.2 價(jià)格投訴舉報(bào)文本分類系統(tǒng)需求分析
5.2.1 注冊(cè)與登錄功能需求分析
5.2.2 分類管理功能需求分析
5.2.3 文本查詢功能需求分析
5.3 價(jià)格投訴舉報(bào)文本分類系統(tǒng)數(shù)據(jù)流圖
5.4 價(jià)格投訴舉報(bào)文本分類系統(tǒng)設(shè)計(jì)
5.4.1 價(jià)格投訴舉報(bào)文本分類系統(tǒng)功能框架
5.4.2 價(jià)格投訴舉報(bào)文本分類系統(tǒng)軟件架構(gòu)設(shè)計(jì)
5.4.3 價(jià)格投訴舉報(bào)文本分類系統(tǒng)功能設(shè)計(jì)
5.4.4 價(jià)格投訴舉報(bào)文本分類系統(tǒng)數(shù)據(jù)庫(kù)設(shè)計(jì)
5.5 價(jià)格投訴舉報(bào)文本分類系統(tǒng)實(shí)現(xiàn)
5.5.1 價(jià)格投訴舉報(bào)文本分類系統(tǒng)實(shí)現(xiàn)技術(shù)介紹
5.5.2 價(jià)格投訴舉報(bào)文本分類系統(tǒng)實(shí)現(xiàn)
5.6 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
附件
【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的文本分類系統(tǒng)關(guān)鍵技術(shù)研究與模型驗(yàn)證[J]. 汪少敏,楊迪,任華. 電信科學(xué). 2018(12)
[2]文本分類TF-IDF算法的改進(jìn)研究[J]. 葉雪梅,毛雪岷,夏錦春,王波. 計(jì)算機(jī)工程與應(yīng)用. 2019(02)
[3]基于深度學(xué)習(xí)的文本分類研究進(jìn)展[J]. 劉婷婷,朱文東,劉廣一. 電力信息與通信技術(shù). 2018(03)
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的電力設(shè)備缺陷文本分類模型研究[J]. 劉梓權(quán),王慧芳,曹靖,邱劍. 電網(wǎng)技術(shù). 2018(02)
[5]基于改進(jìn)TF-IDF特征提取的文本分類模型研究[J]. 周源,劉懷蘭,杜朋朋,廖嶺. 情報(bào)科學(xué). 2017(05)
[6]基于卷積神經(jīng)網(wǎng)絡(luò)的互聯(lián)網(wǎng)短文本分類方法[J]. 郭東亮,劉小明,鄭秋生. 計(jì)算機(jī)與現(xiàn)代化. 2017(04)
[7]基于Word2vec的微博短文本分類研究[J]. 張謙,高章敏,劉嘉勇. 信息網(wǎng)絡(luò)安全. 2017(01)
[8]詞向量與LDA相融合的短文本分類方法[J]. 張群,王紅軍,王倫文. 現(xiàn)代圖書(shū)情報(bào)技術(shù). 2016(12)
[9]基于聚類改進(jìn)的KNN文本分類算法[J]. 周慶平,譚長(zhǎng)庚,王宏君,湛淼湘. 計(jì)算機(jī)應(yīng)用研究. 2016(11)
[10]一種改進(jìn)的KNN文本分類算法[J]. 樊存佳,汪友生,邊航. 國(guó)外電子測(cè)量技術(shù). 2015(12)
博士論文
[1]基于深度學(xué)習(xí)的文本表示與分類方法研究[D]. 閆琰.北京科技大學(xué) 2016
[2]文本分類關(guān)鍵技術(shù)及應(yīng)用研究[D]. 鳳麗洲.吉林大學(xué) 2015
[3]文本分類中文本表示模型和特征選擇算法研究[D]. 楊杰明.吉林大學(xué) 2013
碩士論文
[1]基于Attention-Based LSTM模型的文本分類技術(shù)的研究[D]. 張沖.南京大學(xué) 2016
[2]基于深度學(xué)習(xí)混合模型的文本分類研究[D]. 周超.蘭州大學(xué) 2016
[3]基于特征選擇及LDA模型的中文文本分類研究與實(shí)現(xiàn)[D]. 董露露.安徽大學(xué) 2014
本文編號(hào):3628571
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3628571.html
最近更新
教材專著