天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于改進SVM算法的投訴文本分類研究

發(fā)布時間:2021-11-19 13:18
  客戶關于企業(yè)產品和服務投訴日益增多,及時向投訴用戶進行反饋是企業(yè)保持口碑的關鍵。投訴文本的自動歸類,有利于企業(yè)提升投訴問題處理效率,提高用戶滿意度,避免客戶流失。目前,企業(yè)中投訴分類過程仍以人工鑒別為主,這種方式不僅效率低、成本高,而且受人的經驗和判斷能力的影響較大,如何準確、及時地對客戶投訴問題進行分類已成為亟需解決的問題。自然語言處理技術的出現(xiàn)使得文本的自動分類成為可能,文本建模方法和分類方法高速發(fā)展并逐步應用于實際生活,所以,對投訴文本進行分類研究有著重要的理論和實踐價值。本文首先介紹了文本預處理、文本表示方法、分類算法和集成學習的相關內容。然后對投訴文本的產生、影響以及特征進行了分析。針對投訴文本的特點,BTM能夠基于內部語料對投訴短文本進行擴展,而Doc2vec可以獲得主題模型無法獲得的語料信息,選擇BTM和Doc2vec相結合的方法對投訴文本進行表示,使得表示投訴文本的特征向量兼具詞共現(xiàn)信息、語法和語義信息,也降低了文本特征的維度,同時模型可多次更新,迭代性更強,隨著新語料集的增加,文本的特征表示越來越準確。其次在分類器方面,提出了一種結合線性核和多項式核的核函數(shù)以改進SV... 

【文章來源】:合肥工業(yè)大學安徽省 211工程院校 教育部直屬院校

【文章頁數(shù)】:66 頁

【學位級別】:碩士

【文章目錄】:
致謝
摘要
abstract
第一章 緒論
    1.1 研究背景與研究意義
        1.1.1 研究背景
        1.1.2 研究意義
    1.2 研究現(xiàn)狀
        1.2.1 文本表示的研究現(xiàn)狀
        1.2.2 文本分類的研究現(xiàn)狀
        1.2.3 集成學習及其在文本分類方面的研究現(xiàn)狀
    1.3 研究內容與結構安排
        1.3.1 研究內容
        1.3.2 結構安排
第二章 相關理論和技術基礎
    2.1 文本預處理
        2.1.1 中文文本分詞
        2.1.2 術語詞典構建及停用詞過濾
    2.2 文本表示
        2.2.1 主題模型
        2.2.2 詞向量方法
    2.3 文本分類
    2.4 集成學習
第三章 投訴文本分析及其文本表示
    3.1 投訴文本的產生及價值
        3.1.1 投訴文本的產生
        3.1.2 投訴文本的價值
    3.2 投訴文本的分析
        3.2.1 投訴文本特征分析
        3.2.2 投訴文本建模的關鍵問題
    3.3 投訴文本建模
        3.3.1 基于BTM的文本建模
        3.3.2 基于Doc2vec的文本建模
        3.3.3 基于BTM和 Doc2vec的文本建模
第四章 基于改進 SVM 的投訴文本集成分類
    4.1 支持向量機與多分類
        4.1.1 支持向量機
        4.1.2 多分類方法
    4.2 采用混合核的SVM改進
        4.2.1 混合核函數(shù)
        4.2.2 軟間隔和懲罰值
    4.3 基于改進SVM的投訴文本集成分類
        4.3.1 原始輸入的構建
        4.3.2 集成分類框架
        4.3.3 投訴文本的分類流程
第五章 實驗研究
    5.1 實驗環(huán)境
    5.2 實驗數(shù)據(jù)準備及處理
        5.2.1 數(shù)據(jù)準備
        5.2.2 數(shù)據(jù)處理
    5.3 實驗設計及評價體系
        5.3.1 實驗設計
        5.3.2 評價指標
    5.4 實證及結果分析
        5.4.1 核函數(shù)比較實驗
        5.4.2 分類對比實驗
        5.4.3 參數(shù)影響實驗
        5.4.4 實驗結論
第六章 總結與展望
    6.1 總結
    6.2 工作展望
參考文獻
攻讀碩士學位期間的學術活動及成果情況


【參考文獻】:
期刊論文
[1]基于隨機森林的文本分類并行化[J]. 彭徵,王靈矯,郭華.  計算機科學. 2018(12)
[2]集成學習方法:研究綜述[J]. 徐繼偉,楊云.  云南大學學報(自然科學版). 2018(06)
[3]基于多示例學習框架的專利文本分類方法研究[J]. 包翔,劉桂鋒,楊國立.  情報理論與實踐. 2018(11)
[4]一種結合深度學習和集成學習的情感分析模型[J]. 金志剛,韓玥,朱琦.  哈爾濱工業(yè)大學學報. 2018(11)
[5]集成學習之隨機森林算法綜述[J]. 王奕森,夏樹濤.  信息通信技術. 2018(01)
[6]CNN-ELM混合短文本分類模型[J]. 韓眾和,夏戰(zhàn)國,楊婷.  計算機應用研究. 2019(03)
[7]基于文本挖掘和自動分類的法院裁判決策支持系統(tǒng)設計[J]. 朱青,衛(wèi)柯臻,丁蘭琳,黎建強.  中國管理科學. 2018(01)
[8]基于互信息的加權樸素貝葉斯文本分類算法[J]. 武建軍,李昌兵.  計算機系統(tǒng)應用. 2017(07)
[9]基于word2vec和LSTM的飲食健康文本分類研究[J]. 趙明,杜會芳,董翠翠,陳長松.  農業(yè)機械學報. 2017(10)
[10]中文文本聚類常用停用詞表對比研究[J]. 官琴,鄧三鴻,王昊.  數(shù)據(jù)分析與知識發(fā)現(xiàn). 2017(03)

碩士論文
[1]基于機器學習的文本分類研究與實現(xiàn)[D]. 王振.南京郵電大學 2018
[2]基于并行SVM算法的中文文本分類方法研究[D]. 尹旭東.吉林大學 2018
[3]基于主題模型的汽車專利文本主題挖掘與應用研究[D]. 王龍飛.合肥工業(yè)大學 2018
[4]基于主題模型的汽車評論話題演化研究[D]. 張衛(wèi)春.合肥工業(yè)大學 2017



本文編號:3505123

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3505123.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶98a14***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
亚洲欧美日韩在线看片| 精产国品一二三区麻豆| 蜜臀人妻一区二区三区| 精品久久少妇激情视频| 国产精品一级香蕉一区| 中文字幕无线码一区欧美| 日韩精品视频免费观看| 精品人妻久久一品二品三品| 国产精品内射视频免费| 久久精品色妇熟妇丰满人妻91| 国产高清在线不卡一区| 免费性欧美重口味黄色| 丰满人妻少妇精品一区二区三区 | 日韩国产亚洲欧美另类| 欧美一区二区不卡专区| 欧美日韩精品一区免费| 一区二区三区亚洲天堂| 亚洲国产香蕉视频在线观看| 国产三级视频不卡在线观看| 午夜精品国产一区在线观看| 免费特黄一级一区二区三区| 久久99夜色精品噜噜亚洲av| 亚洲第一区二区三区女厕偷拍| 老鸭窝精彩从这里蔓延| 少妇人妻一级片一区二区三区 | 丝袜av一区二区三区四区五区| 日韩少妇人妻中文字幕| 午夜福利激情性生活免费视频| 亚洲一区二区欧美激情| 成人午夜激情免费在线| 国产成人一区二区三区久久| 高清不卡一卡二卡区在线| 日本三区不卡高清更新二区| 视频在线观看色一区二区| 国产成人国产精品国产三级| 99国产成人免费一区二区| 在线免费国产一区二区三区| 国产亚洲系列91精品| 亚洲欧洲日韩综合二区| 久久这里只精品免费福利| 亚洲精品伦理熟女国产一区二区|