天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于機器學習的客服語音智能質檢系統(tǒng)的設計與實現(xiàn)

發(fā)布時間:2022-12-04 23:05
  客服語音質檢是熱線服務運營中一個非常重要的質量控制環(huán)節(jié)。傳統(tǒng)的客服語音質檢系統(tǒng)通過人工對照考核標準表聽取錄音,主要以抽檢方式進行,質檢效率低且覆蓋面小,本文設計與實現(xiàn)了客服語音智能質檢系統(tǒng),利用機器學習中的卷積神經(jīng)網(wǎng)絡CNN(Convolutional Neural Network)模型,計算文本相似度,求出偏差率,進行質檢評分,自動化程度高,覆蓋面廣,大大提高了質檢的精確度。本文分析現(xiàn)有的客服語音質檢的現(xiàn)狀,對河北斯博思創(chuàng)新科技有限公司客服部語音文本數(shù)據(jù)進行深入研究,通過需求分析,設計總體框架,實現(xiàn)了基于機器學習的客服語音智能質檢系統(tǒng),主要的研究內(nèi)容如下:(1)數(shù)據(jù)的獲取。數(shù)據(jù)來源于河北斯博思創(chuàng)新科技有限公司歷年客服語音數(shù)據(jù)。(2)數(shù)據(jù)的預處理。首先對獲取的原始文本進行數(shù)據(jù)清洗,利用Hanlp分詞工具進行中文分詞、去停用詞。(3)模型的選擇。提出兩種文本相似度模型,一種是基于文檔向量的文本相似度模型,另一種是基于CNN的文本相似度模型,利用公司歷年客服數(shù)據(jù)作為數(shù)據(jù)集,計算兩種模型文本相似度,結合質檢標準分別求取偏差率,基于CNN文本相似度模型的偏差率介于0.05-0.06,基于文檔向... 

【文章頁數(shù)】:78 頁

【學位級別】:碩士

【文章目錄】:
中文摘要
英文摘要
1 緒論
    1.1 研究背景、目的及意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 國內(nèi)研究現(xiàn)狀
        1.2.2 國外研究現(xiàn)狀
    1.3 主要的研究內(nèi)容與方法
    1.4 論文組織架構
2 相關技術
    2.1 自然語言處理技術
        2.1.1 自然語言處理理論基礎
        2.1.2 中文分詞理論基礎
    2.2 關鍵詞提取技術
    2.3 詞嵌入語義向量與語義距離
    2.4 文本相似度技術
        2.4.1 文本相似度理論基礎
        2.4.2 詞袋向量
3 語義分析算法的研究與質檢評分模型的構建
    3.1 數(shù)據(jù)預處理
        3.1.1 中文分詞
        3.1.2 去停用詞
    3.2 關鍵詞提取
    3.3 關鍵句提取
    3.4 基于Word2Vec算法的詞向量建立
        3.4.1 Word2Vec算法的模型選取
        3.4.2 Word2Vec算法的詞向量表示
        3.4.3 算法實現(xiàn)
    3.5 文本相似度的計算
        3.5.1 基于文檔向量的文本相似度計算
        3.5.2 算法實現(xiàn)
        3.5.3 基于CNN的文本相似度計算
        3.5.4 算法實現(xiàn)
        3.5.5 偏差率的計算
4 基于機器學習的客服語音智能質檢系統(tǒng)的需求分析與設計
    4.1 需求分析
    4.2 系統(tǒng)總體設計
        4.2.1 系統(tǒng)設計準則
        4.2.2 功能模塊設計
    4.3 數(shù)據(jù)庫設計
        4.3.1 用戶表結構設計
        4.3.2 質檢規(guī)則表結構設計
        4.3.3 質檢報告表結構設計
    4.4 本章小結
5 基于機器學習的客服語音智能質檢系統(tǒng)的實現(xiàn)
    5.1 用戶登錄模塊的實現(xiàn)
    5.2 主界面的實現(xiàn)
    5.3 自動質檢評分的實現(xiàn)
    5.4 管理員功能模塊的實現(xiàn)
    5.5 語音信箱管理界面的實現(xiàn)
    5.6 本章小結
6 系統(tǒng)測試
    6.1 測試目的
    6.2 系統(tǒng)功能測試
        6.2.1 用戶登錄模塊測試
        6.2.2 文本相似度計算測試
        6.2.3 自動化質檢模塊的測試
    6.3 本章小結
7 總結與展望
    7.1 總結
    7.2 展望
參考文獻
致謝


【參考文獻】:
期刊論文
[1]2019年美國《麻省理工科技評論》發(fā)布“全球十大突破性技術”(上篇)[J]. 陳醒.  國際融資. 2020(01)
[2]結合語義相似度改進LDA的文本主題分析[J]. 趙林靜.  計算機工程與設計. 2019(12)
[3]基于Log-Euclidean詞袋模型與基于Stein核稀疏編碼的人體行為識別算法的優(yōu)化與改進[J]. 楊豐嘉.  科技創(chuàng)新與應用. 2019(35)
[4]基于詞向量語義擴展的網(wǎng)絡文本特征選擇方法研究[J]. 呂建新,鄭偉,馬林,李明,谷翠梅.  情報科學. 2019(12)
[5]基于融合共現(xiàn)距離的句法網(wǎng)絡下文本語義相似度計算[J]. 嚴嬌,馬靜,房康.  數(shù)據(jù)分析與知識發(fā)現(xiàn). 2019(12)
[6]基于深度學習和遷移學習的領域自適應中文分詞[J]. 成于思,施云濤.  中文信息學報. 2019(09)
[7]基于時空切分和詞向量相似性的軌跡伴隨模式挖掘[J]. 李欣.  中山大學學報(自然科學版). 2019(05)
[8]基于深度學習的文本相似度計算[J]. 邵恒,馮興樂,包芬.  鄭州大學學報(理學版). 2020(01)
[9]自然語言處理領域中的自動問答研究進展[J]. 郭天翼,彭敏,伊穆蘭,毛文月,胡星燦,魏格格.  武漢大學學報(理學版). 2019(05)
[10]MGSC:一種多粒度語義交叉的短文本語義匹配模型[J]. 吳少洪,彭敦陸,苑威威,陳章,劉叢.  小型微型計算機系統(tǒng). 2019(06)

碩士論文
[1]基于深度學習的中文分詞算法研究[D]. 趙恒淼.山東科技大學 2018



本文編號:3709163

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3709163.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶7b9ee***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com