基于機(jī)器學(xué)習(xí)的客服語音智能質(zhì)檢系統(tǒng)的設(shè)計與實(shí)現(xiàn)
發(fā)布時間:2022-12-04 23:05
客服語音質(zhì)檢是熱線服務(wù)運(yùn)營中一個非常重要的質(zhì)量控制環(huán)節(jié)。傳統(tǒng)的客服語音質(zhì)檢系統(tǒng)通過人工對照考核標(biāo)準(zhǔn)表聽取錄音,主要以抽檢方式進(jìn)行,質(zhì)檢效率低且覆蓋面小,本文設(shè)計與實(shí)現(xiàn)了客服語音智能質(zhì)檢系統(tǒng),利用機(jī)器學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)CNN(Convolutional Neural Network)模型,計算文本相似度,求出偏差率,進(jìn)行質(zhì)檢評分,自動化程度高,覆蓋面廣,大大提高了質(zhì)檢的精確度。本文分析現(xiàn)有的客服語音質(zhì)檢的現(xiàn)狀,對河北斯博思創(chuàng)新科技有限公司客服部語音文本數(shù)據(jù)進(jìn)行深入研究,通過需求分析,設(shè)計總體框架,實(shí)現(xiàn)了基于機(jī)器學(xué)習(xí)的客服語音智能質(zhì)檢系統(tǒng),主要的研究內(nèi)容如下:(1)數(shù)據(jù)的獲取。數(shù)據(jù)來源于河北斯博思創(chuàng)新科技有限公司歷年客服語音數(shù)據(jù)。(2)數(shù)據(jù)的預(yù)處理。首先對獲取的原始文本進(jìn)行數(shù)據(jù)清洗,利用Hanlp分詞工具進(jìn)行中文分詞、去停用詞。(3)模型的選擇。提出兩種文本相似度模型,一種是基于文檔向量的文本相似度模型,另一種是基于CNN的文本相似度模型,利用公司歷年客服數(shù)據(jù)作為數(shù)據(jù)集,計算兩種模型文本相似度,結(jié)合質(zhì)檢標(biāo)準(zhǔn)分別求取偏差率,基于CNN文本相似度模型的偏差率介于0.05-0.06,基于文檔向...
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
英文摘要
1 緒論
1.1 研究背景、目的及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國內(nèi)研究現(xiàn)狀
1.2.2 國外研究現(xiàn)狀
1.3 主要的研究內(nèi)容與方法
1.4 論文組織架構(gòu)
2 相關(guān)技術(shù)
2.1 自然語言處理技術(shù)
2.1.1 自然語言處理理論基礎(chǔ)
2.1.2 中文分詞理論基礎(chǔ)
2.2 關(guān)鍵詞提取技術(shù)
2.3 詞嵌入語義向量與語義距離
2.4 文本相似度技術(shù)
2.4.1 文本相似度理論基礎(chǔ)
2.4.2 詞袋向量
3 語義分析算法的研究與質(zhì)檢評分模型的構(gòu)建
3.1 數(shù)據(jù)預(yù)處理
3.1.1 中文分詞
3.1.2 去停用詞
3.2 關(guān)鍵詞提取
3.3 關(guān)鍵句提取
3.4 基于Word2Vec算法的詞向量建立
3.4.1 Word2Vec算法的模型選取
3.4.2 Word2Vec算法的詞向量表示
3.4.3 算法實(shí)現(xiàn)
3.5 文本相似度的計算
3.5.1 基于文檔向量的文本相似度計算
3.5.2 算法實(shí)現(xiàn)
3.5.3 基于CNN的文本相似度計算
3.5.4 算法實(shí)現(xiàn)
3.5.5 偏差率的計算
4 基于機(jī)器學(xué)習(xí)的客服語音智能質(zhì)檢系統(tǒng)的需求分析與設(shè)計
4.1 需求分析
4.2 系統(tǒng)總體設(shè)計
4.2.1 系統(tǒng)設(shè)計準(zhǔn)則
4.2.2 功能模塊設(shè)計
4.3 數(shù)據(jù)庫設(shè)計
4.3.1 用戶表結(jié)構(gòu)設(shè)計
4.3.2 質(zhì)檢規(guī)則表結(jié)構(gòu)設(shè)計
4.3.3 質(zhì)檢報告表結(jié)構(gòu)設(shè)計
4.4 本章小結(jié)
5 基于機(jī)器學(xué)習(xí)的客服語音智能質(zhì)檢系統(tǒng)的實(shí)現(xiàn)
5.1 用戶登錄模塊的實(shí)現(xiàn)
5.2 主界面的實(shí)現(xiàn)
5.3 自動質(zhì)檢評分的實(shí)現(xiàn)
5.4 管理員功能模塊的實(shí)現(xiàn)
5.5 語音信箱管理界面的實(shí)現(xiàn)
5.6 本章小結(jié)
6 系統(tǒng)測試
6.1 測試目的
6.2 系統(tǒng)功能測試
6.2.1 用戶登錄模塊測試
6.2.2 文本相似度計算測試
6.2.3 自動化質(zhì)檢模塊的測試
6.3 本章小結(jié)
7 總結(jié)與展望
7.1 總結(jié)
7.2 展望
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]2019年美國《麻省理工科技評論》發(fā)布“全球十大突破性技術(shù)”(上篇)[J]. 陳醒. 國際融資. 2020(01)
[2]結(jié)合語義相似度改進(jìn)LDA的文本主題分析[J]. 趙林靜. 計算機(jī)工程與設(shè)計. 2019(12)
[3]基于Log-Euclidean詞袋模型與基于Stein核稀疏編碼的人體行為識別算法的優(yōu)化與改進(jìn)[J]. 楊豐嘉. 科技創(chuàng)新與應(yīng)用. 2019(35)
[4]基于詞向量語義擴(kuò)展的網(wǎng)絡(luò)文本特征選擇方法研究[J]. 呂建新,鄭偉,馬林,李明,谷翠梅. 情報科學(xué). 2019(12)
[5]基于融合共現(xiàn)距離的句法網(wǎng)絡(luò)下文本語義相似度計算[J]. 嚴(yán)嬌,馬靜,房康. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2019(12)
[6]基于深度學(xué)習(xí)和遷移學(xué)習(xí)的領(lǐng)域自適應(yīng)中文分詞[J]. 成于思,施云濤. 中文信息學(xué)報. 2019(09)
[7]基于時空切分和詞向量相似性的軌跡伴隨模式挖掘[J]. 李欣. 中山大學(xué)學(xué)報(自然科學(xué)版). 2019(05)
[8]基于深度學(xué)習(xí)的文本相似度計算[J]. 邵恒,馮興樂,包芬. 鄭州大學(xué)學(xué)報(理學(xué)版). 2020(01)
[9]自然語言處理領(lǐng)域中的自動問答研究進(jìn)展[J]. 郭天翼,彭敏,伊穆蘭,毛文月,胡星燦,魏格格. 武漢大學(xué)學(xué)報(理學(xué)版). 2019(05)
[10]MGSC:一種多粒度語義交叉的短文本語義匹配模型[J]. 吳少洪,彭敦陸,苑威威,陳章,劉叢. 小型微型計算機(jī)系統(tǒng). 2019(06)
碩士論文
[1]基于深度學(xué)習(xí)的中文分詞算法研究[D]. 趙恒淼.山東科技大學(xué) 2018
本文編號:3709163
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
英文摘要
1 緒論
1.1 研究背景、目的及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國內(nèi)研究現(xiàn)狀
1.2.2 國外研究現(xiàn)狀
1.3 主要的研究內(nèi)容與方法
1.4 論文組織架構(gòu)
2 相關(guān)技術(shù)
2.1 自然語言處理技術(shù)
2.1.1 自然語言處理理論基礎(chǔ)
2.1.2 中文分詞理論基礎(chǔ)
2.2 關(guān)鍵詞提取技術(shù)
2.3 詞嵌入語義向量與語義距離
2.4 文本相似度技術(shù)
2.4.1 文本相似度理論基礎(chǔ)
2.4.2 詞袋向量
3 語義分析算法的研究與質(zhì)檢評分模型的構(gòu)建
3.1 數(shù)據(jù)預(yù)處理
3.1.1 中文分詞
3.1.2 去停用詞
3.2 關(guān)鍵詞提取
3.3 關(guān)鍵句提取
3.4 基于Word2Vec算法的詞向量建立
3.4.1 Word2Vec算法的模型選取
3.4.2 Word2Vec算法的詞向量表示
3.4.3 算法實(shí)現(xiàn)
3.5 文本相似度的計算
3.5.1 基于文檔向量的文本相似度計算
3.5.2 算法實(shí)現(xiàn)
3.5.3 基于CNN的文本相似度計算
3.5.4 算法實(shí)現(xiàn)
3.5.5 偏差率的計算
4 基于機(jī)器學(xué)習(xí)的客服語音智能質(zhì)檢系統(tǒng)的需求分析與設(shè)計
4.1 需求分析
4.2 系統(tǒng)總體設(shè)計
4.2.1 系統(tǒng)設(shè)計準(zhǔn)則
4.2.2 功能模塊設(shè)計
4.3 數(shù)據(jù)庫設(shè)計
4.3.1 用戶表結(jié)構(gòu)設(shè)計
4.3.2 質(zhì)檢規(guī)則表結(jié)構(gòu)設(shè)計
4.3.3 質(zhì)檢報告表結(jié)構(gòu)設(shè)計
4.4 本章小結(jié)
5 基于機(jī)器學(xué)習(xí)的客服語音智能質(zhì)檢系統(tǒng)的實(shí)現(xiàn)
5.1 用戶登錄模塊的實(shí)現(xiàn)
5.2 主界面的實(shí)現(xiàn)
5.3 自動質(zhì)檢評分的實(shí)現(xiàn)
5.4 管理員功能模塊的實(shí)現(xiàn)
5.5 語音信箱管理界面的實(shí)現(xiàn)
5.6 本章小結(jié)
6 系統(tǒng)測試
6.1 測試目的
6.2 系統(tǒng)功能測試
6.2.1 用戶登錄模塊測試
6.2.2 文本相似度計算測試
6.2.3 自動化質(zhì)檢模塊的測試
6.3 本章小結(jié)
7 總結(jié)與展望
7.1 總結(jié)
7.2 展望
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]2019年美國《麻省理工科技評論》發(fā)布“全球十大突破性技術(shù)”(上篇)[J]. 陳醒. 國際融資. 2020(01)
[2]結(jié)合語義相似度改進(jìn)LDA的文本主題分析[J]. 趙林靜. 計算機(jī)工程與設(shè)計. 2019(12)
[3]基于Log-Euclidean詞袋模型與基于Stein核稀疏編碼的人體行為識別算法的優(yōu)化與改進(jìn)[J]. 楊豐嘉. 科技創(chuàng)新與應(yīng)用. 2019(35)
[4]基于詞向量語義擴(kuò)展的網(wǎng)絡(luò)文本特征選擇方法研究[J]. 呂建新,鄭偉,馬林,李明,谷翠梅. 情報科學(xué). 2019(12)
[5]基于融合共現(xiàn)距離的句法網(wǎng)絡(luò)下文本語義相似度計算[J]. 嚴(yán)嬌,馬靜,房康. 數(shù)據(jù)分析與知識發(fā)現(xiàn). 2019(12)
[6]基于深度學(xué)習(xí)和遷移學(xué)習(xí)的領(lǐng)域自適應(yīng)中文分詞[J]. 成于思,施云濤. 中文信息學(xué)報. 2019(09)
[7]基于時空切分和詞向量相似性的軌跡伴隨模式挖掘[J]. 李欣. 中山大學(xué)學(xué)報(自然科學(xué)版). 2019(05)
[8]基于深度學(xué)習(xí)的文本相似度計算[J]. 邵恒,馮興樂,包芬. 鄭州大學(xué)學(xué)報(理學(xué)版). 2020(01)
[9]自然語言處理領(lǐng)域中的自動問答研究進(jìn)展[J]. 郭天翼,彭敏,伊穆蘭,毛文月,胡星燦,魏格格. 武漢大學(xué)學(xué)報(理學(xué)版). 2019(05)
[10]MGSC:一種多粒度語義交叉的短文本語義匹配模型[J]. 吳少洪,彭敦陸,苑威威,陳章,劉叢. 小型微型計算機(jī)系統(tǒng). 2019(06)
碩士論文
[1]基于深度學(xué)習(xí)的中文分詞算法研究[D]. 趙恒淼.山東科技大學(xué) 2018
本文編號:3709163
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3709163.html
最近更新
教材專著