天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

呼叫中心文本分類系統(tǒng)的設(shè)計與實現(xiàn)

發(fā)布時間:2021-10-15 04:03
  隨著城市智能化的發(fā)展,政府部門為了了解民生訴求普遍建立了呼叫中心,并成為群眾表達民意訴求的重要渠道。民生訴求文本包含了豐富的當?shù)責狳c事件和訴求信息,這些文本數(shù)據(jù)往往長短不一、包含較大信息量,伴隨著數(shù)據(jù)量的逐漸增大,如何發(fā)現(xiàn)群眾關(guān)心的熱點訴求成了管理者關(guān)注的焦點。本文利用文本分類技術(shù),對呼叫中心的訴求數(shù)據(jù)進行分析,設(shè)計實現(xiàn)了一個從數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、文本數(shù)據(jù)分類和可視化展示為一體的文本分類系統(tǒng)。本文主要工作包括:(1)數(shù)據(jù)采集,采集分散在不同數(shù)據(jù)源的原始數(shù)據(jù)。論文設(shè)計合理的數(shù)據(jù)存儲格式,完成數(shù)據(jù)的初步錄入。呼叫中心的數(shù)據(jù)源每天都有更新匯總,因此后期采用增量采集的模式,完成對新數(shù)據(jù)的增量錄入。(2)數(shù)據(jù)預(yù)處理,論文設(shè)計實現(xiàn)了一套數(shù)據(jù)初步清洗的方法,完成對真實數(shù)據(jù)的清洗和過濾。同時針對數(shù)據(jù)中的訴求文本設(shè)計實現(xiàn)了中文文本處理流程,包括中文分詞、去除停用詞、特征選擇和文本表示等步驟。在文本特征表示階段,針對傳統(tǒng)TFIDF算法忽略特征類內(nèi)和類間的分布的缺陷,結(jié)合卡方統(tǒng)計和信息熵提出改進的TFIDF-T算法;同時研究了基于詞向量Word2vec的文本表示,提出了詞向量平均的AW

【文章來源】:東南大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:77 頁

【學(xué)位級別】:碩士

【部分圖文】:

呼叫中心文本分類系統(tǒng)的設(shè)計與實現(xiàn)


訴求文本語料示意

呼叫中心文本分類系統(tǒng)的設(shè)計與實現(xiàn)


set_val轉(zhuǎn)換配置

呼叫中心文本分類系統(tǒng)的設(shè)計與實現(xiàn)


update轉(zhuǎn)換配置


本文編號:3437388

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3437388.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶bbfc4***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com