面向電信詐騙的反詐平臺技術研究
發(fā)布時間:2023-05-14 04:51
隨著通信網絡技術的發(fā)展,人們對電信服務的質量要求也在不斷提高,對電信服務的挑戰(zhàn)越來越大。人們不在滿足于先前電信服務“可用”的需求,而更加趨向于精細化,個性化,高質量化。電信欺詐作為一種最為常見的詐騙手段,直接影響了電信用戶的體驗和服務質量,電信詐騙問題不單單會對用戶造成不必要騷擾。一些電信欺詐甚至會對用戶的人身財產安全造成威脅。在電信行業(yè)的發(fā)展中,也積累了巨量相關的數據,這些數據可以用于反詐騙平臺的研究。因此,國家電信部門希望利用這些積累的數據,對電信詐騙行為進行精準分析。并且希望能夠利用這些分析結果提出對電信詐騙行為進行準確的分類,從而對電信詐騙行為進行有針對性的追蹤,分析和攔截。在電信部門對于電信反詐騙的需求下,面向電信詐騙的反詐平臺項目正式啟動。電信詐騙包含了許多類型,從技術方面分類,可以將電信詐騙主要的分為兩個類型:錄音型詐騙和語音型詐騙。錄音型詐騙由于其頻譜特征比較明顯,可以比較容易地采用算法過濾,而語音型詐騙則較為難以識別,而語音型詐騙正式本文反詐系統的識別目標。本課題旨在實現一個電信反詐平臺。通過利用電話錄音信息,通過應用多種算法手段,包括語音識別,自然語言處理的方式,來...
【文章頁數】:101 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.1.1 選題背景
1.1.2 研究內容
1.2 國內外研究現狀
1.3 論文主要工作
1.3.1 電信用戶語音信息的處理和識別
1.3.2 基于1-CNN的方法對通話雙方語音進行分類
1.3.3 基于自然語言處理方法對語音識別結果進行分類
1.3.4 面向電信詐騙的反詐平臺構建
1.4 論文組織和結構
第二章 技術介紹
2.1 電信用戶語音信息的處理和識別技術簡介
2.1.1 常見語音特征抽取方法
2.1.2 常見語音識別算法
2.2 說話人語音分類算法
2.2.1 說話人識別簡介
2.2.2 說話人識別在電信反詐系統中的運用
2.3 語音識別結果進行分類
2.3.1 基于TF-IDF的文本分類方式
2.3.2 基于text CNN的文本分類方式
2.3.3 基于fastText的文本分類方式
2.4 本章小結
第三章 面向電信詐騙的反詐平臺的需求分析
3.1 典型業(yè)務場景分析
3.2 功能性需求
3.2.1 數據管理
3.2.2 語音識別
3.2.3 說話人分類
3.2.4 詐騙分類
3.3 非功能需求
3.3.1 算法有效性
3.3.2 大量數據處理能力
3.3.3 數據實時處理能力
3.4 本章小結
第四章 關鍵問題研究以及解決方案
4.1 基于DEPSPEECH2的語音識別算法
4.1.1 問題描述
4.1.2 算法定義
4.1.3 算法流程
4.1.4 實驗效果
4.2 基于I-CNN的語音分類
4.2.1 問題描述
4.2.2 算法定義
4.2.3 算法流程
4.2.4 實驗結果
4.3 基于TEXT-CNN和TEXT- RNN的詐騙分類算法
4.3.1 問題描述
4.3.2 算法定義
4.3.3 算法流程
4.3.4 實驗結果
4.4 本章小結
第五章 系統總體設計
5.1 總體架構
5.2 系統分層模塊介紹
5.2.1 數據存儲層
5.2.2 預處理層
5.2.3 算法分析層
5.2.4 結果分析層
5.3 系統層次交互關系及接口設計
5.3.1 導入電信通話數據流程
5.3.2 說話人分類工作流程
5.3.3 詐騙分類工作流程
5.4 本章小結
第六章 關鍵模塊設計與實現
6.1 模塊類圖說明
6.1.1 語音識別模塊
6.1.2 說話人分類模塊
6.1.3 詐騙分類模塊
6.1.4 數據存儲控制模塊
6.2 典型場景說明
6.2.1 批量語音詐騙判別場景說明
6.2.2 流式語音詐騙判別場景
6.3 典型算法說明
6.3.1 語音判別后處理關鍵算法實現
6.3.2 語音文件獲取的緩存算法
6.4 本章小結
第七章 系統測試
7.1 測試環(huán)境
7.1.1 部署環(huán)境
7.1.2 部署方案
7.2 典型集成測試用例
7.3 性能測試結果
7.4 測試結果分析
7.5 本章小結
第八章 結束語
8.1 工作總結
8.2 未來展望
致謝
作者攻讀學位期間發(fā)表的學術論文目錄
參考文獻
本文編號:3817218
【文章頁數】:101 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.1.1 選題背景
1.1.2 研究內容
1.2 國內外研究現狀
1.3 論文主要工作
1.3.1 電信用戶語音信息的處理和識別
1.3.2 基于1-CNN的方法對通話雙方語音進行分類
1.3.3 基于自然語言處理方法對語音識別結果進行分類
1.3.4 面向電信詐騙的反詐平臺構建
1.4 論文組織和結構
第二章 技術介紹
2.1 電信用戶語音信息的處理和識別技術簡介
2.1.1 常見語音特征抽取方法
2.1.2 常見語音識別算法
2.2 說話人語音分類算法
2.2.1 說話人識別簡介
2.2.2 說話人識別在電信反詐系統中的運用
2.3 語音識別結果進行分類
2.3.1 基于TF-IDF的文本分類方式
2.3.2 基于text CNN的文本分類方式
2.3.3 基于fastText的文本分類方式
2.4 本章小結
第三章 面向電信詐騙的反詐平臺的需求分析
3.1 典型業(yè)務場景分析
3.2 功能性需求
3.2.1 數據管理
3.2.2 語音識別
3.2.3 說話人分類
3.2.4 詐騙分類
3.3 非功能需求
3.3.1 算法有效性
3.3.2 大量數據處理能力
3.3.3 數據實時處理能力
3.4 本章小結
第四章 關鍵問題研究以及解決方案
4.1 基于DEPSPEECH2的語音識別算法
4.1.1 問題描述
4.1.2 算法定義
4.1.3 算法流程
4.1.4 實驗效果
4.2 基于I-CNN的語音分類
4.2.1 問題描述
4.2.2 算法定義
4.2.3 算法流程
4.2.4 實驗結果
4.3 基于TEXT-CNN和TEXT- RNN的詐騙分類算法
4.3.1 問題描述
4.3.2 算法定義
4.3.3 算法流程
4.3.4 實驗結果
4.4 本章小結
第五章 系統總體設計
5.1 總體架構
5.2 系統分層模塊介紹
5.2.1 數據存儲層
5.2.2 預處理層
5.2.3 算法分析層
5.2.4 結果分析層
5.3 系統層次交互關系及接口設計
5.3.1 導入電信通話數據流程
5.3.2 說話人分類工作流程
5.3.3 詐騙分類工作流程
5.4 本章小結
第六章 關鍵模塊設計與實現
6.1 模塊類圖說明
6.1.1 語音識別模塊
6.1.2 說話人分類模塊
6.1.3 詐騙分類模塊
6.1.4 數據存儲控制模塊
6.2 典型場景說明
6.2.1 批量語音詐騙判別場景說明
6.2.2 流式語音詐騙判別場景
6.3 典型算法說明
6.3.1 語音判別后處理關鍵算法實現
6.3.2 語音文件獲取的緩存算法
6.4 本章小結
第七章 系統測試
7.1 測試環(huán)境
7.1.1 部署環(huán)境
7.1.2 部署方案
7.2 典型集成測試用例
7.3 性能測試結果
7.4 測試結果分析
7.5 本章小結
第八章 結束語
8.1 工作總結
8.2 未來展望
致謝
作者攻讀學位期間發(fā)表的學術論文目錄
參考文獻
本文編號:3817218
本文鏈接:http://sikaile.net/falvlunwen/fanzuizhian/3817218.html