天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 組織管理論文 >

基于物流車隊應用SVM文本挖掘研究

發(fā)布時間:2017-03-21 19:06

  本文關鍵詞:基于物流車隊應用SVM文本挖掘研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著計算機技術和系統(tǒng)工程學的飛速發(fā)展,在全球信息化大潮的推動下,數據挖掘已成為研究中活躍份子之一,從數據中發(fā)現有價值的知識模式已成為具有重要意義的研究領域。支持向量機是一種新型機器學習方法,它較好地解決了非線性、高維數等問題,已經應用在許多領域,如手寫數字識別、對象識別、文本分類等。但是新的方法也存在問題需要解決,如文本分類具有類別和樣本數目多、噪音多、各類別樣本數目不均衡等特點,使得支持向量機用于文本分類時存在訓練速度和分類速度較慢的缺點。 為了解決實體物流公司車隊車輛使用情況不易監(jiān)控,保養(yǎng)維護不能及時到位等問題,本文針對物流公司車隊行車記錄進行文本挖掘,監(jiān)控每一次運輸任務對車輛使用強度,利用信息技術對車輛保養(yǎng)維修做到精細化管理。行車記錄挖掘基于中文分詞處理技術,利用TF×IDF方法將特征項進行加權,并用向量空間方法將行車記錄文本表達為數學方式經行后續(xù)挖掘計算。在特征項降維處理中,通過實驗對信息增益、交叉熵、互信息和χ2統(tǒng)計四種降維方法進行比較,觀察出信息增益和互信息最合適行車記錄特點,最終作為降維方法。行車記錄分類采用支持向量機算法。標準支持向量機只能用于單標號樣本分類,本文針對多類分類問題,提出了樹形結構構建多類支持向量機分類器。為了優(yōu)化分類器效率,提出使用聚類算法思想,構造平衡二叉樹結構,以提高分類器分類速度。還對常用的h次多項式核函數,高斯徑向基核函數和S型核函數三種核函數經行實驗,找出準確性較高的核函數。在系統(tǒng)設計上,各個模塊采用低耦合方式設計,便于監(jiān)視文本挖掘過程中各個環(huán)節(jié)的輸出值,并提高系統(tǒng)靈活性,使各個模塊便于維護和修改。
【關鍵詞】:支持向量機 文本分類 平衡二叉樹結構 低耦合
【學位授予單位】:天津財經大學
【學位級別】:碩士
【學位授予年份】:2012
【分類號】:C931.6;F253.9
【目錄】:
  • 內容摘要4-5
  • Abstract5-8
  • 第1章 引言8-10
  • 1.1 研究背景8
  • 1.2 本文內容安排8-9
  • 1.3 研究方法9-10
  • 第2章 文獻綜述10-13
  • 2.1 國外研究現狀10-11
  • 2.2 國內研究現狀11-13
  • 第3章 中文文本分類技術13-22
  • 3.1 本文分類概述13-14
  • 3.2 文本預處理及中文分詞14
  • 3.3 向量空間模型表示文本14-18
  • 3.4 文本分類算法18-21
  • 3.5 分類器性能評估21-22
  • 第4章 基于SVM文本分類的研究22-30
  • 4.1 SVM概述22-23
  • 4.2 線性可分的SVM23-25
  • 4.3 非線性可分的SVM25-27
  • 4.4 SVM訓練算法27-30
  • 第5章 基于支持向量機的多類分類研究30-39
  • 5.1 多類SVM研究現狀30-32
  • 5.2 一種改進的多類SVM32-35
  • 5.3 基于聚類算法改進的二叉樹SVM35-39
  • 第6章 系統(tǒng)建模和設計39-52
  • 6.1 系統(tǒng)背景及目的39-40
  • 6.2 系統(tǒng)模型設計及改進40-42
  • 6.3 系統(tǒng)結構42-43
  • 6.4 分詞模塊研究與設計43-46
  • 6.5 文本表示模塊研究與設計46-49
  • 6.6 SVM訓練模塊研究與設計49-52
  • 第7章 實驗分析52-56
  • 7.1 實驗環(huán)境及評價指標52-53
  • 7.2 降維算法實驗53-55
  • 7.3 支持向量機核函數實驗55-56
  • 第8章 總結與展望56-58
  • 8.1 總結56-57
  • 8.2 研究工作展望57-58
  • 參考文獻58-61
  • 后記61

【參考文獻】

中國期刊全文數據庫 前5條

1 張文生,王玨,戴國忠;支持向量機中引入后驗概率的理論和方法研究[J];計算機研究與發(fā)展;2002年04期

2 李雪蕾,張冬茉;一種基于向量空間模型的文本分類方法[J];計算機工程;2003年17期

3 應志偉,柴佩琪,陳其暉;文語轉換系統(tǒng)中基于語料的漢語自動分詞研究[J];計算機應用;2000年02期

4 秦進,陳笑蓉,汪維家,陸汝占;文本分類中的特征抽取[J];計算機應用;2003年02期

5 周茜,趙明生,扈e

本文編號:260134


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/yunyingzuzhiguanlilunwen/260134.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶d0c16***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com