基于物流車隊?wèi)?yīng)用SVM文本挖掘研究
發(fā)布時間:2017-03-21 19:06
本文關(guān)鍵詞:基于物流車隊?wèi)?yīng)用SVM文本挖掘研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著計算機(jī)技術(shù)和系統(tǒng)工程學(xué)的飛速發(fā)展,在全球信息化大潮的推動下,數(shù)據(jù)挖掘已成為研究中活躍份子之一,從數(shù)據(jù)中發(fā)現(xiàn)有價值的知識模式已成為具有重要意義的研究領(lǐng)域。支持向量機(jī)是一種新型機(jī)器學(xué)習(xí)方法,它較好地解決了非線性、高維數(shù)等問題,已經(jīng)應(yīng)用在許多領(lǐng)域,如手寫數(shù)字識別、對象識別、文本分類等。但是新的方法也存在問題需要解決,如文本分類具有類別和樣本數(shù)目多、噪音多、各類別樣本數(shù)目不均衡等特點,使得支持向量機(jī)用于文本分類時存在訓(xùn)練速度和分類速度較慢的缺點。 為了解決實體物流公司車隊車輛使用情況不易監(jiān)控,保養(yǎng)維護(hù)不能及時到位等問題,本文針對物流公司車隊行車記錄進(jìn)行文本挖掘,監(jiān)控每一次運輸任務(wù)對車輛使用強(qiáng)度,利用信息技術(shù)對車輛保養(yǎng)維修做到精細(xì)化管理。行車記錄挖掘基于中文分詞處理技術(shù),利用TF×IDF方法將特征項進(jìn)行加權(quán),并用向量空間方法將行車記錄文本表達(dá)為數(shù)學(xué)方式經(jīng)行后續(xù)挖掘計算。在特征項降維處理中,通過實驗對信息增益、交叉熵、互信息和χ2統(tǒng)計四種降維方法進(jìn)行比較,觀察出信息增益和互信息最合適行車記錄特點,最終作為降維方法。行車記錄分類采用支持向量機(jī)算法。標(biāo)準(zhǔn)支持向量機(jī)只能用于單標(biāo)號樣本分類,本文針對多類分類問題,提出了樹形結(jié)構(gòu)構(gòu)建多類支持向量機(jī)分類器。為了優(yōu)化分類器效率,提出使用聚類算法思想,構(gòu)造平衡二叉樹結(jié)構(gòu),以提高分類器分類速度。還對常用的h次多項式核函數(shù),高斯徑向基核函數(shù)和S型核函數(shù)三種核函數(shù)經(jīng)行實驗,找出準(zhǔn)確性較高的核函數(shù)。在系統(tǒng)設(shè)計上,各個模塊采用低耦合方式設(shè)計,便于監(jiān)視文本挖掘過程中各個環(huán)節(jié)的輸出值,并提高系統(tǒng)靈活性,使各個模塊便于維護(hù)和修改。
【關(guān)鍵詞】:支持向量機(jī) 文本分類 平衡二叉樹結(jié)構(gòu) 低耦合
【學(xué)位授予單位】:天津財經(jīng)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2012
【分類號】:C931.6;F253.9
【目錄】:
- 內(nèi)容摘要4-5
- Abstract5-8
- 第1章 引言8-10
- 1.1 研究背景8
- 1.2 本文內(nèi)容安排8-9
- 1.3 研究方法9-10
- 第2章 文獻(xiàn)綜述10-13
- 2.1 國外研究現(xiàn)狀10-11
- 2.2 國內(nèi)研究現(xiàn)狀11-13
- 第3章 中文文本分類技術(shù)13-22
- 3.1 本文分類概述13-14
- 3.2 文本預(yù)處理及中文分詞14
- 3.3 向量空間模型表示文本14-18
- 3.4 文本分類算法18-21
- 3.5 分類器性能評估21-22
- 第4章 基于SVM文本分類的研究22-30
- 4.1 SVM概述22-23
- 4.2 線性可分的SVM23-25
- 4.3 非線性可分的SVM25-27
- 4.4 SVM訓(xùn)練算法27-30
- 第5章 基于支持向量機(jī)的多類分類研究30-39
- 5.1 多類SVM研究現(xiàn)狀30-32
- 5.2 一種改進(jìn)的多類SVM32-35
- 5.3 基于聚類算法改進(jìn)的二叉樹SVM35-39
- 第6章 系統(tǒng)建模和設(shè)計39-52
- 6.1 系統(tǒng)背景及目的39-40
- 6.2 系統(tǒng)模型設(shè)計及改進(jìn)40-42
- 6.3 系統(tǒng)結(jié)構(gòu)42-43
- 6.4 分詞模塊研究與設(shè)計43-46
- 6.5 文本表示模塊研究與設(shè)計46-49
- 6.6 SVM訓(xùn)練模塊研究與設(shè)計49-52
- 第7章 實驗分析52-56
- 7.1 實驗環(huán)境及評價指標(biāo)52-53
- 7.2 降維算法實驗53-55
- 7.3 支持向量機(jī)核函數(shù)實驗55-56
- 第8章 總結(jié)與展望56-58
- 8.1 總結(jié)56-57
- 8.2 研究工作展望57-58
- 參考文獻(xiàn)58-61
- 后記61
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前5條
1 張文生,王玨,戴國忠;支持向量機(jī)中引入后驗概率的理論和方法研究[J];計算機(jī)研究與發(fā)展;2002年04期
2 李雪蕾,張冬茉;一種基于向量空間模型的文本分類方法[J];計算機(jī)工程;2003年17期
3 應(yīng)志偉,柴佩琪,陳其暉;文語轉(zhuǎn)換系統(tǒng)中基于語料的漢語自動分詞研究[J];計算機(jī)應(yīng)用;2000年02期
4 秦進(jìn),陳笑蓉,汪維家,陸汝占;文本分類中的特征抽取[J];計算機(jī)應(yīng)用;2003年02期
5 周茜,趙明生,扈e
本文編號:260134
本文鏈接:http://sikaile.net/guanlilunwen/yunyingzuzhiguanlilunwen/260134.html
最近更新
教材專著