暗網(wǎng)數(shù)據(jù)源分類算法的研究和實現(xiàn)
【圖文】:
機分類方法可以很好的避免局部最優(yōu)問題,能很好的得到數(shù)據(jù)的內(nèi)在特征,對稀疏數(shù)據(jù)不敏感,所以其分類效果的準確性較好,并且其根本思想是去解決一個二次規(guī)劃問題,得到基于全局的最優(yōu)解,支持向量機分類方法是文本分類方法中效果最好的分類方法之一。決策樹(Dicision Tree)分類方法是基于一個特殊的樹結(jié)構(gòu)的決策圖,利用類似于樹形圖形或決策模型來進行目標規(guī)劃。決策樹被廣泛的應用到了運籌學領域,以幫助決策者獲得一個最可能達到的策略。決策樹的結(jié)構(gòu)反映了對象與對象屬性之間的映射關系,樹中的每個節(jié)點代表了一個對象,不同的分路代表了不同的屬性值范圍。在決策樹的表示中,通常采用三種不同的符號來表示不同類型的節(jié)點。如圖 2-5 利用矩形框來表示決策節(jié)點,圓圈來表示機會節(jié)點,三角形表示終結(jié)點。
圖 2-5 決策樹節(jié)點類型 的決策流程如下:根據(jù)已經(jīng)存在的條件繪制決策樹圖,將標注在概率枝上面,在對應的狀態(tài)節(jié)點上標注期望值,比將期望值小的方案減掉即剩下最優(yōu)的決策方案。其優(yōu)點是夠在相對較短的時間內(nèi)對大數(shù)據(jù)源做出可行而較優(yōu)的方案別數(shù)據(jù)分布不均勻,決策樹中的信息增益結(jié)果偏向那些擁而是得分類結(jié)果出現(xiàn)錯誤偏差。絡(Artificial Neural Network, ANN)分類方法是計算機的很好例子,其根據(jù)生物神經(jīng)網(wǎng)絡的結(jié)構(gòu)和功能來建立神經(jīng)元和神經(jīng)元之間的關系構(gòu)成了神經(jīng)網(wǎng)絡,大量的人的計算工作,不同的節(jié)點代表了不同的輸出函數(shù),即激勵自適應系統(tǒng)。圖 2-6 描述了神經(jīng)網(wǎng)絡的基本結(jié)構(gòu)。
【學位授予單位】:成都理工大學
【學位級別】:碩士
【學位授予年份】:2013
【分類號】:TP391.3
【參考文獻】
相關期刊論文 前8條
1 徐群叁;周鳳翔;宋麗華;;基于粗糙集理論的關聯(lián)規(guī)則挖掘[J];福建電腦;2006年08期
2 賈君枝;董剛;;FrameNet、WordNet、VerbNet比較研究[J];情報科學;2007年11期
3 高凡;網(wǎng)絡信息檢索的發(fā)展方向[J];情報理論與實踐;2004年02期
4 顏躍進,李舟軍,陳火旺;基于FP-Tree有效挖掘最大頻繁項集[J];軟件學報;2005年02期
5 馬軍;宋玲;韓曉暉;閆潑;;基于網(wǎng)頁上下文的Deep Web數(shù)據(jù)庫分類[J];軟件學報;2008年02期
6 朱紅蕾,李明;關聯(lián)規(guī)則挖掘的維護算法研究[J];微機發(fā)展;2004年02期
7 饒洋輝;葉良;程潔;;WordNet在文本聚類中的應用研究[J];現(xiàn)代圖書情報技術(shù);2009年10期
8 宋中山;挖掘大型數(shù)據(jù)庫中的Apriori算法及其改進[J];中南民族大學學報(自然科學版);2003年01期
相關博士學位論文 前1條
1 周子力;基于WordNet的本體構(gòu)建及其在安全領域應用關鍵技術(shù)研究[D];華東師范大學;2009年
相關碩士學位論文 前2條
1 楊溥;搜索引擎中爬蟲的若干問題研究[D];北京郵電大學;2009年
2 華慧;基于頻繁模式和語義處理的Deep Web數(shù)據(jù)源分類研究[D];蘇州大學;2010年
本文編號:2557243
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2557243.html