天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 新聞傳播論文 >

基于SVM模型優(yōu)化的互聯(lián)網(wǎng)新聞自動分類研究

發(fā)布時間:2020-04-25 11:14
【摘要】:隨著科學技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)已在各行各業(yè)得到廣泛應(yīng)用。大數(shù)據(jù)時代的到來使人們在獲取信息資源的過程中,也會有大量干擾、不良的危害信息,網(wǎng)絡(luò)信息的恣意傳播很容易在獲取信息時出現(xiàn)低效率、信息誤導(dǎo)等情況。如何對互聯(lián)網(wǎng)新聞數(shù)據(jù)進行準確的分類、提高信息的利用率成為了眾多科研人員的研究目標。隨著人工智能和智能化平臺的發(fā)展,SVM研究又逐漸變熱,重新成為熱點。SVM在文本和圖像分類等領(lǐng)域都有著較為顯著的成果。本文在分析總結(jié)新聞自動分類過程中的分詞,表示,降維,分類以及結(jié)果判定的基礎(chǔ)上,著重對降維和分類進行了深入研究。本文主要研究內(nèi)容如下:(1)針對互聯(lián)網(wǎng)新聞文本數(shù)據(jù)量大,冗余數(shù)據(jù)資源較多不便于使用者查找有效信息等問題,做出以下改進:在數(shù)據(jù)預(yù)處理中,使用線性判別分析(LDA)可以讓映射后的樣本有最好的分類性能。在LDA進行特征降維之前,先使用單因素方差分析對每個屬性與類別進行相關(guān)度的分析,將不相關(guān)或者相關(guān)性較低的特征剔除,再使用LDA在線性變換上將原始數(shù)據(jù)映射到能夠較好區(qū)分特征與類別的低維度上,實現(xiàn)數(shù)據(jù)降維。(2)為提高鯨魚優(yōu)化算法的收斂速度和尋優(yōu)精度,提出一種基于非線性收斂因子和局部擾動的鯨魚優(yōu)化算法。算法首先引入非線性收斂因子,提高鯨魚種群的多樣性,擴大鯨魚搜索食物的范圍。同時在鯨魚包圍捕食階段,采用一種局部擾動策略,使算法在跳出局部極值時的能力增強,提高算法的尋優(yōu)精度。實驗結(jié)果表明,改進后算法和粒子群算法、蝙蝠算法、基本鯨魚優(yōu)化算法相比,尋優(yōu)速度、收斂精度、算法穩(wěn)定性上都要優(yōu)于其他算法。(3)通過深入分析SVM的思想、原理和流程,針對基本SVM模型中存在的易發(fā)生分類準確率不高、參數(shù)優(yōu)化費時等缺點,做出以下改進:在SVM參數(shù)選取中,使用鯨魚優(yōu)化算法,快速找到全局最優(yōu)解,提高模型的分類準確率,改進后的鯨魚優(yōu)化算法在模型參數(shù)優(yōu)化中效果更佳。并用互聯(lián)網(wǎng)新聞自動分類系統(tǒng)與優(yōu)化后的SVM模型結(jié)合,使互聯(lián)網(wǎng)新聞信息更清晰直觀的呈現(xiàn)給新聞用戶,不僅可以提升用戶獲取有效信息的效率,也可以提高用戶的使用興趣,減少冗余數(shù)據(jù)對用戶的干擾,實現(xiàn)本文的使用價值。
【圖文】:

數(shù)據(jù),圖邊,二維數(shù)據(jù),類別


圖 2-2 兩類數(shù)據(jù)投影視圖在上圖提供的兩種投影方式中,從直觀上可以看出,右圖比左圖的投影效果要圖的紅色和藍色數(shù)據(jù)較為集中,且類別之間的距離明顯,而左圖邊緣處數(shù)據(jù)雜亂通過二維數(shù)據(jù)簡要直觀的體現(xiàn)了 LDA 的基本思想,但是在實際應(yīng)用中,數(shù)據(jù)

視圖,數(shù)據(jù)分類,分類方案


圖 2-3 兩類數(shù)據(jù)分類視圖 1上圖中的(a)是已有的數(shù)據(jù),紅色和藍色分別代表兩個不同的類別。數(shù)據(jù)顯然是線性的,但是能把兩類數(shù)據(jù)點分離的直線有多條。圖 2-3 中的(b)圖表示分類方案 A,(c示分類方案 B,,其中黑色實線被稱之為分界線,專業(yè)術(shù)語也可叫做決策面。各個決
【學位授予單位】:河南大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:G210.7;TP181;TP391.1

【參考文獻】

相關(guān)期刊論文 前10條

1 樊存佳;汪友生;邊航;;一種改進的KNN文本分類算法[J];國外電子測量技術(shù);2015年12期

2 魏峻;;基于蝙蝠算法的支持向量機參數(shù)優(yōu)化[J];寶雞文理學院學報(自然科學版);2015年03期

3 王瓊瑤;何友全;彭小玲;;基于改進遺傳算法的支持向量機參數(shù)優(yōu)化方法[J];計算機與現(xiàn)代化;2015年03期

4 李鋒剛;梁鈺;GAO Xiao-zhi;ZENGER Kai;;基于LDA-wSVM模型的文本分類研究[J];計算機應(yīng)用研究;2015年01期

5 薛春香;張玉芳;;面向新聞領(lǐng)域的中文文本分類研究綜述[J];圖書情報工作;2013年14期

6 崔建明;劉建明;廖周宇;;基于SVM算法的文本分類技術(shù)研究[J];計算機仿真;2013年02期

7 石丹丹;;網(wǎng)絡(luò)新聞的特點[J];才智;2013年04期

8 張琳;陳燕;李桃迎;牟向偉;;決策樹分類算法研究[J];計算機工程;2011年13期

9 林永民;朱衛(wèi)東;;模糊kNN在文本分類中的應(yīng)用研究[J];計算機應(yīng)用與軟件;2008年09期

10 邵浩然,張亮,馬范援;基于損失最小化的SVM多類網(wǎng)頁分類算法[J];計算機應(yīng)用與軟件;2005年07期

相關(guān)博士學位論文 前2條

1 曹杰;基于SVM的網(wǎng)絡(luò)流量特征降維與分類方法研究[D];吉林大學;2017年

2 李榮陸;文本分類及其相關(guān)技術(shù)研究[D];復(fù)旦大學;2005年

相關(guān)碩士學位論文 前3條

1 劉春雨;改進的支持向量機的理論研究及應(yīng)用[D];西北農(nóng)林科技大學;2016年

2 周濤麗;基于支持向量機的多分類方法研究[D];電子科技大學;2015年

3 劉海旭;基于PCA和LDA的文本分類系統(tǒng)設(shè)計與實現(xiàn)[D];北京郵電大學;2013年



本文編號:2640186

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/xinwenchuanbolunwen/2640186.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c5ca1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com