天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于遺傳算法的模型參數(shù)選取及其在文本分類中的應(yīng)用

發(fā)布時間:2022-10-11 16:55
  隨著計算機(jī)技術(shù)的不斷發(fā)展,信息數(shù)據(jù)大量增加,甚至呈指數(shù)級態(tài)勢迅猛增長。有效利用這些信息數(shù)據(jù)的難度也隨之增加。同時,在這些信息數(shù)據(jù)中還存在大量的無用信息以及有害信息,為處理信息的過程帶來了極大的負(fù)面影響。因此,如何高效地利用信息數(shù)據(jù),已經(jīng)成為了機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點。此外,文本作為一種常見的信息數(shù)據(jù)形式,如何有效地對文本數(shù)據(jù)加以分類,則是文本信息處理過程中的重要任務(wù)。為了提高文本分類的快速性和準(zhǔn)確性,針對分類效率及分類準(zhǔn)確率的問題,本文采用了一種將遺傳算法(GA)和支持向量機(jī)(SVM)相結(jié)合的文本分類方法。該方法將支持向量機(jī)的參數(shù)看作遺傳算法的一個染色體,并進(jìn)行二進(jìn)制編碼,將支持向量機(jī)的分類準(zhǔn)確率用作遺傳算法的適應(yīng)度函數(shù),對每一個個體適應(yīng)度進(jìn)行評價,并通過選擇、交叉和變異的遺傳操作,得到對文本分類數(shù)據(jù)最優(yōu)的支持向量機(jī)參數(shù),最后利用帶有最優(yōu)參數(shù)的支持向量機(jī)對屬于既有類別的文本數(shù)據(jù)進(jìn)行分類。一般情況下,對于新進(jìn)的文本信息數(shù)據(jù),我們可將其歸入既有類別,然而既有類別往往無法滿足大量新進(jìn)的文本信息內(nèi)容,即新進(jìn)文本數(shù)據(jù)的類別往往會超出既有類別的范圍。因此,如何有效地判斷新進(jìn)文本信息數(shù)據(jù)是否可以分類至... 

【文章頁數(shù)】:63 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
abstract
第1章 緒論
    1.1 研究背景
    1.2 研究目的與研究意義
    1.3 國內(nèi)外研究現(xiàn)狀
        1.3.1 國內(nèi)研究現(xiàn)狀
        1.3.2 國外研究現(xiàn)狀
    1.4 本文的主要研究內(nèi)容
第2章 文本分類的基本理論
    2.1 文本分類的基本流程
    2.2 文本預(yù)處理
        2.2.1 文本標(biāo)記的預(yù)處理
        2.2.2 中文分詞的預(yù)處理
        2.2.3 停用詞的預(yù)處理
    2.3 文本表示
    2.4 特征處理
        2.4.1 特征提取
        2.4.2 特征加權(quán)
    2.5 評價指標(biāo)
    2.6 小結(jié)
第3章 常用文本分類方法對比分析
    3.1 樸素貝葉斯算法
    3.2 K近鄰算法
    3.3 支持向量機(jī)算法
        3.3.1 線性可分支持向量
        3.3.2 線性不可分支持向量
        3.3.3 多分類支持向量
        3.3.4 核函數(shù)
    3.4 文本分類算法對比
    3.5 小結(jié)
第4章 SVM參數(shù)優(yōu)化方法的改進(jìn)
    4.1 SVM參數(shù)
    4.2 SVM參數(shù)優(yōu)化方法
        4.2.1 交叉驗證法
        4.2.2 網(wǎng)格搜索法
    4.3 遺傳算法優(yōu)化SVM參數(shù)
        4.3.1 遺傳算法
        4.3.2 遺傳算法優(yōu)化SVM參數(shù)
    4.4 小結(jié)
第5章 基于GA-SVM與 GA-FCM的漸進(jìn)式分群模型
    5.1 GA-FCM算法
    5.2實驗
        5.2.1 實驗數(shù)據(jù)
        5.2.2 實驗設(shè)計
        5.2.3 實驗分析與實驗結(jié)論
    5.3 小結(jié)
第6章 結(jié)論
參考文獻(xiàn)
致謝


【參考文獻(xiàn)】:
期刊論文
[1]基于支持向量機(jī)的文本分類[J]. 李蕓初.  中國新技術(shù)新產(chǎn)品. 2019(01)
[2]Web文檔分類中TFIDF特征選擇算法的改進(jìn)[J]. 段國侖,謝鈞,郭蕾蕾,王曉瑩.  計算機(jī)技術(shù)與發(fā)展. 2019(05)
[3]一種基于文本分類和評分機(jī)制的軟件缺陷分配方法[J]. 史小婉,馬于濤.  計算機(jī)科學(xué). 2018(11)
[4]基于社交平臺數(shù)據(jù)的文本分類算法研究[J]. 施瑞朗.  電子科技. 2018(10)
[5]基于貝葉斯決策的網(wǎng)格社區(qū)案卷分發(fā)模型[J]. 王鶴琴,王楊.  山東大學(xué)學(xué)報(理學(xué)版). 2018(11)
[6]基于搜索改進(jìn)的KNN文本分類算法[J]. 殷亞博,楊文忠,楊慧婷,許超英.  計算機(jī)工程與設(shè)計. 2018(09)
[7]字符級卷積神經(jīng)網(wǎng)絡(luò)短文本分類算法[J]. 劉敬學(xué),孟凡榮,周勇,劉兵.  計算機(jī)工程與應(yīng)用. 2019(05)
[8]基于情感傾向和SVM混合極短文本分類模型[J]. 王鶴琴,王楊.  科技通報. 2018(08)
[9]支持向量機(jī)在文本分類中的研究與應(yīng)用[J]. 張燕,姚志遠(yuǎn),陳文社.  電腦編程技巧與維護(hù). 2018(08)
[10]面向新聞文本的分類方法的比較研究[J]. 劉測,韓家新.  智能計算機(jī)與應(yīng)用. 2018(05)

碩士論文
[1]基于機(jī)器學(xué)習(xí)的文本分類研究與實現(xiàn)[D]. 王振.南京郵電大學(xué) 2018
[2]基于社交媒體的災(zāi)害事件提取與時空分析[D]. 李想.蘭州交通大學(xué) 2018
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的文本分類器的設(shè)計與實現(xiàn)[D]. 白璐.北京交通大學(xué) 2018
[4]面向新聞領(lǐng)域的小型垂直搜索引擎[D]. 許翰林.南京信息工程大學(xué) 2018
[5]基于并行SVM算法的中文文本分類方法研究[D]. 尹旭東.吉林大學(xué) 2018
[6]基于AlphaGo設(shè)計思想的網(wǎng)絡(luò)不良詞匯發(fā)現(xiàn)模型研究[D]. 聶莉.華中師范大學(xué) 2018
[7]信息安全漏洞分類與評估技術(shù)研究[D]. 宋佳良.戰(zhàn)略支援部隊信息工程大學(xué) 2018
[8]基于集成學(xué)習(xí)的房產(chǎn)資訊分類[D]. 劉星燦.西南交通大學(xué) 2018
[9]面向淘寶的客戶決策分析的研究與應(yīng)用[D]. 陳家男.東北林業(yè)大學(xué) 2018
[10]基于新浪微博的短文本分類與個性化推薦[D]. 王嬌.北京郵電大學(xué) 2018



本文編號:3690941

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3690941.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d53de***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com