天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于多標(biāo)簽學(xué)習(xí)的特征降維和文本分類方法研究

發(fā)布時間:2021-05-25 17:43
  隨著互聯(lián)網(wǎng)時代下網(wǎng)絡(luò)信息的爆炸式增長,多標(biāo)簽文本分類已經(jīng)成為處理文本信息數(shù)據(jù)的一種有效手段。信息數(shù)據(jù)可以通過多標(biāo)簽文本分類快速準(zhǔn)確地定位到所屬類別,多標(biāo)簽文本分類算法漸漸成為自然語言處理領(lǐng)域的研究熱點(diǎn)。但是目前的多標(biāo)簽分類算法還存在著數(shù)據(jù)的類不平衡和計(jì)算復(fù)雜度高的問題,而且通過網(wǎng)絡(luò)產(chǎn)生的多標(biāo)簽數(shù)據(jù)存在特征維度高、數(shù)據(jù)復(fù)雜等特點(diǎn),當(dāng)直接用于分類任務(wù)時,容易對分類效率和分類準(zhǔn)確率產(chǎn)生影響;谶@些問題,本文對多標(biāo)簽文本特征降維方法和分類算法進(jìn)行研究,分別改進(jìn)出基于Kullback-Leibler散度依賴性最大化的多標(biāo)簽降維方法和基于引力的多標(biāo)簽文本分類模型。針對多標(biāo)簽分類過程中多標(biāo)簽數(shù)據(jù)的高維特征會導(dǎo)致計(jì)算難度大和分類效率低等問題,通過對基于依賴性最大化的降維方法進(jìn)行改進(jìn),得出一種基于Kullback-Leibler散度依賴性最大化的多標(biāo)簽降維方法。在分類過程的特征降維階段,將原始矩陣映射到低維空間中并通過Kullback-Leibler散度最大化原始特征描述與類標(biāo)簽之間的依賴性,由于不需要特征分解,使得計(jì)算量得到很大降低。實(shí)驗(yàn)結(jié)果表明該降維方法能夠有效進(jìn)行多標(biāo)簽數(shù)據(jù)降維,提高了分類效率。... 

【文章來源】:重慶郵電大學(xué)重慶市

【文章頁數(shù)】:66 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
abstract
注釋表
第1章 緒論
    1.1 課題研究背景及意義
    1.2 多標(biāo)簽分類
    1.3 課題研究現(xiàn)狀及分析
        1.3.1 國內(nèi)外研究現(xiàn)狀
        1.3.2 存在的問題
    1.4 論文主要工作及組織結(jié)構(gòu)
        1.4.1 論文的研究內(nèi)容
        1.4.2 論文的結(jié)構(gòu)安排
    1.5 本章小結(jié)
第2章 多標(biāo)簽文本分類相關(guān)技術(shù)
    2.1 文本分類的相關(guān)知識
        2.1.1 文本分類的定義
        2.1.2 文本分類的過程
        2.1.3 文本特征表示方法
        2.1.4 特征選擇方法
        2.1.5 文本分類的評估準(zhǔn)則
    2.2 特征降維
        2.2.1 線性判別分析法
        2.2.2 主成分分析法
        2.2.3 典型關(guān)聯(lián)分析法
        2.2.4 多標(biāo)簽線性判別分析法
    2.3 多標(biāo)簽分類算法
        2.3.1 多標(biāo)簽k近鄰算法
        2.3.2 多標(biāo)簽決策樹算法
        2.3.3 二元關(guān)聯(lián)算法
        2.3.4 分類器鏈算法
        2.3.5 校準(zhǔn)標(biāo)簽排序算法
    2.4 本章小結(jié)
第3章 一種基于依賴性最大化的特征降維方法
    3.1 引言
    3.2 方法思想及流程
        3.2.1 MDDM方法
        3.2.2 改進(jìn)的依賴性最大化的特征降維方法
    3.3 實(shí)驗(yàn)結(jié)果及分析
        3.3.1 實(shí)驗(yàn)數(shù)據(jù)集分析
        3.3.2 結(jié)果分析
    3.4 本章小結(jié)
第4章 一種基于引力模型的多標(biāo)簽文本分類算法
    4.1 引言
    4.2 算法思想及流程
        4.2.1 質(zhì)心分類算法
        4.2.2 GM分類模型
        4.2.3 改進(jìn)的多標(biāo)簽引力分類模型
        4.2.4 算法分析
    4.3 實(shí)驗(yàn)結(jié)果及分析
        4.3.1 實(shí)驗(yàn)數(shù)據(jù)集分析
        4.3.2 結(jié)果分析
    4.4 本章小結(jié)
第5章 總結(jié)與展望
    5.1 全文總結(jié)
    5.2 未來工作展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間從事的科研工作及取得的成果


【參考文獻(xiàn)】:
期刊論文
[1]面向多標(biāo)簽文本分類的深度主題特征提取[J]. 陳文實(shí),劉心惠,魯明羽.  模式識別與人工智能. 2019(09)
[2]基于標(biāo)簽相關(guān)性的卷積神經(jīng)網(wǎng)絡(luò)多標(biāo)簽分類[J]. 余曉龍,林國平.  閩南師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(02)
[3]Web文檔分類中TFIDF特征選擇算法的改進(jìn)[J]. 段國侖,謝鈞,郭蕾蕾,王曉瑩.  計(jì)算機(jī)技術(shù)與發(fā)展. 2019(05)
[4]基于主題分布優(yōu)化的模糊文本分類研究[J]. 梁艷紅,坎啟軒,蘇翌.  計(jì)算機(jī)工程. 2019(10)
[5]文本分類中一種特征選擇方法研究[J]. 趙婧,邵雄凱,劉建舟,王春枝.  計(jì)算機(jī)應(yīng)用研究. 2019(08)
[6]基于隱馬爾科夫模型與語義融合的文本分類[J]. 高知新,徐林會.  計(jì)算機(jī)應(yīng)用與軟件. 2017(07)
[7]基于機(jī)器學(xué)習(xí)的文本分類技術(shù)研究進(jìn)展[J]. 蘇金樹,張博鋒,徐昕.  軟件學(xué)報(bào). 2006(09)

碩士論文
[1]基于標(biāo)簽相關(guān)特征的多標(biāo)簽降維研究[D]. 李裕.合肥工業(yè)大學(xué) 2018
[2]中文多標(biāo)簽文本分類算法研究[D]. 周浩.上海交通大學(xué) 2014
[3]多標(biāo)簽文本分類算法研究[D]. 呂小勇.山西財(cái)經(jīng)大學(xué) 2010



本文編號:3205747

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3205747.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶881af***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com