基于實例與邏輯回歸的多標簽分類模型
發(fā)布時間:2021-08-17 19:10
進入大數(shù)據(jù)時代,如何有效利用這些數(shù)據(jù)成為迫切需要解決的問題,分類是最常見的任務之一。其中一種比較特殊的情況是一個樣本具有多個標簽的分類問題,即多標簽分類問題。隨著相關研究的不斷深入,多標簽分類的重要程度及其應用價值已逐步顯現(xiàn)出來。目前,人們通過與各種學習技術(shù)相結(jié)合,提出了很多不同類型的多標簽分類模型。盡管如此,標簽之間的相關性、模型的優(yōu)化問題認識仍然不夠深入。本文針對該問題設計了一種基于實例和邏輯回歸的多標簽分類模型;趯嵗膶W習是從鄰居的角度出發(fā),從距離它最近的K個鄰居處獲得參考信息。然后將從鄰居處獲得信息與其它額外特征相結(jié)合,構(gòu)造邏輯回歸模型,也就是將基于實例的學習方法與邏輯回歸方法相結(jié)合。這一模型在基于實例的學習過程中考慮了局部最優(yōu)性,在構(gòu)造邏輯回歸模型過程中考慮了全局最優(yōu)性和標簽之間的相關性,有效地提高了模型的性能。在實驗部分,本文首先總結(jié)了一些被廣泛采用多標簽分類算法的評價標準,然后基于電子商務應用進行實驗,最后就結(jié)果與現(xiàn)有的一些多標簽分類模型進行了比較。
【文章來源】:南京大學江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:30 頁
【學位級別】:碩士
【部分圖文】:
隨機游走圖
【參考文獻】:
期刊論文
[1]利用最近鄰信息快速分類多標簽數(shù)據(jù)[J]. 喬健,田慶. 計算機工程與應用. 2011(32)
[2]一種基于隨機游走模型的多標簽分類算法[J]. 鄭偉,王朝坤,劉璋,王建民. 計算機學報. 2010(08)
[3]多標簽分類器準確性評估方法的研究[J]. 秦鋒,黃俊,程澤凱,楊帆. 計算機技術(shù)與發(fā)展. 2010(01)
[4]基于機器學習的文本分類技術(shù)研究進展[J]. 蘇金樹,張博鋒,徐昕. 軟件學報. 2006(09)
本文編號:3348329
【文章來源】:南京大學江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:30 頁
【學位級別】:碩士
【部分圖文】:
隨機游走圖
【參考文獻】:
期刊論文
[1]利用最近鄰信息快速分類多標簽數(shù)據(jù)[J]. 喬健,田慶. 計算機工程與應用. 2011(32)
[2]一種基于隨機游走模型的多標簽分類算法[J]. 鄭偉,王朝坤,劉璋,王建民. 計算機學報. 2010(08)
[3]多標簽分類器準確性評估方法的研究[J]. 秦鋒,黃俊,程澤凱,楊帆. 計算機技術(shù)與發(fā)展. 2010(01)
[4]基于機器學習的文本分類技術(shù)研究進展[J]. 蘇金樹,張博鋒,徐昕. 軟件學報. 2006(09)
本文編號:3348329
本文鏈接:http://sikaile.net/shekelunwen/ljx/3348329.html
最近更新
教材專著