基于實例與邏輯回歸的多標(biāo)簽分類模型
發(fā)布時間:2021-08-17 19:10
進(jìn)入大數(shù)據(jù)時代,如何有效利用這些數(shù)據(jù)成為迫切需要解決的問題,分類是最常見的任務(wù)之一。其中一種比較特殊的情況是一個樣本具有多個標(biāo)簽的分類問題,即多標(biāo)簽分類問題。隨著相關(guān)研究的不斷深入,多標(biāo)簽分類的重要程度及其應(yīng)用價值已逐步顯現(xiàn)出來。目前,人們通過與各種學(xué)習(xí)技術(shù)相結(jié)合,提出了很多不同類型的多標(biāo)簽分類模型。盡管如此,標(biāo)簽之間的相關(guān)性、模型的優(yōu)化問題認(rèn)識仍然不夠深入。本文針對該問題設(shè)計了一種基于實例和邏輯回歸的多標(biāo)簽分類模型;趯嵗膶W(xué)習(xí)是從鄰居的角度出發(fā),從距離它最近的K個鄰居處獲得參考信息。然后將從鄰居處獲得信息與其它額外特征相結(jié)合,構(gòu)造邏輯回歸模型,也就是將基于實例的學(xué)習(xí)方法與邏輯回歸方法相結(jié)合。這一模型在基于實例的學(xué)習(xí)過程中考慮了局部最優(yōu)性,在構(gòu)造邏輯回歸模型過程中考慮了全局最優(yōu)性和標(biāo)簽之間的相關(guān)性,有效地提高了模型的性能。在實驗部分,本文首先總結(jié)了一些被廣泛采用多標(biāo)簽分類算法的評價標(biāo)準(zhǔn),然后基于電子商務(wù)應(yīng)用進(jìn)行實驗,最后就結(jié)果與現(xiàn)有的一些多標(biāo)簽分類模型進(jìn)行了比較。
【文章來源】:南京大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:30 頁
【學(xué)位級別】:碩士
【部分圖文】:
隨機(jī)游走圖
【參考文獻(xiàn)】:
期刊論文
[1]利用最近鄰信息快速分類多標(biāo)簽數(shù)據(jù)[J]. 喬健,田慶. 計算機(jī)工程與應(yīng)用. 2011(32)
[2]一種基于隨機(jī)游走模型的多標(biāo)簽分類算法[J]. 鄭偉,王朝坤,劉璋,王建民. 計算機(jī)學(xué)報. 2010(08)
[3]多標(biāo)簽分類器準(zhǔn)確性評估方法的研究[J]. 秦鋒,黃俊,程澤凱,楊帆. 計算機(jī)技術(shù)與發(fā)展. 2010(01)
[4]基于機(jī)器學(xué)習(xí)的文本分類技術(shù)研究進(jìn)展[J]. 蘇金樹,張博鋒,徐昕. 軟件學(xué)報. 2006(09)
本文編號:3348329
【文章來源】:南京大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:30 頁
【學(xué)位級別】:碩士
【部分圖文】:
隨機(jī)游走圖
【參考文獻(xiàn)】:
期刊論文
[1]利用最近鄰信息快速分類多標(biāo)簽數(shù)據(jù)[J]. 喬健,田慶. 計算機(jī)工程與應(yīng)用. 2011(32)
[2]一種基于隨機(jī)游走模型的多標(biāo)簽分類算法[J]. 鄭偉,王朝坤,劉璋,王建民. 計算機(jī)學(xué)報. 2010(08)
[3]多標(biāo)簽分類器準(zhǔn)確性評估方法的研究[J]. 秦鋒,黃俊,程澤凱,楊帆. 計算機(jī)技術(shù)與發(fā)展. 2010(01)
[4]基于機(jī)器學(xué)習(xí)的文本分類技術(shù)研究進(jìn)展[J]. 蘇金樹,張博鋒,徐昕. 軟件學(xué)報. 2006(09)
本文編號:3348329
本文鏈接:http://sikaile.net/shekelunwen/ljx/3348329.html
最近更新
教材專著