基于半監(jiān)督學(xué)習(xí)的情感分類方法研究
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2初始標(biāo)注樣本5%時(shí)不同半肚$分類方法情啟分類性筑比較
3期高偉等:基于集成學(xué)習(xí)的半監(jiān)督情感分類方法研究算法流程參見3.2.1節(jié)。(3)LabelPropagation:標(biāo)簽傳播算法,具體算法流程參見3.2.2節(jié)。(4)我們的方法:對每個(gè)子半監(jiān)督學(xué)習(xí)算法進(jìn)行一致性標(biāo)簽融合,選擇標(biāo)注一致的未標(biāo)注樣本更新初始標(biāo)注樣本,即本文重點(diǎn)提出的方法....
圖2-1向量空間模型圖??文檔的向量空間表示的主要任務(wù)是為特征向量找到合適的編碼
?.)?=?(&.?:wu,...,g:ww.),其中;表示文檔中的特征,w表示特征對應(yīng)的權(quán)重。在??^維向量空間中,用特征項(xiàng)來代表坐標(biāo)系,特征權(quán)重(%,,...,>〇代表??坐標(biāo)值,因此,文檔d可以由《維數(shù)值特征向量OpWj,...,w?)表示,如圖2-1所??7Jn?〇??,....
圖2-2?SVM基本原理圖??假設(shè)給定訓(xùn)練樣本集合T?=?%),(x2,%),...,(%,}^)丨,其中x,+?ef,??
SVM是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的分類技術(shù),由Cortes和\^口11&[41]于1995??年提出。它的基本思想是試圖通過最大化最近鄰訓(xùn)練樣本與分離超平面的幾何間??隔找到最佳分離超平面?梢酝ㄟ^下圖2-2對SVM的算法原理有一個(gè)基本認(rèn)識(shí),??圖中正方形代表正例樣本,圓圈代表負(fù)例樣....
圖3-1初始比例為5%時(shí)各半監(jiān)督情感分類算法效果對比圖??-
Stratified?Co-training:本章提出的算法,其算法流程參考算法3-2,同樣設(shè)置??子空間個(gè)數(shù)為m=2。??圖3-1給出了在三種語料下各種半監(jiān)督學(xué)習(xí)算法的性能對比。具體實(shí)驗(yàn)時(shí),??初始標(biāo)注樣本的比例為5%,測試數(shù)據(jù)的比例為20%,剩下的為未標(biāo)注樣本。??〇.8?n....
本文編號(hào):3905693
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3905693.html