天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于半監(jiān)督學(xué)習(xí)的情感分類方法研究

發(fā)布時(shí)間:2024-02-21 16:37
  隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,越來越多的用戶熱衷于在網(wǎng)絡(luò)上對產(chǎn)品、服務(wù)、時(shí)事等發(fā)表評論。如果能自動(dòng)挖掘出這些主觀性文本中蘊(yùn)含的情感傾向,對個(gè)人、企業(yè)、政府等有著巨大的應(yīng)用價(jià)值和經(jīng)濟(jì)價(jià)值。文本情感分類技術(shù)正是解決這一問題最有效的工具。半監(jiān)督學(xué)習(xí)作為一種普適性的機(jī)器學(xué)習(xí)技術(shù),能夠充分利用未標(biāo)注樣本提升分類性能。針對文本情感分類很多場景面臨標(biāo)注語料不足、而標(biāo)注樣本費(fèi)時(shí)費(fèi)力的情況,本文主要圍繞半監(jiān)督學(xué)習(xí)情感分類展開研究。本文主要?jiǎng)?chuàng)新點(diǎn)如下:一、本文提出了基于分層抽樣隨機(jī)子空間的協(xié)同訓(xùn)練情感分類算法。該算法采用分層抽樣的方法構(gòu)建子空間,改進(jìn)了將隨機(jī)特征子空間半監(jiān)督學(xué)習(xí)算法直接應(yīng)用于文本情感分類中可能會(huì)存在部分子空間不包含強(qiáng)相關(guān)屬性的缺點(diǎn),算法在確保子空間多樣性的前提下,有效提升了每個(gè)子空間的充分性。實(shí)驗(yàn)表明,本文算法的分類效果要優(yōu)于基于隨機(jī)特征子空間的半監(jiān)督學(xué)習(xí)算法以及其他部分常用的半監(jiān)督學(xué)習(xí)算法。二、本文提出了基于多樣性與高置信度估計(jì)的半監(jiān)督情感分類算法。該算法結(jié)合樣本的后驗(yàn)概率和先驗(yàn)分布信息,改善了增量式自訓(xùn)練算法在迭代訓(xùn)練的過程中易引入誤標(biāo)記樣本的問題。其次,為了避免引入的樣本分布集中會(huì)造成數(shù)...

【文章頁數(shù)】:70 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖2初始標(biāo)注樣本5%時(shí)不同半肚$分類方法情啟分類性筑比較

圖2初始標(biāo)注樣本5%時(shí)不同半肚$分類方法情啟分類性筑比較

3期高偉等:基于集成學(xué)習(xí)的半監(jiān)督情感分類方法研究算法流程參見3.2.1節(jié)。(3)LabelPropagation:標(biāo)簽傳播算法,具體算法流程參見3.2.2節(jié)。(4)我們的方法:對每個(gè)子半監(jiān)督學(xué)習(xí)算法進(jìn)行一致性標(biāo)簽融合,選擇標(biāo)注一致的未標(biāo)注樣本更新初始標(biāo)注樣本,即本文重點(diǎn)提出的方法....


圖2-1向量空間模型圖??文檔的向量空間表示的主要任務(wù)是為特征向量找到合適的編碼

圖2-1向量空間模型圖??文檔的向量空間表示的主要任務(wù)是為特征向量找到合適的編碼

?.)?=?(&.?:wu,...,g:ww.),其中;表示文檔中的特征,w表示特征對應(yīng)的權(quán)重。在??^維向量空間中,用特征項(xiàng)來代表坐標(biāo)系,特征權(quán)重(%,,...,>〇代表??坐標(biāo)值,因此,文檔d可以由《維數(shù)值特征向量OpWj,...,w?)表示,如圖2-1所??7Jn?〇??,....


圖2-2?SVM基本原理圖??假設(shè)給定訓(xùn)練樣本集合T?=?%),(x2,%),...,(%,}^)丨,其中x,+?ef,??

圖2-2?SVM基本原理圖??假設(shè)給定訓(xùn)練樣本集合T?=?%),(x2,%),...,(%,}^)丨,其中x,+?ef,??

SVM是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的分類技術(shù),由Cortes和\^口11&[41]于1995??年提出。它的基本思想是試圖通過最大化最近鄰訓(xùn)練樣本與分離超平面的幾何間??隔找到最佳分離超平面?梢酝ㄟ^下圖2-2對SVM的算法原理有一個(gè)基本認(rèn)識(shí),??圖中正方形代表正例樣本,圓圈代表負(fù)例樣....


圖3-1初始比例為5%時(shí)各半監(jiān)督情感分類算法效果對比圖??-

圖3-1初始比例為5%時(shí)各半監(jiān)督情感分類算法效果對比圖??-

Stratified?Co-training:本章提出的算法,其算法流程參考算法3-2,同樣設(shè)置??子空間個(gè)數(shù)為m=2。??圖3-1給出了在三種語料下各種半監(jiān)督學(xué)習(xí)算法的性能對比。具體實(shí)驗(yàn)時(shí),??初始標(biāo)注樣本的比例為5%,測試數(shù)據(jù)的比例為20%,剩下的為未標(biāo)注樣本。??〇.8?n....



本文編號(hào):3905693

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3905693.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d6a78***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com
麻豆国产精品一区二区| 丝袜视频日本成人午夜视频 | 国产传媒高清视频在线| 日韩欧美三级视频在线| 高清不卡视频在线观看| 亚洲专区中文字幕在线| 亚洲精品国产主播一区| 亚洲内射人妻一区二区| 亚洲欧美黑人一区二区| 中文字幕日韩欧美理伦片| 午夜福利视频偷拍91| 五月综合婷婷在线伊人| 91人妻人人揉人人澡人| 久久一区内射污污内射亚洲| 熟女高潮一区二区三区| 男人的天堂的视频东京热| 久久精品蜜桃一区二区av| 成人国产一区二区三区精品麻豆| 亚洲少妇人妻一区二区| 免费人妻精品一区二区三区久久久| 国产欧美日韩综合精品二区| 久久精品国产亚洲av麻豆尤物| 欧美日韩国产欧美日韩| 国产内射一级一片内射高清| 国产精品视频一级香蕉| 超碰在线播放国产精品| 福利新区一区二区人口| 亚洲中文字幕人妻系列| 欧美偷拍一区二区三区四区| 亚洲国产综合久久天堂| 日本加勒比在线播放一区| 日本加勒比系列在线播放| 日韩精品福利在线观看| 国产在线一区二区三区不卡| 免费观看成人免费视频| 国产成人精品一区在线观看| 色偷偷偷拍视频在线观看| 国产精品免费视频久久| 一区二区三区国产日韩| 中文字幕日韩无套内射| 天堂av一区一区一区|