天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

面向遷移學(xué)習(xí)的文本特征對(duì)齊算法

發(fā)布時(shí)間:2018-07-31 14:47
【摘要】:源領(lǐng)域和目標(biāo)領(lǐng)域特征空間的不一致導(dǎo)致遷移學(xué)習(xí)準(zhǔn)確率下降。為此,提出一種基于Word2Vec的不同領(lǐng)域特征對(duì)齊算法。只選取形容詞、副詞、名詞、動(dòng)詞作為特征,針對(duì)每種詞性,選擇源領(lǐng)域和目標(biāo)領(lǐng)域的樞紐特征,分別在源領(lǐng)域和目標(biāo)領(lǐng)域?yàn)樵摌屑~特征計(jì)算出與之語(yǔ)義相似度最大的非樞紐特征,將其作為相似樞紐特征,從而為每個(gè)樞紐特征構(gòu)成一個(gè)相似樞紐特征對(duì)。將出現(xiàn)在這些領(lǐng)域中的每一個(gè)相似樞紐特征按照樞紐特征對(duì)進(jìn)行特征替換,從而將不同領(lǐng)域語(yǔ)義相似的特征進(jìn)行對(duì)齊,并在特征替換后的源領(lǐng)域和目標(biāo)領(lǐng)域數(shù)據(jù)上進(jìn)行機(jī)器學(xué)習(xí)。實(shí)驗(yàn)結(jié)果表明,該算法的平均分類(lèi)精度達(dá)到88.2%,高于Baseline算法。
[Abstract]:The inconsistency of feature space between source domain and target domain leads to the reduction of migration learning accuracy. For this reason, a new feature alignment algorithm for different domains based on Word2Vec is proposed. Only adjectives, adverbs, nouns and verbs are selected as the characteristics, and for each part of speech, the pivotal features of the source and target fields are selected. The non-hub features with the greatest semantic similarity are calculated in the source domain and the target domain, respectively, which are regarded as similar hub features, so as to form a similar hub feature pair for each hub feature. Each similar hub feature that appears in these domains is replaced by a feature pair of hub features to align the semantic similarity features of different domains, Machine learning is carried out on the source and target domain data after feature replacement. The experimental results show that the average classification accuracy of this algorithm is 88. 2%, which is higher than that of Baseline algorithm.
【作者單位】: 大連理工大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;大連外國(guó)語(yǔ)大學(xué)軟件學(xué)院;
【基金】:國(guó)家自然科學(xué)基金(61572102,61562080) 大連外國(guó)語(yǔ)大學(xué)科研基金(2014XJQN14)
【分類(lèi)號(hào)】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前4條

1 賴(lài)清楠;馬皓;宋維佳;李婷婷;蔣廣學(xué);張蓓;;高校BBS與微博的用戶(hù)社交行為特征分析[J];通信學(xué)報(bào);2013年S2期

2 衣麗霞;王輝;籍曉紅;;情感分析中極性副詞的自動(dòng)擴(kuò)展[J];計(jì)算機(jī)應(yīng)用研究;2013年07期

3 鄭誠(chéng);楊希;張吉賡;;結(jié)合情感詞典與規(guī)則的微博情感極性分類(lèi)方法[J];電腦知識(shí)與技術(shù);2014年13期

4 ;[J];;年期

相關(guān)碩士學(xué)位論文 前1條

1 梁東旭;基于產(chǎn)品評(píng)論的垃圾評(píng)論者檢測(cè)方法[D];大連理工大學(xué);2014年

,

本文編號(hào):2155922

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2155922.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)f4995***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com