面向聚類(lèi)的堆疊降噪自動(dòng)編碼器的特征提取研究
本文關(guān)鍵詞:面向聚類(lèi)的堆疊降噪自動(dòng)編碼器的特征提取研究 出處:《現(xiàn)代計(jì)算機(jī)(專(zhuān)業(yè)版)》2016年33期 論文類(lèi)型:期刊論文
更多相關(guān)文章: 自動(dòng)編碼器 深度學(xué)習(xí) 特征提取 聚類(lèi)
【摘要】:為解決短文本聚類(lèi)時(shí)文本的高維稀疏性問(wèn)題,提出一種基于堆疊降噪自動(dòng)編碼器的短文本特征提取算法。該算法利用深度學(xué)習(xí)網(wǎng)絡(luò)形式,把多個(gè)降噪自動(dòng)編碼器網(wǎng)絡(luò)逐層堆疊起來(lái),將高維、稀疏的短文本空間向量變換到新的低維、本質(zhì)特征空間。實(shí)驗(yàn)結(jié)果表明,將提取的文本特征應(yīng)用于短文本聚類(lèi),顯著提高聚類(lèi)的效果。
【作者單位】: 鄭州輕工業(yè)學(xué)院計(jì)算機(jī)與通信工程學(xué)院;
【基金】:國(guó)家自然科學(xué)基金青年科學(xué)基金項(xiàng)目(No.61201447)
【分類(lèi)號(hào)】:TP391.1
【正文快照】: 0引言近年來(lái),隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展和移動(dòng)通信設(shè)備的廣泛普及,以微博、微信、BBS等形式的短文本數(shù)量以指數(shù)級(jí)增長(zhǎng)。短文本信息涵蓋多個(gè)領(lǐng)域,如經(jīng)濟(jì)、政治、文化等,為人們搜索數(shù)據(jù)提供了很大的數(shù)據(jù)來(lái)源,但由于短文本本身具有樣本數(shù)量多、詞頻單一、用詞不規(guī)范、特征稀疏等
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前4條
1 曲建嶺;杜辰飛;邸亞洲;高峰;郭超然;;深度自動(dòng)編碼器的研究與展望[J];計(jì)算機(jī)與現(xiàn)代化;2014年08期
2 秦勝君;盧志平;;基于降噪自動(dòng)編碼器的不平衡情感分類(lèi)研究[J];科學(xué)技術(shù)與工程;2014年12期
3 段寶彬;韓立新;;改進(jìn)的深度卷積網(wǎng)絡(luò)及在碎紙片拼接中的應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2014年09期
4 ;[J];;年期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前5條
1 梁湘群;基于Gabor特征與深度自動(dòng)編碼器的笑臉識(shí)別方法[D];五邑大學(xué);2015年
2 吳海燕;基于自動(dòng)編碼器的半監(jiān)督表示學(xué)習(xí)與分類(lèi)學(xué)習(xí)研究[D];重慶大學(xué);2015年
3 林雨;極限學(xué)習(xí)機(jī)與自動(dòng)編碼器的融合算法研究[D];吉林大學(xué);2016年
4 龐榮;深度神經(jīng)網(wǎng)絡(luò)算法研究及應(yīng)用[D];西南交通大學(xué);2016年
5 雒玉璽;稀疏自動(dòng)編碼器及其加速算法的研究[D];蘭州大學(xué);2014年
,本文編號(hào):1315778
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1315778.html