基于混合深度信念網(wǎng)絡(luò)的多類文本表示與分類方法
本文關(guān)鍵詞:基于混合深度信念網(wǎng)絡(luò)的多類文本表示與分類方法
更多相關(guān)文章: 文本分類 文本表示 深度學(xué)習(xí) 深度信念網(wǎng)絡(luò)
【摘要】:本文開展了基于混合深度信念網(wǎng)絡(luò)的多類文本表示與分類方法的研究,以解決傳統(tǒng)的Bag-ofWords(BOW)表示方法忽略文本語義信息、特征提取存在高維度高稀疏的問題。文章基于文本關(guān)鍵字,針對(duì)多類的分類任務(wù)(如新聞文本和生物醫(yī)學(xué)文本),以關(guān)鍵字的詞向量表示作為文本輸入,同時(shí)結(jié)合深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)和深度玻爾茲曼機(jī)網(wǎng)絡(luò)(Deep Boltzmann Machine,DBM),設(shè)計(jì)了一種混合深度信念網(wǎng)絡(luò)(Hybrid Deep Belief Network,HDBN)模型。文本分類和文本檢索的實(shí)驗(yàn)結(jié)果表明,基于詞向量嵌入的深度學(xué)習(xí)模型在性能上優(yōu)于傳統(tǒng)方法。此外,通過二維空間可視化實(shí)驗(yàn),由HDBN模型提取的高層文本表示具有高內(nèi)聚低耦合的特點(diǎn)。
【作者單位】: 北京科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系;中國(guó)礦業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系;
【關(guān)鍵詞】: 文本分類 文本表示 深度學(xué)習(xí) 深度信念網(wǎng)絡(luò)
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目:結(jié)合前饋和反饋機(jī)制的自然場(chǎng)景文本識(shí)別技術(shù)(61473036)資助
【分類號(hào)】:TP391.1
【正文快照】: 1研究背景更好得挖掘蘊(yùn)含在文本中的復(fù)雜語義關(guān)系,與具體任務(wù)緊密結(jié)合。同時(shí),伴隨互聯(lián)網(wǎng)規(guī)模的擴(kuò)張?jiān)凇靶畔⑦^載”時(shí)代,如何有效地管理、過和多媒體的發(fā)展,大規(guī)模訓(xùn)練數(shù)據(jù)以及機(jī)器設(shè)備濾和篩選信息成為一項(xiàng)重要的研究課題。在網(wǎng)絡(luò)性能的重大提升,高性能GPU和CPU集群提供信息中
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前10條
1 彭佳;;另一種文本中心——回應(yīng)尤里·洛特曼的文本觀[J];符號(hào)與傳媒;2011年02期
2 王霞;;巧將文本數(shù)值變?yōu)閿?shù)字[J];科學(xué)24小時(shí);2006年09期
3 孫艷妙;CSS樣式在Flash MX 2004中的應(yīng)用[J];中小學(xué)電教;2005年08期
4 尤里·M·洛特曼;彭佳;;文本運(yùn)動(dòng)過程——從作者到讀者,從作者到文本[J];符號(hào)與傳媒;2011年02期
5 薛笛;;打造多彩的文本[J];程序員;2006年03期
6 劉全升;姚天f ;黃高輝;劉軍;宋鴻彥;;漢語意見型主觀性文本類型體系的研究[J];中文信息學(xué)報(bào);2008年06期
7 陳立強(qiáng);;論電視頻道自文本導(dǎo)讀系統(tǒng)及其功能[J];新聞知識(shí);2008年02期
8 許延祥;羅鐵堅(jiān);周佳;王竹;;評(píng)價(jià)文本中意見分布規(guī)律研究[J];中文信息學(xué)報(bào);2014年03期
9 牛可剛;;在物理課件中讓文本滾動(dòng)起來[J];實(shí)驗(yàn)教學(xué)與儀器;2005年04期
10 陳立強(qiáng);張宜遷;;電視導(dǎo)讀的多媒介聯(lián)動(dòng)現(xiàn)象及其意義[J];中國(guó)廣播電視學(xué)刊;2008年08期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫 前4條
1 張智軍;沈f ;朱偉;;文本組織方式對(duì)介紹性文章搜索績(jī)效的影響研究[A];中國(guó)人類工效學(xué)學(xué)會(huì)第六次學(xué)術(shù)交流會(huì)論文摘要匯編[C];2003年
2 岳福新;白玫;;淺析英語旅游信息文本的寫作與翻譯[A];譯學(xué)辭典與翻譯研究——第四屆全國(guó)翻譯學(xué)辭典與翻譯理論研討會(huì)論文集[C];2007年
3 劉全升;姚天f ;黃高輝;劉軍;宋鴻彥;;漢語意見型主觀性文本類型體系的研究[A];第四屆全國(guó)學(xué)生計(jì)算語言學(xué)研討會(huì)會(huì)議論文集[C];2008年
4 程世和;;“《詩》亡然后《春秋》作”——對(duì)一個(gè)文學(xué)缺失時(shí)代的文學(xué)反題之研究[A];東方叢刊(2004年第4輯 總第五十輯)[C];2004年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫 前8條
1 李承貴;學(xué)術(shù)視域中的文本[N];社會(huì)科學(xué)報(bào);2001年
2 山東 王霞;巧將文本數(shù)值變數(shù)字[N];電子報(bào);2006年
3 江蘇 許向前;在課件中讓文本滾動(dòng)起來[N];電腦報(bào);2004年
4 遼寧 鳴澗;為光盤制作漂亮的封套[N];電腦報(bào);2002年
5 ;制作CD封套[N];電腦報(bào);2002年
6 廣東 Pcking;FlashMX 2004新功能實(shí)戰(zhàn)[N];電腦報(bào);2003年
7 王先明 李尹蒂;關(guān)于義和團(tuán)各種記憶文本類型比較[N];團(tuán)結(jié)報(bào);2010年
8 編譯 李茂;美國(guó)統(tǒng)一課程標(biāo)準(zhǔn)定稿[N];中國(guó)教師報(bào);2010年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫 前8條
1 閆琰;基于深度學(xué)習(xí)的文本表示與分類方法研究[D];北京科技大學(xué);2016年
2 劉健;基于近似文本分析的意見挖掘[D];上海大學(xué);2007年
3 陳潔倩;閱讀理解的文本類型和答題形式對(duì)外語水平的效力[D];上海外國(guó)語大學(xué);2006年
4 劉桂蘭;論重譯的世俗化取向[D];上海外國(guó)語大學(xué);2011年
5 段瑞雪;基于依存關(guān)系的用戶意圖的研究[D];北京郵電大學(xué);2011年
6 周順先;文本信息抽取模型及算法研究[D];湖南大學(xué);2007年
7 孟朋;自然語言信息隱藏與檢測(cè)研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年
8 黃永文;中文產(chǎn)品評(píng)論挖掘關(guān)鍵技術(shù)研究[D];重慶大學(xué);2009年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王愛;《與魯本·伍爾夫一起戰(zhàn)斗》翻譯實(shí)踐報(bào)告[D];內(nèi)蒙古大學(xué);2015年
2 張曉葉;文本類型視角下《2011年經(jīng)濟(jì)合作與發(fā)展組織對(duì)醫(yī)療系統(tǒng)的審核:瑞士》的翻譯報(bào)告[D];華南理工大學(xué);2015年
3 鐘超瑋;基于區(qū)間的文本相似搜索及其在檔案清洗中的應(yīng)用[D];南京大學(xué);2015年
4 張新宇;目的論視角下經(jīng)濟(jì)類文本的漢譯[D];蘭州大學(xué);2015年
5 拓華;等效論指導(dǎo)下生態(tài)批評(píng)文本的翻譯探索[D];蘭州大學(xué);2015年
6 薄璐璐;經(jīng)濟(jì)史文本漢譯技巧研究[D];蘭州大學(xué);2015年
7 姚南;從目的論視角看說明書的英漢翻譯[D];華中師范大學(xué);2015年
8 趙琴;文本類型理論視角下中國(guó)國(guó)防白皮書的英譯[D];華中師范大學(xué);2015年
9 張琴;文本類型理論視角下的科技論文摘要英譯[D];南京理工大學(xué);2015年
10 李丹卉;《當(dāng)今的生活規(guī)劃—德國(guó)年輕人想要如何生活》節(jié)譯報(bào)告[D];四川外國(guó)語大學(xué);2015年
,本文編號(hào):912770
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/912770.html