天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于受限玻爾茲曼機(jī)的分布式主題特征提取

發(fā)布時間:2018-06-23 14:29

  本文選題:文本數(shù)據(jù) + 概率主題模型。 參考:《計(jì)算機(jī)工程與應(yīng)用》2017年23期


【摘要】:隨著大數(shù)據(jù)時代的來臨,如何有效從海量的文本數(shù)據(jù)中挖掘和分析主題特征已成為學(xué)者們的研究重點(diǎn)。隱含狄利克雷分配(Latent Dirichlet Allocation,LDA)作為經(jīng)典的概率主題模型,因其自身優(yōu)越的文本分析能力被廣泛應(yīng)用。然而,該模型大多以包含隱含主題變量的有向圖的形式存在,實(shí)現(xiàn)文檔的表達(dá)具有局限性。而分布式表示方法定義文檔的語義分布在多個主題中并由多主題特征相乘得到;且由于傳統(tǒng)的無監(jiān)督特征提取模型無法有效處理含類別標(biāo)記的文檔數(shù)據(jù),故在研究受限玻爾茲曼機(jī)(Restricted Bolzmann Machine,RBM)的基礎(chǔ)上,結(jié)合文本主題的分布式特性,提出了基于RBM的分布式主題特征提取模型NRBM,其自身作為典型的半監(jiān)督模型能夠有效利用文檔中的多標(biāo)記信息。最終與標(biāo)準(zhǔn)LDA主題模型的對比實(shí)驗(yàn)證明了NRBM模型的優(yōu)越性。
[Abstract]:With the advent of the big data era, how to effectively mine and analyze the topic features from massive text data has become the research focus of scholars. Implicit Dirichlet allocation (LDA), as a classical probabilistic subject model, is widely used for its superior text analysis ability. However, most of the models exist in the form of digraphs containing implicit subject variables, and the realization of document representation is limited. The distributed representation method defines the semantic distribution of the document in multiple topics and multiplies the multi-topic features, and because the traditional unsupervised feature extraction model can not deal with the document data with class tags effectively. Therefore, based on the study of restricted Bolzmann Machine (RBM), this paper combines the distributed feature of text subject. A distributed topic feature extraction model (NRBM) based on RBM is proposed. As a typical semi-supervised model, NRBM can effectively utilize multi-tag information in documents. Finally, the NRBM model is proved to be superior in comparison with the standard LDA thematic model.
【作者單位】: 安徽工業(yè)大學(xué)管理科學(xué)與工程學(xué)院;
【基金】:國家自然科學(xué)基金(No.71172219) 安徽省自然科學(xué)研究項(xiàng)目省級重點(diǎn)項(xiàng)目(No.KJ2011Z039)
【分類號】:TP391.1

【相似文獻(xiàn)】

相關(guān)碩士學(xué)位論文 前8條

1 葉睿;基于深度學(xué)習(xí)的人臉檢測方法研究[D];哈爾濱工業(yè)大學(xué);2015年

2 張衛(wèi)東;深度信念網(wǎng)絡(luò)及其在手寫字體識別中的應(yīng)用[D];成都理工大學(xué);2015年

3 施維劏;門限玻爾茲曼機(jī)在人臉識別中的魯棒性研究[D];北京交通大學(xué);2015年

4 李亦錟;受限的玻爾茲曼機(jī)在背景建模和文本建模中的研究與應(yīng)用[D];中國科學(xué)技術(shù)大學(xué);2016年

5 董時靜;全局形狀與局部一致性聯(lián)合建模的顯著性檢測[D];大連理工大學(xué);2016年

6 孫園欽;基于Theano深度學(xué)習(xí)框架的圖像識別算法研究[D];吉林大學(xué);2017年

7 仝少敏;基于受限玻爾茲曼機(jī)的面部運(yùn)動識別方法研究[D];哈爾濱工業(yè)大學(xué);2014年

8 李平;監(jiān)督概率主題模型研究[D];安徽工業(yè)大學(xué);2014年

,

本文編號:2057433

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2057433.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5a40e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com