天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

基于卷積神經(jīng)網(wǎng)絡(luò)的互聯(lián)網(wǎng)短文分類方法研究

發(fā)布時(shí)間:2018-02-15 05:43

  本文關(guān)鍵詞: 互聯(lián)網(wǎng)短文 文本分類 深度學(xué)習(xí) 卷積神經(jīng)網(wǎng)絡(luò) 出處:《中原工學(xué)院》2017年碩士論文 論文類型:學(xué)位論文


【摘要】:隨著互聯(lián)網(wǎng)的快速發(fā)展,以微信、QQ、貼吧、博客、微博等為主要代表的新型社交媒介的使用,使人類活動(dòng)已經(jīng)離不開虛擬世界網(wǎng)絡(luò)環(huán)境;ヂ(lián)網(wǎng)短文作為這些社交媒介產(chǎn)生數(shù)據(jù)的主要表現(xiàn)形式,如何從其中獲取有效信息且掌控其信息熱點(diǎn)是自然語言處理研究的重點(diǎn)內(nèi)容。而文本分類技術(shù)作為信息獲取的主要方式之一,在文本信息處理中有著重要的地位。在過去幾年中,深度學(xué)習(xí)在圖像處理、語音識(shí)別方面取得了很好效果,但在文本信息處理方面應(yīng)用較少。因此,本文以互聯(lián)網(wǎng)短文分類為應(yīng)用背景,使用深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行了分類研究。具體研究?jī)?nèi)容如下:(1)針對(duì)中文互聯(lián)網(wǎng)短文特點(diǎn),提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的互聯(lián)網(wǎng)短文分類方法,該方法由數(shù)據(jù)預(yù)處理、特征處理、分類識(shí)別等模塊組成。首先在數(shù)據(jù)預(yù)處理模塊中,本文對(duì)分詞、去噪聲進(jìn)行了優(yōu)化,并使用Word2vec詞向量和TF-IDF值構(gòu)造文本特征矩陣。接著在特征處理模塊中,使用了不同池化的不同類型的卷積神經(jīng)網(wǎng)絡(luò)處理文本低級(jí)特征。最后在分類識(shí)別模塊中,使用softmax函數(shù)進(jìn)行了文本分類識(shí)別操作。通過實(shí)驗(yàn)表明,使用Word2vec詞向量和TF-IDF值末尾疊加方式構(gòu)造文本特征矩陣,在最大池化下的動(dòng)態(tài)卷積神經(jīng)網(wǎng)絡(luò)對(duì)該矩陣進(jìn)行處理,可以得到比較好的互聯(lián)網(wǎng)短文分類效果。(2)使用上述卷積神經(jīng)網(wǎng)絡(luò)的分類方法與KNN、SVM、DBN等文本分類方法進(jìn)行互聯(lián)網(wǎng)短文的兩級(jí)分類實(shí)驗(yàn)。在建立一個(gè)有效的類別體系之后,抓取整理符合實(shí)驗(yàn)要求的數(shù)據(jù)。在相同的數(shù)據(jù)條件下,通過互聯(lián)網(wǎng)短文本的兩級(jí)分類實(shí)驗(yàn),得出了本文的卷積神經(jīng)網(wǎng)絡(luò)的分類方法能夠有效性的進(jìn)行互聯(lián)短文分類,相比其他方法分類效果更加穩(wěn)定性。
[Abstract]:With the rapid development of the Internet, such as WeChat, QQ, Post Bar, blogs, social media use the new micro-blog as the main representative, so that human activities have cannot do without the virtual world of network environment. The Internet as social media to produce these essays mainly in the form of data, how to get useful information and control the information focus is the focus of the content Natural Language Processing research from them. One of the main ways of text classification technology as access to information, plays an important role in text information processing. In the past few years, deep learning in image processing, speech recognition and achieved good results, but less in text information processing applications. Therefore, in this paper the Internet text classification as the application background, convolutional neural network method using deep learning are discussed. The specific contents are as follows: (1) according to the Chinese Internet The essay features, presents a short Internet classification method based on convolutional neural network, the method consists of data preprocessing, feature, classification and identification module. Firstly, in the data preprocessing module, based on word segmentation, noise is optimized, and the use of Word2vec vector and TF-IDF value to construct the text feature matrix. Then the characteristics of the processing module, the use of different pools of different types of convolutional neural network to process the text of low-level features in classification and identification module. Finally, the text classification operation using the softmax function. The experimental results show that the end of overlay method to construct the text feature matrix using Word2vec vector and TF-IDF value, the dynamic convolution neural network the maximum pool under the matrix, can get a better Internet text classification. (2) using the convolution neural network classification Methods with KNN, SVM, DBN and other Internet short text classification methods two classification experiment. After the establishment of an effective classification system, grasping finishing meet the test requirements of the data. The data in the same conditions, through the Internet short text two classification experiment, the classification method of convolutional neural network in this paper the Internet can verify the validity of the text classification, compared with other methods of classification effect is more stable.

【學(xué)位授予單位】:中原工學(xué)院
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.1;TP183

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 賀鳴;孫建軍;成穎;;基于樸素貝葉斯的文本分類研究綜述[J];情報(bào)科學(xué);2016年07期

2 劉紅光;馬雙剛;劉桂鋒;;基于降噪自動(dòng)編碼器的中文新聞文本分類方法研究[J];現(xiàn)代圖書情報(bào)技術(shù);2016年06期

3 鄧俊鋒;張曉龍;;基于自動(dòng)編碼器組合的深度學(xué)習(xí)優(yōu)化方法[J];計(jì)算機(jī)應(yīng)用;2016年03期

4 陳之彥;李曉杰;朱淑華;付丹龍;邢詒海;;基于Hash結(jié)構(gòu)詞典的雙向最大匹配分詞法[J];計(jì)算機(jī)科學(xué);2015年S2期

5 黃浩軍;王勝清;;一種基于維基百科的文本表示方法[J];計(jì)算機(jī)工程與應(yīng)用;2015年14期

6 馬海兵;畢久陽;郭新順;;文本分類方法在網(wǎng)絡(luò)輿情分析系統(tǒng)中的應(yīng)用研究[J];情報(bào)科學(xué);2015年05期

7 陳翠平;;基于深度信念網(wǎng)絡(luò)的文本分類算法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2015年02期

8 秦勝君;盧志平;;稀疏自動(dòng)編碼器在文本分類中的應(yīng)用研究[J];科學(xué)技術(shù)與工程;2013年31期

9 戚孝銘;施亮;;基于模擬退火及蜂群算法的優(yōu)化特征選擇算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2013年08期

10 莫建文;鄭陽;首照宇;張順嵐;;改進(jìn)的基于詞典的中文分詞方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2013年05期

相關(guān)碩士學(xué)位論文 前1條

1 江斌;微博自動(dòng)分類方法研究及應(yīng)用[D];哈爾濱工業(yè)大學(xué);2012年

,

本文編號(hào):1512563

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1512563.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e64a2***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com