天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

基于深度學(xué)習(xí)的新聞實(shí)時(shí)分類服務(wù)系統(tǒng)的分析與設(shè)計(jì)

發(fā)布時(shí)間:2024-05-13 21:58
  當(dāng)今處在互聯(lián)網(wǎng)高度發(fā)展時(shí)期,各種信息以狂轟亂炸的形式撲面而來,而信息的載體大部分是文字的形式,如何從海量文本中獲取有用的信息成為現(xiàn)代科技工作者研究的一個(gè)大的方向,也是自然語言處理領(lǐng)域研究的關(guān)鍵問題,從而推進(jìn)了文本分類技術(shù)的高速發(fā)展。近幾年,隨著圖像領(lǐng)域中深度學(xué)習(xí)的快速發(fā)展,人們也開始將深度學(xué)習(xí)引入到文本處理中,所以深度學(xué)習(xí)逐漸取代傳統(tǒng)的機(jī)器學(xué)習(xí)方法成為文本分類領(lǐng)域的主流研究方法。因?yàn)樯疃葘W(xué)習(xí)以其獨(dú)特的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)能夠?qū)訉犹崛『Y選出更多更好的文字特征信息,可以很好的解決當(dāng)前文本分類所面臨的瓶頸問題,本文就是依據(jù)深度學(xué)習(xí)的思想設(shè)計(jì)了一款對(duì)新聞文本進(jìn)行實(shí)時(shí)分類的服務(wù)系統(tǒng)。首先,本文對(duì)文本分類的一般流程以及傳統(tǒng)機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)方法在新聞文本分類中的區(qū)別進(jìn)行陳述。采用字符級(jí)字向量進(jìn)行文檔特征的表示,該表示方法可有效解決離散式字向量表示得到的文檔特征上下文文本語義丟失的問題。針對(duì)于新浪新聞?wù)Z料庫,采用三種神經(jīng)網(wǎng)絡(luò)算法(卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、fastText淺層神經(jīng)網(wǎng)絡(luò))進(jìn)行新聞分類實(shí)驗(yàn)效果的對(duì)比,并結(jié)合網(wǎng)絡(luò)模型的結(jié)構(gòu),分析其各自在進(jìn)行新聞文本分類時(shí)的優(yōu)缺點(diǎn)。其次,本文在上述研究的基礎(chǔ)上...

【文章頁數(shù)】:67 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖1-1機(jī)器學(xué)習(xí)文本分類過程

圖1-1機(jī)器學(xué)習(xí)文本分類過程

碩士學(xué)位論文基于深度學(xué)習(xí)的新聞實(shí)時(shí)分類服務(wù)系統(tǒng)的分析OOST[15])等。但這些分類器的效果還是嚴(yán)重依賴于之前的詞向量特分布式詞向量提出到現(xiàn)在,基于深度學(xué)習(xí)的文本分類模型已經(jīng)展現(xiàn)強(qiáng)大的優(yōu)勢,在多種文本數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果都要優(yōu)于傳統(tǒng)的分類卷積神經(jīng)網(wǎng)絡(luò)CNN[16]還是長短記憶網(wǎng)....


圖1-2深度學(xué)習(xí)文本分類過程

圖1-2深度學(xué)習(xí)文本分類過程

碩士學(xué)位論文基于深度學(xué)習(xí)的新聞實(shí)時(shí)分類服務(wù)系統(tǒng)T[15])等。但這些分類器的效果還是嚴(yán)重依賴于之前的詞向量式詞向量提出到現(xiàn)在,基于深度學(xué)習(xí)的文本分類模型已經(jīng)展大的優(yōu)勢,在多種文本數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果都要優(yōu)于傳統(tǒng)的積神經(jīng)網(wǎng)絡(luò)CNN[16]還是長短記憶網(wǎng)絡(luò)LSTM[17]及其變體....


圖2-1NNLM網(wǎng)絡(luò)結(jié)構(gòu)圖

圖2-1NNLM網(wǎng)絡(luò)結(jié)構(gòu)圖

詞、文檔進(jìn)行更本質(zhì)的表達(dá)。這也是LSA的優(yōu)點(diǎn),可以在有限利用文本語義信息的同時(shí),大大降低計(jì)算的代價(jià),有效的提高了分析的效果。LSA非常依賴語料庫的大小,對(duì)內(nèi)容較多與篇幅較長的文本很適用;谏窠(jīng)網(wǎng)絡(luò)的詞向量分布式表示法也稱WordEmbedding(詞嵌入),它是以n....


圖2-2CBOW結(jié)構(gòu)圖

圖2-2CBOW結(jié)構(gòu)圖

碩士學(xué)位論文基于深度學(xué)習(xí)的新聞實(shí)時(shí)分類服務(wù)系統(tǒng)的模型。word2vec的實(shí)現(xiàn)方法有兩種形式,下面分別介紹續(xù)詞袋模型(ContinuousBag-of-WordsModel,可記為CBOWp-gram)。WW的結(jié)構(gòu)如圖2-2所示,對(duì)比圖2-1,可看出大概的網(wǎng)絡(luò)結(jié)構(gòu)....



本文編號(hào):3972772

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3972772.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶92204***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com