天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

基于深度學(xué)習(xí)的網(wǎng)絡(luò)熱點(diǎn)話題推薦研究

發(fā)布時(shí)間:2024-05-12 18:45
  隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展和全球化普及,網(wǎng)民規(guī)模不斷擴(kuò)大,網(wǎng)絡(luò)也成為網(wǎng)民獲取信息的重要平臺(tái)。新聞文本信息呈爆炸式的涌現(xiàn)在網(wǎng)絡(luò)上,因此從大量冗余的文本信息中提取出有價(jià)值的信息已成為當(dāng)前計(jì)算機(jī)領(lǐng)域中的一項(xiàng)重要研究?jī)?nèi)容。如果僅靠人工處理這些雜亂無章的輿情數(shù)據(jù),不僅會(huì)增加工作量,而且準(zhǔn)確程度也會(huì)由于受主觀意識(shí)的影響而降低。基于上述研究背景,本文對(duì)熱點(diǎn)話題推薦研究的出發(fā)點(diǎn)是:如何從海量的、種類多樣的信息中迅速發(fā)現(xiàn)目前最熱門、網(wǎng)絡(luò)平臺(tái)討論最多的話題推薦展示給網(wǎng)民。傳統(tǒng)的熱點(diǎn)話題研究方法不僅需要對(duì)數(shù)據(jù)集進(jìn)行人工標(biāo)注,而且在大數(shù)據(jù)集下容易出現(xiàn)維度災(zāi)難的問題。近年來深度學(xué)習(xí)作為前沿領(lǐng)域與多學(xué)科融合并取得眾多突破,在自然語言處理領(lǐng)域上的運(yùn)用也為網(wǎng)絡(luò)熱點(diǎn)話題推薦帶來了新的解決思路。本文主要工作內(nèi)容如下:對(duì)于傳統(tǒng)語言模型無法避免在詞語向量化的過程中忽略主要信息以及無法結(jié)合整體內(nèi)容進(jìn)行文本分析的問題,本文結(jié)合卷積神經(jīng)網(wǎng)絡(luò)通過卷積核上下滑動(dòng)提取文本特征的特點(diǎn),設(shè)計(jì)了基于卷積神經(jīng)網(wǎng)絡(luò)的詞特征文本表示方法。本文使用Word2Vec預(yù)訓(xùn)練語言模型實(shí)現(xiàn)詞向量的轉(zhuǎn)化,并引入TF-IDF算法增強(qiáng)文本特征,最后通過卷積神經(jīng)網(wǎng)絡(luò)實(shí)...

【文章頁數(shù)】:55 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖2.1文本空間向量表示圖

圖2.1文本空間向量表示圖

沈陽工業(yè)大學(xué)碩士學(xué)位論文82.3文本特征表示文本特征表示就是將自然語言的數(shù)據(jù)信息根據(jù)一定規(guī)則轉(zhuǎn)化為可供計(jì)算機(jī)識(shí)別的數(shù)字化表示。文本特征表示是自然語言處理的核心技術(shù),目前被廣泛應(yīng)用在文本相似度分析、文本分類、文本聚類等眾多領(lǐng)域并取得良好的成績(jī)和發(fā)展。大多數(shù)針對(duì)熱點(diǎn)話題發(fā)現(xiàn)研究中通過....


圖2.2LDA模型向量矩陣圖

圖2.2LDA模型向量矩陣圖

沈陽工業(yè)大學(xué)碩士學(xué)位論文10含多個(gè)主題詞,因此主題模型會(huì)自動(dòng)分析每個(gè)文檔,統(tǒng)計(jì)文檔內(nèi)的詞語,根據(jù)統(tǒng)計(jì)的信息來斷定當(dāng)前文檔含有哪些主題,以及每個(gè)主題所占的比例各為多少[18]。主題模型從誕生到現(xiàn)在發(fā)展迅速,至今在各領(lǐng)域被廣泛應(yīng)用。1999年,ThomasHofmann在其之上,發(fā)表....


圖2.3LDA主題模型圖

圖2.3LDA主題模型圖

沈陽工業(yè)大學(xué)碩士學(xué)位論文10含多個(gè)主題詞,因此主題模型會(huì)自動(dòng)分析每個(gè)文檔,統(tǒng)計(jì)文檔內(nèi)的詞語,根據(jù)統(tǒng)計(jì)的信息來斷定當(dāng)前文檔含有哪些主題,以及每個(gè)主題所占的比例各為多少[18]。主題模型從誕生到現(xiàn)在發(fā)展迅速,至今在各領(lǐng)域被廣泛應(yīng)用。1999年,ThomasHofmann在其之上,發(fā)表....


圖2.4信息在神經(jīng)元間傳導(dǎo)過程

圖2.4信息在神經(jīng)元間傳導(dǎo)過程

共同形成的。在這里,將定義為觀察變量,和z定義為隱藏變量。經(jīng)過反復(fù)迭代,直至結(jié)果收斂。主題模型雖然在大數(shù)據(jù)文本處理上,盡可能減少詞語對(duì)文本的表示,簡(jiǎn)化了計(jì)算并獲取了良好的成績(jī),然而主題模型本質(zhì)上仍屬于“詞袋模型”,無法避免忽略語義間聯(lián)系的問題,而且得到的文本比較稀疏,得到的文本特....



本文編號(hào):3971738

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3971738.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0a2be***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com