基于深度學(xué)習(xí)的網(wǎng)絡(luò)熱點(diǎn)話題推薦研究

發(fā)布時(shí)間：2024-05-12 18:45

　　隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展和全球化普及,網(wǎng)民規(guī)模不斷擴(kuò)大,網(wǎng)絡(luò)也成為網(wǎng)民獲取信息的重要平臺(tái)。新聞文本信息呈爆炸式的涌現(xiàn)在網(wǎng)絡(luò)上,因此從大量冗余的文本信息中提取出有價(jià)值的信息已成為當(dāng)前計(jì)算機(jī)領(lǐng)域中的一項(xiàng)重要研究?jī)?nèi)容。如果僅靠人工處理這些雜亂無章的輿情數(shù)據(jù),不僅會(huì)增加工作量,而且準(zhǔn)確程度也會(huì)由于受主觀意識(shí)的影響而降低。基于上述研究背景,本文對(duì)熱點(diǎn)話題推薦研究的出發(fā)點(diǎn)是:如何從海量的、種類多樣的信息中迅速發(fā)現(xiàn)目前最熱門、網(wǎng)絡(luò)平臺(tái)討論最多的話題推薦展示給網(wǎng)民。傳統(tǒng)的熱點(diǎn)話題研究方法不僅需要對(duì)數(shù)據(jù)集進(jìn)行人工標(biāo)注,而且在大數(shù)據(jù)集下容易出現(xiàn)維度災(zāi)難的問題。近年來深度學(xué)習(xí)作為前沿領(lǐng)域與多學(xué)科融合并取得眾多突破,在自然語言處理領(lǐng)域上的運(yùn)用也為網(wǎng)絡(luò)熱點(diǎn)話題推薦帶來了新的解決思路。本文主要工作內(nèi)容如下:對(duì)于傳統(tǒng)語言模型無法避免在詞語向量化的過程中忽略主要信息以及無法結(jié)合整體內(nèi)容進(jìn)行文本分析的問題,本文結(jié)合卷積神經(jīng)網(wǎng)絡(luò)通過卷積核上下滑動(dòng)提取文本特征的特點(diǎn),設(shè)計(jì)了基于卷積神經(jīng)網(wǎng)絡(luò)的詞特征文本表示方法。本文使用Word2Vec預(yù)訓(xùn)練語言模型實(shí)現(xiàn)詞向量的轉(zhuǎn)化,并引入TF-IDF算法增強(qiáng)文本特征,最后通過卷積神經(jīng)網(wǎng)絡(luò)實(shí)...

【文章頁數(shù)】：55 頁

【學(xué)位級(jí)別】：碩士

【部分圖文】：

圖2.1文本空間向量表示圖

沈陽工業(yè)大學(xué)碩士學(xué)位論文82.3文本特征表示文本特征表示就是將自然語言的數(shù)據(jù)信息根據(jù)一定規(guī)則轉(zhuǎn)化為可供計(jì)算機(jī)識(shí)別的數(shù)字化表示。文本特征表示是自然語言處理的核心技術(shù)，目前被廣泛應(yīng)用在文本相似度分析、文本分類、文本聚類等眾多領(lǐng)域并取得良好的成績(jī)和發(fā)展。大多數(shù)針對(duì)熱點(diǎn)話題發(fā)現(xiàn)研究中通過....

圖2.2LDA模型向量矩陣圖

沈陽工業(yè)大學(xué)碩士學(xué)位論文10含多個(gè)主題詞，因此主題模型會(huì)自動(dòng)分析每個(gè)文檔，統(tǒng)計(jì)文檔內(nèi)的詞語，根據(jù)統(tǒng)計(jì)的信息來斷定當(dāng)前文檔含有哪些主題，以及每個(gè)主題所占的比例各為多少[18]。主題模型從誕生到現(xiàn)在發(fā)展迅速，至今在各領(lǐng)域被廣泛應(yīng)用。1999年，ThomasHofmann在其之上，發(fā)表....

圖2.3LDA主題模型圖

沈陽工業(yè)大學(xué)碩士學(xué)位論文10含多個(gè)主題詞，因此主題模型會(huì)自動(dòng)分析每個(gè)文檔，統(tǒng)計(jì)文檔內(nèi)的詞語，根據(jù)統(tǒng)計(jì)的信息來斷定當(dāng)前文檔含有哪些主題，以及每個(gè)主題所占的比例各為多少[18]。主題模型從誕生到現(xiàn)在發(fā)展迅速，至今在各領(lǐng)域被廣泛應(yīng)用。1999年，ThomasHofmann在其之上，發(fā)表....

圖2.4信息在神經(jīng)元間傳導(dǎo)過程

共同形成的。在這里，將定義為觀察變量，和z定義為隱藏變量。經(jīng)過反復(fù)迭代，直至結(jié)果收斂。主題模型雖然在大數(shù)據(jù)文本處理上，盡可能減少詞語對(duì)文本的表示，簡(jiǎn)化了計(jì)算并獲取了良好的成績(jī)，然而主題模型本質(zhì)上仍屬于“詞袋模型”，無法避免忽略語義間聯(lián)系的問題，而且得到的文本比較稀疏，得到的文本特....

本文編號(hào)：3971738

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3971738.html

上一篇：面向圖像目標(biāo)識(shí)別和檢測(cè)的深度神經(jīng)網(wǎng)絡(luò)關(guān)鍵技術(shù)研究
下一篇：基于多視角點(diǎn)云模板的智能輪椅機(jī)械臂自主抓取技術(shù)的研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學(xué)習(xí)的網(wǎng)絡(luò)熱點(diǎn)話題推薦研究