天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于深度學(xué)習(xí)的網(wǎng)絡(luò)新聞文本分類研究

發(fā)布時(shí)間:2020-10-28 01:10
   網(wǎng)絡(luò)新聞作為大數(shù)據(jù)時(shí)代人們獲取社會(huì)有效信息的重要手段,受到了人們的廣泛關(guān)注。實(shí)現(xiàn)對(duì)海量網(wǎng)絡(luò)新聞智能高效的分類,對(duì)個(gè)性化新聞推薦、話題識(shí)別與跟蹤、新聞網(wǎng)站分類導(dǎo)航等都具有重要意義。隨著計(jì)算機(jī)技術(shù)的發(fā)展以及互聯(lián)網(wǎng)的普及,網(wǎng)絡(luò)新聞信息資源呈現(xiàn)爆炸式增長(zhǎng)。面對(duì)海量且混亂無序的網(wǎng)絡(luò)新聞信息,用戶所面臨的難題不再是如何獲取新聞信息,而是如何在大規(guī)模新聞資源中高效準(zhǔn)確的找到能夠滿足自身需求的信息。隨著信息化時(shí)代的發(fā)展,用戶對(duì)獲取信息的內(nèi)容和質(zhì)量的要求也在不斷提升,新聞信息作為網(wǎng)絡(luò)新聞?dòng)脩臬@取社會(huì)信息資源的重要渠道,隨著文本分類技術(shù)的發(fā)展和成熟,為文本分類在網(wǎng)絡(luò)新聞?lì)I(lǐng)域的應(yīng)用和實(shí)踐奠定了基礎(chǔ),網(wǎng)絡(luò)新聞文本分類的發(fā)展迎來了新的契機(jī)。為了能夠提升網(wǎng)絡(luò)新聞?lì)I(lǐng)域的信息服務(wù)質(zhì)量,滿足用戶在大數(shù)據(jù)時(shí)代的多樣化和個(gè)性化信息需求,本文在深入研究網(wǎng)絡(luò)新聞文本分類的背景、研究現(xiàn)狀、相關(guān)理論和發(fā)展等內(nèi)容的基礎(chǔ)上,采用文獻(xiàn)計(jì)量法對(duì)文本分類領(lǐng)域近十年發(fā)表的相關(guān)文獻(xiàn)進(jìn)行統(tǒng)計(jì)分析,從年度發(fā)文趨勢(shì)、學(xué)科分布、期刊分布、機(jī)構(gòu)分布、作者分布、高被引文獻(xiàn)分析以及研究熱點(diǎn)與前沿等方面理清文本分類領(lǐng)域的發(fā)展脈絡(luò)和研究現(xiàn)狀,為促進(jìn)文本分類領(lǐng)域的進(jìn)一步發(fā)展提供理論參考依據(jù)。與此同時(shí),為網(wǎng)絡(luò)新聞?lì)I(lǐng)域構(gòu)建了一個(gè)高效的網(wǎng)絡(luò)新聞文本分類模型框架。該模型主要由四個(gè)部分組成,分別是新聞文本預(yù)處理、基于詞向量的新聞文本表示、新聞文本特征提取與分類以及文本分類結(jié)果評(píng)價(jià)。在實(shí)驗(yàn)過程中首先通過學(xué)習(xí)得到新聞文本的稠密的Word2Vec詞向量表示,從而解決傳統(tǒng)文本表示的高緯度、數(shù)據(jù)稀疏及缺乏語義等問題,然后以新聞文本詞向量為輸入,通過卷積神經(jīng)網(wǎng)絡(luò)對(duì)新聞文本特征進(jìn)行自動(dòng)學(xué)習(xí)和提取,從而避免傳統(tǒng)新聞文本分類方法人工參與特征提取的費(fèi)時(shí)費(fèi)力及誤差累積的缺點(diǎn),實(shí)驗(yàn)結(jié)果顯示該方法可以有效的提高網(wǎng)絡(luò)新聞文本分類的效率,促進(jìn)新聞?lì)I(lǐng)域?qū)崿F(xiàn)更加有效的信息組織和管理。本文提出的基于深度學(xué)習(xí)的網(wǎng)絡(luò)新聞文本分類模型具有可行性,能夠給用戶提供更優(yōu)質(zhì)的新聞信息服務(wù),對(duì)網(wǎng)絡(luò)新聞文本分類技術(shù)的發(fā)展提供了一定的參考價(jià)值。
【學(xué)位單位】:山西財(cái)經(jīng)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:G254
【部分圖文】:

文本分類,領(lǐng)域,團(tuán)隊(duì),文本特征


圖 3.3 文本分類領(lǐng)域作者合作圖從圖 3.3 中可以看出,文本分類領(lǐng)域之間的作者整體聯(lián)系較為稀疏,主要有 3個(gè)合著團(tuán)隊(duì)。①以朱顥東為中心的合作網(wǎng)絡(luò),該團(tuán)隊(duì)中朱顥東和鐘勇來自中國科學(xué)院、李紅嬋來自鄭州輕工業(yè)學(xué)院等,主要研究文本分類中的文本特征選擇方法,通

共現(xiàn),文本分類,關(guān)鍵詞,領(lǐng)域


文章的關(guān)鍵詞是論文作者對(duì)文章核心研究?jī)?nèi)容的高度概括和提煉,某學(xué)科領(lǐng)域里高頻出現(xiàn)的關(guān)鍵詞可被視為該領(lǐng)域的研究熱點(diǎn),通過對(duì)高頻關(guān)鍵詞進(jìn)行詞頻統(tǒng)計(jì)和共現(xiàn)分析,能夠快速有效地掌握某一領(lǐng)域的研究熱點(diǎn)。圖 4 是利用citespace5.2 繪制的近十年的文本分類領(lǐng)域的關(guān)鍵詞共現(xiàn)知識(shí)圖譜。

框架圖,文本分類,網(wǎng)絡(luò)新聞,框架


新聞?lì)I(lǐng)域中的文本分類問題時(shí),存在許多難以解決的問題。在進(jìn)行特征提取的過程中需要人工的參與,會(huì)影響最終提取的文本特征的準(zhǔn)確性;利用向量空間模型進(jìn)行文本表示會(huì)忽略文本中的語序和語義信息,影響文本分類的性能;面對(duì)高緯度、數(shù)據(jù)稀疏性問題,雖然可以利用特征選擇方法進(jìn)行降維,但這樣會(huì)進(jìn)一步加劇了文本特征丟失的問題,而且使得整個(gè)文本分類過程更加復(fù)雜。Joachims 認(rèn)為在文本分類過程中,與分類不相關(guān)的特征是非常少的,好的文本分類模型應(yīng)該使用所有的特征[54]。因此,為了更好地完成大數(shù)據(jù)時(shí)代下網(wǎng)絡(luò)新聞?lì)I(lǐng)域的文本分類任務(wù),引入更為巧妙的文本特征表示方式和更高精度的文本特征提取模型是十分有必要的。在本文介紹的基于深度學(xué)習(xí)的網(wǎng)絡(luò)新聞文本分類模型中包括:文本預(yù)處理、基于詞向量的文本表示、利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行文本特征提取和分類、文本分類結(jié)果評(píng)價(jià)四個(gè)模塊,利用詞向量的方法對(duì)文本特征進(jìn)行表示,采用深度學(xué)習(xí)模型中的卷積神經(jīng)網(wǎng)絡(luò)對(duì)文本特征進(jìn)行提取并完成最終分類。基于深度學(xué)習(xí)的網(wǎng)絡(luò)新聞文本分類的主要流程如下圖 4.1 所示。
【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 尹寶才;王文通;王立春;;深度學(xué)習(xí)研究綜述[J];北京工業(yè)大學(xué)學(xué)報(bào);2015年01期

2 尹麗英;趙捧未;;基于語義網(wǎng)絡(luò)社團(tuán)劃分的中文文本分類研究[J];圖書情報(bào)工作;2014年19期

3 葉鷹;;浪潮與沙灘:略談圖書情報(bào)研究熱點(diǎn)和研究前沿[J];國家圖書館學(xué)刊;2014年03期

4 汪海燕;黎建輝;楊風(fēng)雷;;支持向量機(jī)理論及算法研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2014年05期

5 徐明;高翔;許志剛;劉磊;;基于改進(jìn)卡方統(tǒng)計(jì)的微博特征提取方法[J];計(jì)算機(jī)工程與應(yīng)用;2014年19期

6 劉建偉;劉媛;羅雄麟;;深度學(xué)習(xí)研究進(jìn)展[J];計(jì)算機(jī)應(yīng)用研究;2014年07期

7 劉海峰;于利軍;劉守生;;一種基于類別分布信息的文本特征選擇模型[J];圖書情報(bào)工作;2013年15期

8 薛春香;張玉芳;;面向新聞?lì)I(lǐng)域的中文文本分類研究綜述[J];圖書情報(bào)工作;2013年14期

9 李建林;;一種基于PCA的組合特征提取文本分類方法[J];計(jì)算機(jī)應(yīng)用研究;2013年08期

10 孫志軍;薛磊;許陽明;王正;;深度學(xué)習(xí)研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2012年08期



本文編號(hào):2859340

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/2859340.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶800c5***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com