天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 社會(huì)學(xué)論文 >

基于R語言的網(wǎng)絡(luò)新聞的流行度預(yù)測研究

發(fā)布時(shí)間:2017-06-13 23:02

  本文關(guān)鍵詞:基于R語言的網(wǎng)絡(luò)新聞的流行度預(yù)測研究,由筆耕文化傳播整理發(fā)布。


【摘要】:互聯(lián)網(wǎng)時(shí)代已經(jīng)來臨,信息數(shù)量呈井噴式增長,網(wǎng)絡(luò)新聞成為了主要的網(wǎng)絡(luò)信息載體。民眾通過網(wǎng)絡(luò)新聞了解國計(jì)民生、時(shí)事動(dòng)態(tài),越來越多的人對(duì)喜歡的新聞文章進(jìn)行分享傳播,新聞文章的分享次數(shù)顯示了該新聞的流行度。本文主要應(yīng)用部分分類算法對(duì)網(wǎng)絡(luò)新聞的流行度進(jìn)行預(yù)測,來探討對(duì)網(wǎng)絡(luò)新聞流行度進(jìn)行預(yù)測的最佳模型,以期幫助網(wǎng)絡(luò)新聞服務(wù)商在出版前預(yù)測新聞流行度。本文按照數(shù)據(jù)分析的流程對(duì)網(wǎng)絡(luò)新聞的流行度進(jìn)行預(yù)測研究:一、對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理;二、對(duì)數(shù)據(jù)集進(jìn)行特征選擇,我們主要采用的是遞歸特征消除算法,這是一種基于模型的特征選擇方法;三、進(jìn)行建模分析,我們用多種不同的學(xué)習(xí)算法擬合數(shù)據(jù)集,如自適應(yīng)增強(qiáng)算法、隨機(jī)森林算法、支持向量機(jī)算法,對(duì)建立的三種不同模型結(jié)果分別進(jìn)行具體詳細(xì)的分析;四、模型評(píng)估,通過混淆矩陣、風(fēng)險(xiǎn)圖和ROC圖等性能評(píng)估方式對(duì)模型的性能進(jìn)行比較分析。最后我們發(fā)現(xiàn)隨機(jī)森林是預(yù)測的最佳模型。在整個(gè)文章結(jié)構(gòu)中,本文第一部分主要介紹了論文的背景意義及目前對(duì)網(wǎng)絡(luò)新聞研究的現(xiàn)狀。第二部分對(duì)論文中使用的模型及方法從理論上進(jìn)行了綜述。第三部分根據(jù)UCI的數(shù)據(jù)集,該數(shù)據(jù)集來自Mashable,一個(gè)眾所周知的網(wǎng)絡(luò)新聞網(wǎng)站,按照數(shù)據(jù)分析的流程對(duì)其進(jìn)行具體的數(shù)據(jù)分析,第四部分得出有參考性的結(jié)論,然后對(duì)本文的不足之處簡要的分析,并且根據(jù)本文的不足之處對(duì)未來的研究工作進(jìn)行展望。
【關(guān)鍵詞】:網(wǎng)絡(luò)新聞 特征選擇 分類算法 模型評(píng)估
【學(xué)位授予單位】:華中師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:C913.4
【目錄】:
  • 摘要5-6
  • ABSTRACT6-9
  • 1 緒論9-14
  • 1.1 研究背景與意義9-10
  • 1.2 網(wǎng)絡(luò)新聞國內(nèi)研究現(xiàn)狀10-11
  • 1.3 網(wǎng)絡(luò)新聞國外研究現(xiàn)狀11
  • 1.4 研究方法11-14
  • 1.4.1 取材11-13
  • 1.4.2 使用工具13-14
  • 2 理論基礎(chǔ)14-29
  • 2.1 特征選擇14-19
  • 2.2 幾種高級(jí)算法介紹19-25
  • 2.2.1 AdaBoost算法19-20
  • 2.2.2 隨機(jī)森林算法20-23
  • 2.2.3 支持向量機(jī)算法23-25
  • 2.3 模型評(píng)估與選擇25-29
  • 3 實(shí)例分析29-50
  • 3.1 數(shù)據(jù)預(yù)處理29-33
  • 3.1.1 數(shù)據(jù)集加載29-30
  • 3.1.2 數(shù)據(jù)清理30-32
  • 3.1.3 數(shù)據(jù)變換32
  • 3.1.4 冗余分析32-33
  • 3.2 特征選擇33-34
  • 3.3 建立模型34-43
  • 3.3.1 數(shù)據(jù)探究分析34-36
  • 3.3.2 自適應(yīng)增強(qiáng)算法分析36-38
  • 3.3.3 隨機(jī)森林算法分析38-42
  • 3.3.4 支持向量機(jī)算法分析42-43
  • 3.4 模型評(píng)估43-50
  • 3.4.1 不同模型之間的混淆矩陣對(duì)比情況43-45
  • 3.4.2 不同模型之間的風(fēng)險(xiǎn)圖分析45-48
  • 3.4.3 不同模型之間的ROC圖及相關(guān)圖表48-50
  • 4 總結(jié)與展望50-52
  • 4.1 總結(jié)50
  • 4.2 展望50-52
  • 參考文獻(xiàn)52-55
  • 致謝55

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 薛萍;從傳播方式看網(wǎng)絡(luò)新聞的定位[J];彭城職業(yè)大學(xué)學(xué)報(bào);2002年06期

2 李明德;對(duì)網(wǎng)絡(luò)新聞的認(rèn)識(shí)[J];西安交通大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2002年04期

3 李燁;網(wǎng)絡(luò)新聞探析[J];河北科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2004年02期

4 王瑾,李發(fā)波;網(wǎng)絡(luò)新聞的個(gè)性化發(fā)展之路[J];寫作;2005年13期

5 申凡,陳奕奕;聚合新聞:由“e化”到“易化”的跨越——試析網(wǎng)絡(luò)新聞發(fā)展的新趨勢[J];南京郵電學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版);2005年02期

6 于建華;加強(qiáng)網(wǎng)絡(luò)新聞宣傳與管理的對(duì)策和評(píng)價(jià)研究[J];河南社會(huì)科學(xué);2005年04期

7 鄭堅(jiān);;中國網(wǎng)絡(luò)新聞的困境與發(fā)展路徑問題[J];求索;2005年12期

8 何蕊;沈立賽;;網(wǎng)絡(luò)新聞中扭曲的女大學(xué)生形象——以新浪網(wǎng)為例[J];今傳媒;2006年06期

9 文永紅;梁喜書;;對(duì)校園網(wǎng)絡(luò)新聞工作的思考和建議[J];石油教育;2006年04期

10 汪洋;;淺析網(wǎng)絡(luò)新聞的輿論作用[J];時(shí)代教育;2013年13期

中國重要會(huì)議論文全文數(shù)據(jù)庫 前5條

1 石宇;;網(wǎng)絡(luò)新聞跟帖評(píng)論中的科普信息分析——以三組網(wǎng)絡(luò)新聞跟帖評(píng)論為例[A];安徽首屆科普產(chǎn)業(yè)博士科技論壇——暨社區(qū)科技傳播體系與平臺(tái)建構(gòu)學(xué)術(shù)交流會(huì)論文集[C];2012年

2 宋克明;;信息革命新形勢和網(wǎng)絡(luò)新聞新思考[A];中國科技新聞學(xué)會(huì)第八次學(xué)術(shù)年會(huì)論文集[C];2005年

3 王鑫方;;網(wǎng)絡(luò)新聞?wù)l在讀?[A];2006中國傳播學(xué)論壇論文集(Ⅱ)[C];2006年

4 孫志剛;;探析媒介依賴在美國公眾使用地方紙媒與網(wǎng)絡(luò)新聞中的作用(英文)[A];數(shù)字未來與媒介社會(huì)1[C];2010年

5 馬寧;楊少龍;;網(wǎng)絡(luò)新聞對(duì)當(dāng)代大學(xué)生德育影響研究[A];社會(huì)主義核心價(jià)值體系與教育——德育論叢(第二輯)[C];2012年

中國重要報(bào)紙全文數(shù)據(jù)庫 前10條

1 李東生;網(wǎng)絡(luò)新聞“全”為先[N];新聞出版報(bào);2000年

2 郝文全 劉云鵬;天津總隊(duì)三支隊(duì)網(wǎng)絡(luò)新聞?dòng)斜豆氖繗鈁N];人民武警報(bào);2011年

3 孫佳暄 東勝區(qū)新聞中心;網(wǎng)絡(luò)新聞的平民化[N];鄂爾多斯日?qǐng)?bào);2012年

4 吳玲;“網(wǎng)絡(luò)新聞”豈能開玩笑[N];中國新聞出版報(bào);2013年

5 太原日?qǐng)?bào)政文采訪中心 白偉;當(dāng)前網(wǎng)絡(luò)新聞存在的問題及對(duì)策[N];山西經(jīng)濟(jì)日?qǐng)?bào);2013年

6 劉景鵬;網(wǎng)絡(luò)新聞的可讀性分析[N];中國保險(xiǎn)報(bào);2002年

7 楊保軍;辯證看待網(wǎng)絡(luò)新聞的真實(shí)性[N];中華新聞報(bào);2001年

8 高鋼;提升影響力:網(wǎng)絡(luò)新聞的時(shí)代命題(上)[N];中華新聞報(bào);2004年

9 王永康;打造誠信平臺(tái) 提升網(wǎng)絡(luò)新聞公信力[N];中華新聞報(bào);2004年

10 楊谷;網(wǎng)絡(luò)新聞的責(zé)任與使命[N];光明日?qǐng)?bào);2007年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 劉瓊;中國網(wǎng)絡(luò)新聞可信度研究[D];華中科技大學(xué);2011年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 白洪譚;論網(wǎng)絡(luò)新聞跟帖的隱疾[D];遼寧大學(xué);2010年

2 周雯;網(wǎng)絡(luò)新聞的公共管理問題研究[D];江西財(cái)經(jīng)大學(xué);2009年

3 董卿;網(wǎng)絡(luò)新聞的現(xiàn)狀及未來的前瞻性研究[D];山東大學(xué);2006年

4 劉暢;優(yōu)秀運(yùn)動(dòng)員傷病問題的社會(huì)學(xué)分析[D];上海體育學(xué)院;2015年

5 張楠;女性主義視野下網(wǎng)絡(luò)新聞報(bào)道中的女性形象傳播研究[D];成都理工大學(xué);2015年

6 寧芹;網(wǎng)絡(luò)新聞侵犯隱私權(quán)法律責(zé)任研究[D];安徽大學(xué);2016年

7 谷玉;新媒體時(shí)代我國網(wǎng)絡(luò)新聞的正能量傳播研究[D];河北經(jīng)貿(mào)大學(xué);2016年

8 陳晨;社會(huì)道德爭議議題的網(wǎng)絡(luò)新聞報(bào)道框架研究[D];新疆大學(xué);2016年

9 付倩;關(guān)聯(lián)翻譯理論指導(dǎo)下的日?萍季W(wǎng)絡(luò)新聞?dòng)h翻譯報(bào)告[D];電子科技大學(xué);2016年

10 宋士方;網(wǎng)絡(luò)新聞中的不良暗示現(xiàn)象探究[D];廣西大學(xué);2016年


  本文關(guān)鍵詞:基于R語言的網(wǎng)絡(luò)新聞的流行度預(yù)測研究,,由筆耕文化傳播整理發(fā)布。



本文編號(hào):447795

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shekelunwen/shgj/447795.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d1bf6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com