基于集成學(xué)習(xí)的網(wǎng)絡(luò)消息推廣分析
發(fā)布時間:2021-02-18 17:04
當(dāng)今社會,網(wǎng)絡(luò)就像一個蜘蛛網(wǎng)一樣連接著整個世界,各類消息都可以通過網(wǎng)絡(luò)得到及時的傳播和反饋。網(wǎng)絡(luò)消息的有效性在于其被查閱的次數(shù)。很多消息編輯者為了在網(wǎng)絡(luò)上推廣自己的消息,通常會反復(fù)地推敲消息內(nèi)容、形式、發(fā)布時間、鏈接數(shù)等。如何最大程度的使網(wǎng)絡(luò)消息被推廣,是每一個消息編輯者最關(guān)心的問題。本文根據(jù)互聯(lián)網(wǎng)博客Mashable上消息被推廣的數(shù)量,探究影響消息推廣的主要因素。首先,運(yùn)用主成分分析法篩選出影響消息推廣的主要因子,保留這些因子作為研究問題的影響因子。其次,以消息被推廣數(shù)為目標(biāo)變量,影響因子為自變量,分別進(jìn)行多元線性回歸分析、Logistic回歸分析、K近鄰和支持向量機(jī)分析,得到相應(yīng)的擬合模型和各模型得分。但是各模型得分值遠(yuǎn)小于1,所以單獨(dú)運(yùn)用一種模型擬合效果并不理想。于是本文提出將以上各模型作為個體學(xué)習(xí)器,各模型得分占模型總得分的比重作為各學(xué)習(xí)器的權(quán)重,進(jìn)行集成學(xué)習(xí)。經(jīng)過試驗,集成學(xué)習(xí)模型擬合很好,網(wǎng)絡(luò)消息推廣數(shù)得到很好的預(yù)測,提高了模型的泛化能力。最后,根據(jù)集成學(xué)習(xí)擬合模型的結(jié)果,為消息編輯者提出有效的措施,以達(dá)到提高效率,增加網(wǎng)絡(luò)消息推廣的目的。
【文章來源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:43 頁
【學(xué)位級別】:碩士
【部分圖文】:
shares的變化趨勢圖
蘭州大學(xué)碩士學(xué)位論文基于集成學(xué)習(xí)的網(wǎng)絡(luò)消息推廣分析第四章實證分析4.1多元線性回歸分析想要知道目標(biāo)變量即消息推廣數(shù)量的主要影響因素,最簡單的方法是做多元線性回歸分析。運(yùn)用Python軟件對主成分降維后的各因子與目標(biāo)變量進(jìn)行多元線性回歸分析。該文主要采用最小二乘法估計參數(shù)。即利用公式ω=(XTX)1XTy估計未知參數(shù)。再將ω帶入y=Xω中,從而得到目標(biāo)變量y的估計值y。運(yùn)用Python軟件進(jìn)行多元線性回歸分析,經(jīng)分析,本文截取從第400個樣本開始到第500個樣本為止的數(shù)據(jù)集,繪制實際目標(biāo)變量的值y和多元線性回歸估計出目標(biāo)變量的值y,畫出折線圖,觀察目標(biāo)變量的擬合情況。運(yùn)用多元線性回歸模型擬合的目標(biāo)變量的估計值和實際值的關(guān)系圖如圖4.1所示。圖4.1多元線性回歸估計值與實際值由圖4.1可以看出模型的擬合效果不是很好。然后計算模型的得分,即模型的精確度,用來估計模型的擬合好壞。運(yùn)用Python軟件計算得到多元線性回歸模型的得分score1=0.00115,得分值很低,遠(yuǎn)小于1。模型的得分值所表現(xiàn)的結(jié)果與圖4.1所表現(xiàn)出的結(jié)果一致。所以該線性回歸模型對目標(biāo)變量的擬合效果不理想。27
蘭州大學(xué)碩士學(xué)位論文基于集成學(xué)習(xí)的網(wǎng)絡(luò)消息推廣分析4.2Logistic模型分析由于多元線性回歸模型對目標(biāo)變量的擬合效果并不好,本文嘗試運(yùn)用Logis-tic回歸模型進(jìn)行分析。運(yùn)用主成分分析法得到的主因子進(jìn)行Logistic模型分析的公式為:y=11+e(ωTX+b),(4.1)擬合該模型,并估計該模型所對應(yīng)的參數(shù)ω,b。本文運(yùn)用Python軟件對樣本數(shù)據(jù)做Logistic回歸模型分析。對目標(biāo)變量,即消息推廣數(shù)量進(jìn)行模型的擬合。然后對數(shù)據(jù)集進(jìn)行隨機(jī)劃分,使得樣本的85%為訓(xùn)練集,剩余的樣本為測試集進(jìn)行模型的估計。由于樣本量很多,所以本文截取從第400個樣本開始到第500個樣本為止的數(shù)據(jù)集,然后繪制目標(biāo)變量的估計值和對應(yīng)的實際值做折線圖,觀察模型的擬合情況,如圖4.2所示。圖4.2Logistic模型估計值與實際值由Logistic模型對目標(biāo)變量,即消息推廣數(shù)量的估計值與實際值圖形,如圖4.2可以看出模型的擬合效果并不好。為了更精確地了解模型的估計精度,計算模型的得分,由于模型的得分可以用來反映模型擬合的好壞程度。模型的得分值的取值范圍為[0,1]如果模型的得分值越接近于1,就說明模型的擬合效果越好。運(yùn)用Python軟件計算得到模型的訓(xùn)練集得分值為score2=0.669,測試集的得分score2=0.674,可以知道模型的擬合效果不是特別好,但是比多元線性回歸擬合的模型表現(xiàn)優(yōu)異。28
【參考文獻(xiàn)】:
期刊論文
[1]網(wǎng)絡(luò)媒體新聞傳播社會責(zé)任探索[J]. 瀟瀟. 記者搖籃. 2019(12)
[2]考慮數(shù)據(jù)時效性的高效KNN算法[J]. 王軼凡. 赤峰學(xué)院學(xué)報(自然科學(xué)版). 2019(11)
[3]“互聯(lián)網(wǎng)+”時代下網(wǎng)絡(luò)新聞編輯能力提升途徑的思考[J]. 李雪. 中國傳媒科技. 2019(04)
[4]集成學(xué)習(xí)在樣本不平衡垃圾短信識別上的應(yīng)用[J]. 熊健,鄒東興. 廣州大學(xué)學(xué)報(自然科學(xué)版). 2018(05)
[5]當(dāng)前我國網(wǎng)絡(luò)新聞傳播存在的問題及對策研究[J]. 李洋. 科技傳播. 2018(02)
[6]媒介融合背景下融合新聞傳播效應(yīng)與策略研究[J]. 楊之汀. 西部廣播電視. 2017(24)
[7]互聯(lián)網(wǎng)背景下的新聞傳播語言藝術(shù)研究[J]. 李萍. 西部廣播電視. 2017(22)
[8]網(wǎng)絡(luò)新聞編輯與受眾心理[J]. 丁寧. 西部廣播電視. 2016(16)
[9]網(wǎng)絡(luò)新聞傳播和傳統(tǒng)新聞傳播的異同[J]. 郭曉野. 新聞研究導(dǎo)刊. 2015(08)
本文編號:3039840
【文章來源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:43 頁
【學(xué)位級別】:碩士
【部分圖文】:
shares的變化趨勢圖
蘭州大學(xué)碩士學(xué)位論文基于集成學(xué)習(xí)的網(wǎng)絡(luò)消息推廣分析第四章實證分析4.1多元線性回歸分析想要知道目標(biāo)變量即消息推廣數(shù)量的主要影響因素,最簡單的方法是做多元線性回歸分析。運(yùn)用Python軟件對主成分降維后的各因子與目標(biāo)變量進(jìn)行多元線性回歸分析。該文主要采用最小二乘法估計參數(shù)。即利用公式ω=(XTX)1XTy估計未知參數(shù)。再將ω帶入y=Xω中,從而得到目標(biāo)變量y的估計值y。運(yùn)用Python軟件進(jìn)行多元線性回歸分析,經(jīng)分析,本文截取從第400個樣本開始到第500個樣本為止的數(shù)據(jù)集,繪制實際目標(biāo)變量的值y和多元線性回歸估計出目標(biāo)變量的值y,畫出折線圖,觀察目標(biāo)變量的擬合情況。運(yùn)用多元線性回歸模型擬合的目標(biāo)變量的估計值和實際值的關(guān)系圖如圖4.1所示。圖4.1多元線性回歸估計值與實際值由圖4.1可以看出模型的擬合效果不是很好。然后計算模型的得分,即模型的精確度,用來估計模型的擬合好壞。運(yùn)用Python軟件計算得到多元線性回歸模型的得分score1=0.00115,得分值很低,遠(yuǎn)小于1。模型的得分值所表現(xiàn)的結(jié)果與圖4.1所表現(xiàn)出的結(jié)果一致。所以該線性回歸模型對目標(biāo)變量的擬合效果不理想。27
蘭州大學(xué)碩士學(xué)位論文基于集成學(xué)習(xí)的網(wǎng)絡(luò)消息推廣分析4.2Logistic模型分析由于多元線性回歸模型對目標(biāo)變量的擬合效果并不好,本文嘗試運(yùn)用Logis-tic回歸模型進(jìn)行分析。運(yùn)用主成分分析法得到的主因子進(jìn)行Logistic模型分析的公式為:y=11+e(ωTX+b),(4.1)擬合該模型,并估計該模型所對應(yīng)的參數(shù)ω,b。本文運(yùn)用Python軟件對樣本數(shù)據(jù)做Logistic回歸模型分析。對目標(biāo)變量,即消息推廣數(shù)量進(jìn)行模型的擬合。然后對數(shù)據(jù)集進(jìn)行隨機(jī)劃分,使得樣本的85%為訓(xùn)練集,剩余的樣本為測試集進(jìn)行模型的估計。由于樣本量很多,所以本文截取從第400個樣本開始到第500個樣本為止的數(shù)據(jù)集,然后繪制目標(biāo)變量的估計值和對應(yīng)的實際值做折線圖,觀察模型的擬合情況,如圖4.2所示。圖4.2Logistic模型估計值與實際值由Logistic模型對目標(biāo)變量,即消息推廣數(shù)量的估計值與實際值圖形,如圖4.2可以看出模型的擬合效果并不好。為了更精確地了解模型的估計精度,計算模型的得分,由于模型的得分可以用來反映模型擬合的好壞程度。模型的得分值的取值范圍為[0,1]如果模型的得分值越接近于1,就說明模型的擬合效果越好。運(yùn)用Python軟件計算得到模型的訓(xùn)練集得分值為score2=0.669,測試集的得分score2=0.674,可以知道模型的擬合效果不是特別好,但是比多元線性回歸擬合的模型表現(xiàn)優(yōu)異。28
【參考文獻(xiàn)】:
期刊論文
[1]網(wǎng)絡(luò)媒體新聞傳播社會責(zé)任探索[J]. 瀟瀟. 記者搖籃. 2019(12)
[2]考慮數(shù)據(jù)時效性的高效KNN算法[J]. 王軼凡. 赤峰學(xué)院學(xué)報(自然科學(xué)版). 2019(11)
[3]“互聯(lián)網(wǎng)+”時代下網(wǎng)絡(luò)新聞編輯能力提升途徑的思考[J]. 李雪. 中國傳媒科技. 2019(04)
[4]集成學(xué)習(xí)在樣本不平衡垃圾短信識別上的應(yīng)用[J]. 熊健,鄒東興. 廣州大學(xué)學(xué)報(自然科學(xué)版). 2018(05)
[5]當(dāng)前我國網(wǎng)絡(luò)新聞傳播存在的問題及對策研究[J]. 李洋. 科技傳播. 2018(02)
[6]媒介融合背景下融合新聞傳播效應(yīng)與策略研究[J]. 楊之汀. 西部廣播電視. 2017(24)
[7]互聯(lián)網(wǎng)背景下的新聞傳播語言藝術(shù)研究[J]. 李萍. 西部廣播電視. 2017(22)
[8]網(wǎng)絡(luò)新聞編輯與受眾心理[J]. 丁寧. 西部廣播電視. 2016(16)
[9]網(wǎng)絡(luò)新聞傳播和傳統(tǒng)新聞傳播的異同[J]. 郭曉野. 新聞研究導(dǎo)刊. 2015(08)
本文編號:3039840
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3039840.html
最近更新
教材專著