基于數(shù)據(jù)挖掘的APP推薦內(nèi)容的預(yù)測(cè)模型研究
發(fā)布時(shí)間:2021-04-09 01:11
隨著互聯(lián)網(wǎng)的大范圍普及和極速發(fā)展、移動(dòng)智能終端的不斷升級(jí),APP不再是一個(gè)新鮮詞匯,它已逐步滲透到了生活的各個(gè)方面,而也因?yàn)檫@些APP的普及所帶來(lái)的便利,使用APP成為一種全新的生活習(xí)慣。因此在這個(gè)大環(huán)境下,市場(chǎng)上涌現(xiàn)出了各個(gè)方面可以滿足不同需求的APP,但特定的用戶(hù)群體是有限的,如何在這個(gè)市場(chǎng)里讓你的產(chǎn)品一直被用戶(hù)喜歡且有較高的忠誠(chéng)度,其實(shí)是一場(chǎng)流量戰(zhàn)役,是每個(gè)企業(yè)都在意的核心。對(duì)于市場(chǎng)上的互聯(lián)網(wǎng)公司來(lái)說(shuō),用戶(hù)即生命,如同國(guó)家之間的資源爭(zhēng)奪一樣,搶到了用戶(hù)就是財(cái)富,因此提高內(nèi)容運(yùn)營(yíng)的質(zhì)量是企業(yè)必須考慮的問(wèn)題。內(nèi)容做的新穎,可以滿足用戶(hù)的心理訴求,這樣的內(nèi)容才是有用的,才是企業(yè)和用戶(hù)都需要的有價(jià)值的產(chǎn)出,因此對(duì)內(nèi)容的運(yùn)營(yíng)要更好地把握和管理,而數(shù)據(jù)挖掘中的預(yù)測(cè)模型就可以很好地滿足需求。本文研究的主要目的是預(yù)測(cè)一篇內(nèi)容是否會(huì)被用戶(hù)所喜歡,也就是將APP推薦內(nèi)容的預(yù)測(cè)看成了一個(gè)二分類(lèi)的問(wèn)題,因?yàn)閿?shù)據(jù)量不是很龐大,選取了邏輯回歸算法來(lái)建立預(yù)測(cè)模型,而在特征體系的選取問(wèn)題上,選擇了利用多元回歸和迭代決策樹(shù)二者相結(jié)合的方法進(jìn)行。訓(xùn)練模型所用的數(shù)據(jù)來(lái)源于全球著名的社交平臺(tái)Facebook提供的某化妝...
【文章來(lái)源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:51 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
約朋友吃飯問(wèn)題的決策樹(shù)
第 3 章 APP 推薦內(nèi)容的預(yù)測(cè)模型的構(gòu)建預(yù)測(cè)變量。因?yàn)槭嵌诸?lèi)問(wèn)題,所以假設(shè)用 1 表示正類(lèi),用 0 表示負(fù)的取值非 1 即 0。假設(shè)樣本特征向量為 m 維,那么整個(gè)樣本 x 最后判定的“概率”可以表示為: wxwxwxPyx1exp*11exp*exp*1| ,這稱(chēng)之為邏輯函數(shù)(sigmoid 函數(shù)),其中mwx w wx wx ... wx01111目的就是通過(guò)一定的方法得出這一組權(quán)值。邏輯函數(shù)的曲線如下圖:
第 4 章 預(yù)測(cè)模型的實(shí)證分析和評(píng)價(jià) 方說(shuō)明了方程的擬合程度,越多說(shuō)明擬合程度越好,那么選中的這很好地解釋最后的因變量,說(shuō)明會(huì)對(duì)最后的結(jié)果產(chǎn)生較大的影響。分析,最后分析得到 Content_length(帖子長(zhǎng)度)、Post_mouth(Engaged_users(預(yù)定用戶(hù))、Type(內(nèi)容類(lèi)型)等的七個(gè)特征變量釋因變量。后進(jìn)行特征重要性分析,第三章已經(jīng)提到,本文使用 GBDT 的方特征的重要性。經(jīng)過(guò)算法計(jì)算,得到了特征的重要性排序,通過(guò)交,按照固定間隔百分比篩選特征,并作圖展示性能隨特征篩選比例到性能最好的篩選比例是 91%,也就是 15 個(gè)特征的組合會(huì)使得預(yù)。
本文編號(hào):3126620
【文章來(lái)源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:51 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
約朋友吃飯問(wèn)題的決策樹(shù)
第 3 章 APP 推薦內(nèi)容的預(yù)測(cè)模型的構(gòu)建預(yù)測(cè)變量。因?yàn)槭嵌诸?lèi)問(wèn)題,所以假設(shè)用 1 表示正類(lèi),用 0 表示負(fù)的取值非 1 即 0。假設(shè)樣本特征向量為 m 維,那么整個(gè)樣本 x 最后判定的“概率”可以表示為: wxwxwxPyx1exp*11exp*exp*1| ,這稱(chēng)之為邏輯函數(shù)(sigmoid 函數(shù)),其中mwx w wx wx ... wx01111目的就是通過(guò)一定的方法得出這一組權(quán)值。邏輯函數(shù)的曲線如下圖:
第 4 章 預(yù)測(cè)模型的實(shí)證分析和評(píng)價(jià) 方說(shuō)明了方程的擬合程度,越多說(shuō)明擬合程度越好,那么選中的這很好地解釋最后的因變量,說(shuō)明會(huì)對(duì)最后的結(jié)果產(chǎn)生較大的影響。分析,最后分析得到 Content_length(帖子長(zhǎng)度)、Post_mouth(Engaged_users(預(yù)定用戶(hù))、Type(內(nèi)容類(lèi)型)等的七個(gè)特征變量釋因變量。后進(jìn)行特征重要性分析,第三章已經(jīng)提到,本文使用 GBDT 的方特征的重要性。經(jīng)過(guò)算法計(jì)算,得到了特征的重要性排序,通過(guò)交,按照固定間隔百分比篩選特征,并作圖展示性能隨特征篩選比例到性能最好的篩選比例是 91%,也就是 15 個(gè)特征的組合會(huì)使得預(yù)。
本文編號(hào):3126620
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3126620.html
最近更新
教材專(zhuān)著