天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于數(shù)據(jù)挖掘的APP推薦內(nèi)容的預(yù)測模型研究

發(fā)布時間:2021-04-09 01:11
  隨著互聯(lián)網(wǎng)的大范圍普及和極速發(fā)展、移動智能終端的不斷升級,APP不再是一個新鮮詞匯,它已逐步滲透到了生活的各個方面,而也因?yàn)檫@些APP的普及所帶來的便利,使用APP成為一種全新的生活習(xí)慣。因此在這個大環(huán)境下,市場上涌現(xiàn)出了各個方面可以滿足不同需求的APP,但特定的用戶群體是有限的,如何在這個市場里讓你的產(chǎn)品一直被用戶喜歡且有較高的忠誠度,其實(shí)是一場流量戰(zhàn)役,是每個企業(yè)都在意的核心。對于市場上的互聯(lián)網(wǎng)公司來說,用戶即生命,如同國家之間的資源爭奪一樣,搶到了用戶就是財富,因此提高內(nèi)容運(yùn)營的質(zhì)量是企業(yè)必須考慮的問題。內(nèi)容做的新穎,可以滿足用戶的心理訴求,這樣的內(nèi)容才是有用的,才是企業(yè)和用戶都需要的有價值的產(chǎn)出,因此對內(nèi)容的運(yùn)營要更好地把握和管理,而數(shù)據(jù)挖掘中的預(yù)測模型就可以很好地滿足需求。本文研究的主要目的是預(yù)測一篇內(nèi)容是否會被用戶所喜歡,也就是將APP推薦內(nèi)容的預(yù)測看成了一個二分類的問題,因?yàn)閿?shù)據(jù)量不是很龐大,選取了邏輯回歸算法來建立預(yù)測模型,而在特征體系的選取問題上,選擇了利用多元回歸和迭代決策樹二者相結(jié)合的方法進(jìn)行。訓(xùn)練模型所用的數(shù)據(jù)來源于全球著名的社交平臺Facebook提供的某化妝... 

【文章來源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:51 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于數(shù)據(jù)挖掘的APP推薦內(nèi)容的預(yù)測模型研究


約朋友吃飯問題的決策樹

曲線,曲線,邏輯函數(shù),預(yù)測變量


第 3 章 APP 推薦內(nèi)容的預(yù)測模型的構(gòu)建預(yù)測變量。因?yàn)槭嵌诸悊栴},所以假設(shè)用 1 表示正類,用 0 表示負(fù)的取值非 1 即 0。假設(shè)樣本特征向量為 m 維,那么整個樣本 x 最后判定的“概率”可以表示為: wxwxwxPyx1exp*11exp*exp*1| ,這稱之為邏輯函數(shù)(sigmoid 函數(shù)),其中mwx w wx wx ... wx01111目的就是通過一定的方法得出這一組權(quán)值。邏輯函數(shù)的曲線如下圖:

重要性排序


第 4 章 預(yù)測模型的實(shí)證分析和評價 方說明了方程的擬合程度,越多說明擬合程度越好,那么選中的這很好地解釋最后的因變量,說明會對最后的結(jié)果產(chǎn)生較大的影響。分析,最后分析得到 Content_length(帖子長度)、Post_mouth(Engaged_users(預(yù)定用戶)、Type(內(nèi)容類型)等的七個特征變量釋因變量。后進(jìn)行特征重要性分析,第三章已經(jīng)提到,本文使用 GBDT 的方特征的重要性。經(jīng)過算法計算,得到了特征的重要性排序,通過交,按照固定間隔百分比篩選特征,并作圖展示性能隨特征篩選比例到性能最好的篩選比例是 91%,也就是 15 個特征的組合會使得預(yù)。


本文編號:3126620

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3126620.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a2c43***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com