天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于彈性網(wǎng)邏輯回歸算法的內(nèi)容點(diǎn)擊率預(yù)估系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2021-11-02 04:04
  隨著信息化時(shí)代的到來,信息量呈指數(shù)式增長(zhǎng),用戶面對(duì)如此龐大的信息時(shí)如何篩選出有效信息是急需解決的問題。推薦系統(tǒng)由此而生,從龐大的內(nèi)容信息中篩選出對(duì)用戶來說有用的信息。本文研究的內(nèi)容點(diǎn)擊率預(yù)估系統(tǒng)正是推薦系統(tǒng)的核心。內(nèi)容點(diǎn)擊率預(yù)估系統(tǒng)對(duì)候選內(nèi)容的點(diǎn)擊率進(jìn)行預(yù)估,并進(jìn)行點(diǎn)擊率排序,將排序靠前的內(nèi)容展現(xiàn)給用戶,完成對(duì)用戶的內(nèi)容推薦。內(nèi)容點(diǎn)擊率預(yù)估系統(tǒng)包括離線模塊和線上模塊兩個(gè)部分:離線模塊主要包括特征提取、特征組合、模型訓(xùn)練、模型更新等功能;線上模塊主要包括特征計(jì)算、模型調(diào)用、點(diǎn)擊率計(jì)算等功能。本文主要研究?jī)?nèi)容點(diǎn)擊率預(yù)估系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)。首先對(duì)系統(tǒng)的需求進(jìn)行分析,對(duì)系統(tǒng)實(shí)現(xiàn)需要用到的相關(guān)技術(shù)進(jìn)行研究和分析,確定使用的算法。然后對(duì)系統(tǒng)進(jìn)行總體設(shè)計(jì)、詳細(xì)設(shè)計(jì)和實(shí)現(xiàn),最后進(jìn)行測(cè)試及結(jié)果分析。本文在特征提取環(huán)節(jié)采用了卡方檢驗(yàn)的方法對(duì)特征進(jìn)行選擇。在模型訓(xùn)練中采用了邏輯回歸算法進(jìn)行求解。為了防止過擬合,采用了彈性網(wǎng)正則化對(duì)代價(jià)函數(shù)進(jìn)行懲罰。當(dāng)訓(xùn)練好的模型需要更新到線上時(shí),使用讀-復(fù)制更新機(jī)制進(jìn)行模型文件的更新。使用AUC指標(biāo)進(jìn)行離線模型的評(píng)價(jià),使用實(shí)際點(diǎn)擊率作為線上服務(wù)的評(píng)價(jià)。最終通過測(cè)試得出本文研究... 

【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:67 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于彈性網(wǎng)邏輯回歸算法的內(nèi)容點(diǎn)擊率預(yù)估系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)


圖1-1邏輯回歸擬合曲線實(shí)例??Figure?1-1?an?example?of?a?logical?regression?fitting?curve??

函數(shù)圖,函數(shù),邏輯函數(shù)


s?=?wTx+a??(2-2)??Sigmoid函數(shù),如圖2-1所示。??.?;?,??/??/??o.s/??7??/??/??i?….I?I?q??i?i?i??0?2?4?6??圖2-1?Sigmoid函數(shù)圖??Figure?2-1?Sigmoid?function?diagram??Sigmoid函數(shù)能夠把點(diǎn)擊分iU映射到[0,1]區(qū)間內(nèi),我們把此函數(shù)設(shè)為階)。??則邏輯函數(shù)形式為??,、?eS?1??eCs)?=?IT^?=?TT^?(2-3)??11??

架構(gòu)圖,分布式文件系統(tǒng),架構(gòu),客戶端


需要執(zhí)行數(shù)據(jù)塊到DataNode映射的決策。DataNode負(fù)責(zé)響應(yīng)來自客戶端的文件讀??寫需求,同時(shí)負(fù)責(zé)執(zhí)行來自NameNode的關(guān)于數(shù)據(jù)塊創(chuàng)建、刪除和冗余存儲(chǔ)的指??令。如圖2-2即為分布式文件系統(tǒng)的架構(gòu)。??NameNode?、??客戶端?\^信息??^?n?廣?\?、??DataNode?DataNode?備份?f?^?C?二?????f?L??—」?事?DataNode?DataNode??——_?— ̄1 ̄ ̄ ̄u?J??——v?mm??J??V?[?IILMl?]?/??<,mm?????客戶端??■?-?J??、?圖2-2分布式文件系統(tǒng)架構(gòu)??Figure?2-2?HDFS?architecture??Hadoc?n的另一個(gè)核心MapReduce是一種用于大型商用硬件集群f?P時(shí)海量數(shù)據(jù)??14??

【參考文獻(xiàn)】:
期刊論文
[1]基于套索(Lasso)的中文垃圾郵件過濾[J]. 徐征,劉遵雄,張賢龍.  華東交通大學(xué)學(xué)報(bào). 2014(04)
[2]基于彈性網(wǎng)回歸的居民消費(fèi)價(jià)格指數(shù)分析[J]. 張哲,梁馮珍.  哈爾濱商業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(05)
[3]廣告點(diǎn)擊率估算技術(shù)綜述[J]. 紀(jì)文迪,王曉玲,周傲英.  華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(03)
[4]上市公司財(cái)務(wù)預(yù)警的正則化邏輯回歸模型[J]. 張恒,秦賓,許金鳳.  華東交通大學(xué)學(xué)報(bào). 2011(06)

碩士論文
[1]基于邏輯回歸的金融數(shù)據(jù)分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 劉展.山東大學(xué) 2017
[2]基于邏輯回歸的在線廣告CTR優(yōu)化和預(yù)測(cè)[D]. 代成雷.浙江大學(xué) 2016
[3]基于Logistic回歸模型的P2P網(wǎng)貸平臺(tái)借款人信用風(fēng)險(xiǎn)評(píng)估[D]. 王夢(mèng)佳.北京外國(guó)語(yǔ)大學(xué) 2015
[4]展示廣告中點(diǎn)擊率預(yù)估問題研究[D]. 嚴(yán)嶺.上海交通大學(xué) 2015
[5]在線廣告中高層特征表示及點(diǎn)擊率預(yù)測(cè)方法研究[D]. 邵迪.哈爾濱工業(yè)大學(xué) 2014
[6]基于特征學(xué)習(xí)的廣告點(diǎn)擊率預(yù)估技術(shù)研究[D]. 周永.哈爾濱工程大學(xué) 2014
[7]一種基于邏輯回歸模型的搜索廣告點(diǎn)擊率預(yù)估方法的研究[D]. 王兵.浙江大學(xué) 2013



本文編號(hào):3471302

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3471302.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6a758***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com