基于邏輯回歸模型的廣告點(diǎn)擊率預(yù)估系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
本文選題:特征選擇 + 廣告點(diǎn)擊率; 參考:《哈爾濱工業(yè)大學(xué)》2016年碩士論文
【摘要】:如今互聯(lián)網(wǎng)變現(xiàn)和收入的主要來(lái)源是廣告,像Google、Yahoo、Facebook等靠廣告收入的公司已經(jīng)走在互聯(lián)網(wǎng)廣告行業(yè)的前沿。所以如何研究廣告變現(xiàn)、如何提高廣告的收入是現(xiàn)在國(guó)內(nèi)外各大互聯(lián)網(wǎng)研究和人才競(jìng)爭(zhēng)的熱點(diǎn)。其中,互聯(lián)網(wǎng)廣告中的移動(dòng)廣告與傳統(tǒng)的廣告在廣告收費(fèi)和廣告展現(xiàn)上都有著本質(zhì)的區(qū)別。移動(dòng)廣告主要研究的是如何從更大更多的流量和數(shù)以百萬(wàn)計(jì)的廣告庫(kù)中選取合適的廣告對(duì)用戶進(jìn)行精準(zhǔn)的投放。但是如何在這樣復(fù)雜而且需要消耗高性能為代價(jià)的環(huán)境中對(duì)廣告進(jìn)行排序,以及如何設(shè)計(jì)和實(shí)現(xiàn)這樣一個(gè)能對(duì)每個(gè)候選廣告計(jì)算點(diǎn)擊率大小的系統(tǒng)是本文研究的主要工作。以上提出的是基于用戶當(dāng)時(shí)所觸發(fā)的環(huán)境,利用用戶本身的信息和用戶瀏覽的頁(yè)面信息,對(duì)相關(guān)的廣告計(jì)算被該用戶點(diǎn)擊的概率大小,從而按照計(jì)算的概率對(duì)廣告排序,選取點(diǎn)擊率最大的廣告展現(xiàn)給用戶,這就是廣告點(diǎn)擊率(Click-Through Rate,CTR)的預(yù)估。以CTR的大小對(duì)候選廣告排序做了一件一石三鳥的事情,對(duì)廣告主來(lái)說(shuō)提高了廣告的傳播;對(duì)廣告投放公司來(lái)說(shuō)提高了他們的收入;對(duì)用戶來(lái)說(shuō)提高了體驗(yàn)。與傳統(tǒng)的廣告排序和投放相比,移動(dòng)廣告有著更全面的信息、更復(fù)雜的環(huán)境、更準(zhǔn)確的預(yù)估和投放。本文主要研究CTR預(yù)估系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),對(duì)特征的選擇進(jìn)行了詳細(xì)的闡述,對(duì)算法模塊進(jìn)行了優(yōu)化和實(shí)驗(yàn)對(duì)比,具體的步驟分為:首先,提出CTR預(yù)估系統(tǒng)的總體設(shè)計(jì),功能和非功能的需求分析;然后,提出CTR預(yù)估系統(tǒng)實(shí)現(xiàn)的技術(shù)方案和評(píng)價(jià)指標(biāo);其次,將CTR預(yù)估系統(tǒng)分為線上和線下兩個(gè)模塊分別進(jìn)行了實(shí)現(xiàn);最后,對(duì)特征選擇模塊首次加入了時(shí)間因子的衰減指數(shù)和加入APP的分類信息,并分別提出了基于邏輯回歸算法、貝葉斯算法、支持向量機(jī)算法、融合(梯度提升樹加邏輯回歸)算法的CTR預(yù)估,并通過(guò)實(shí)驗(yàn)對(duì)比優(yōu)化和線下的測(cè)試,使本文提出的CTR預(yù)估系統(tǒng)效果得以提升。
[Abstract]:Advertising is now the main source of Internet cash and revenue, and companies such as Google Yahoo Facebook are already at the forefront of the Internet advertising industry. Therefore, how to study advertising realization and how to increase advertising revenue are the hot spots of Internet research and talent competition at home and abroad. Among them, mobile advertising in Internet advertising and traditional advertising in advertising charges and advertising display have essential differences. The main research of mobile advertising is how to select appropriate ads from more and more traffic and millions of ad stores to deliver the users accurately. However, how to sort advertisements in such a complex and high-performance environment, and how to design and implement such a system which can calculate the click rate for each candidate advertisement is the main work of this paper. The above proposal is based on the environment triggered by the user at that time, using the user's own information and the page information viewed by the user to calculate the probability of the advertisement being clicked by the user, so as to sort the advertisement according to the calculated probability. Select the most click-through ads to display to the user, which is the estimate of Click-Through rate (CTR). By the size of the CTR to list the candidate ads to do one thing three birds, for advertisers to increase the spread of advertising; for advertising companies to increase their income; for users to improve the experience. Compared with the traditional advertising ordering and delivery, mobile advertising has more comprehensive information, more complex environment, more accurate prediction and delivery. This paper mainly studies the design and implementation of CTR prediction system, describes the selection of features in detail, optimizes the algorithm module and compares the experimental results. The specific steps are as follows: first, the overall design of CTR prediction system is proposed. Functional and non-functional requirements analysis; then, the CTR prediction system implementation of the technical scheme and evaluation indicators; secondly, the CTR prediction system is divided into online and offline modules are implemented; finally, The attenuation index of time factor and the classification information of app are added to the feature selection module for the first time, and the logical regression algorithm, Bayesian algorithm and support vector machine algorithm are proposed, respectively. The CTR prediction of the fusion (gradient lifting tree plus logical regression) algorithm is improved by comparison and optimization of experiments and off-line test, which can improve the effectiveness of the CTR prediction system proposed in this paper.
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP311.52
【相似文獻(xiàn)】
相關(guān)期刊論文 前8條
1 鄭曉霞;劉超;鄒鈺;;基于邏輯回歸模型的中文垃圾短信過(guò)濾[J];黑龍江工程學(xué)院學(xué)報(bào)(自然科學(xué)版);2010年04期
2 俞慶生;;基于云平臺(tái)的邏輯回歸模型構(gòu)建算法的設(shè)計(jì)與實(shí)現(xiàn)[J];科技通報(bào);2013年06期
3 劉遵雄;黃志強(qiáng);鄭淑娟;張恒;;基于內(nèi)點(diǎn)法的稀疏邏輯回歸財(cái)務(wù)預(yù)警模型[J];計(jì)算機(jī)工程與設(shè)計(jì);2013年06期
4 邢秋菊,趙純勇,高克昌,郭躍;基于GIS的滑坡危險(xiǎn)性邏輯回歸評(píng)價(jià)研究[J];地理與地理信息科學(xué);2004年03期
5 吳敏;何瓏;;融合多特征的產(chǎn)品垃圾評(píng)論識(shí)別[J];微型機(jī)與應(yīng)用;2012年22期
6 王賢;張自力;;基于邏輯回歸的案件關(guān)聯(lián)[J];西南師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年03期
7 齊超;陳鴻昶;于巖;;基于行為分析的微博信息傳播效果[J];計(jì)算機(jī)應(yīng)用;2014年08期
8 ;[J];;年期
相關(guān)博士學(xué)位論文 前1條
1 張道軍;邏輯回歸空間加權(quán)技術(shù)及其在礦產(chǎn)資源信息綜合中的應(yīng)用[D];中國(guó)地質(zhì)大學(xué);2015年
相關(guān)碩士學(xué)位論文 前10條
1 粟武林;一種基于邏輯回歸的微博用戶可信度評(píng)估方法[D];河北大學(xué);2015年
2 胡俊;基于多元邏輯回歸和鄰域信息的高光譜遙感影像半監(jiān)督分類[D];中國(guó)礦業(yè)大學(xué);2015年
3 伊瑤瑤;基于Hadoop的數(shù)據(jù)挖掘技術(shù)研究[D];南京郵電大學(xué);2015年
4 張曉旭;基于復(fù)雜網(wǎng)絡(luò)理論的厄爾尼諾分析與預(yù)測(cè)[D];中國(guó)海洋大學(xué);2015年
5 喬寧;多元邏輯回歸在實(shí)時(shí)競(jìng)價(jià)中的應(yīng)用研究[D];河北工業(yè)大學(xué);2015年
6 李雁林;小樣本低質(zhì)量數(shù)據(jù)下貸款需求分類模型研究[D];吉林大學(xué);2016年
7 代成雷;基于邏輯回歸的在線廣告CTR優(yōu)化和預(yù)測(cè)[D];浙江大學(xué);2016年
8 馬姝;基于數(shù)據(jù)挖掘的消費(fèi)者購(gòu)買預(yù)測(cè)的研究[D];云南財(cái)經(jīng)大學(xué);2016年
9 劉鵬舉;基于判別學(xué)習(xí)的單目標(biāo)跟蹤系統(tǒng)研究與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2016年
10 董書超;基于邏輯回歸模型的廣告點(diǎn)擊率預(yù)估系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2016年
,本文編號(hào):2042046
本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/2042046.html