基于內容廣告平臺的點擊率預估系統(tǒng)的設計與實現(xiàn)
本文關鍵詞: 內容廣告 廣告相關性 點擊率預估 廣告排序 邏輯回歸 出處:《南京大學》2012年碩士論文 論文類型:學位論文
【摘要】:內容廣告是互聯(lián)網廣告的一種,基于分析頁面內容和用戶信息將高相關性廣告展現(xiàn)在網頁上。內容廣告系統(tǒng)與傳統(tǒng)互聯(lián)網廣告系統(tǒng)有著很大的不同,內容廣告系統(tǒng)主要將小廣告主的廣告展現(xiàn)在長尾流量上,因此,內容廣告系統(tǒng)的廣告庫更大,流量也更多。在內容廣告系統(tǒng)中,每次廣告檢索都是從百萬級的廣告庫中挑選與頁面、用戶信息最相關的部分廣告,由于性能原因,無法運用復雜的技術逐一計算每條廣告的相關性,所以,內容廣告系統(tǒng)按照相關性計算的復雜度將檢索過程分成兩個部分:廣告粗選和廣告排序。廣告粗選階段采用計算量較小的技術挑選部分廣告,然后在廣告排序階段運用復雜的分析技術對這部分廣告進行排序。本文主要關注廣告排序階段,即點擊率預估。 傳統(tǒng)計算相關性的方法是提取廣告和頁面的關鍵詞向量,計算兩個向量的相似度,這種方法最大的缺點是忽略了廣告展示和點擊的歷史日志。本文介紹的點擊率預估系統(tǒng)通過提取廣告、用戶和頁面信息的特征,運用邏輯回歸模型預估廣告點擊率,并基于此對廣告進行排序,邏輯回歸模型從線下廣告歷史日志中訓練得出。相對于傳統(tǒng)方法,點擊率預估技術利用的信息更加全面,從歷史日志中挖掘信息訓練模型也使得相關性計算更加準確。 本文主要介紹了點擊率預估系統(tǒng)的設計與實現(xiàn)。首先介紹了國內外計算廣告相關性的各種方法,引出了點擊率預估,然后介紹了點擊率預估的算法原理和在實現(xiàn)點擊率預估系統(tǒng)的過程中使用的主要技術。在后續(xù)章節(jié)中,通過對內容廣告系統(tǒng)的整體架構以及設計思想的分析,引出了點擊率預估的需求包括功能、性能和內外部接口。圍繞著需求展開了對點擊率預估系統(tǒng)的設計與實現(xiàn)的介紹,并著重在性能和算法實驗的便捷性兩個方面做了重點的分析優(yōu)化。最后詳細分析了點擊率預估系統(tǒng)對整個內容廣告系統(tǒng)帶來的效果提升。論文的最后,通過總結與展望,對技術的改進方向以及應用前景做了進一步的分析。
[Abstract]:Content advertising is a kind of Internet advertising, which is based on analyzing page content and user information to display highly relevant ads on web pages. Content advertising systems are very different from traditional Internet advertising systems. The content advertising system mainly displays the small advertisers' advertisements on the long tail flow, so the content advertising system has a larger advertising base and more traffic. In the content advertising system, Each advertising retrieval is a selection of pages from the millions of ad libraries, the most relevant part of user information, because of performance reasons, can not use complex technology to calculate the relevance of each ad, so, The content advertising system divides the retrieval process into two parts according to the complexity of correlation calculation: ad selection and advertisement sorting. Then we use the complex analysis technology to sort this part of advertisements in the advertising sequencing stage. This paper mainly focuses on the advertising sequencing stage, that is, the prediction of click rate. The traditional method to calculate the correlation is to extract the keyword vector of the advertisement and the page, and calculate the similarity between the two vectors. The biggest drawback of this method is that it ignores the historical log of advertising display and click. The click rate prediction system introduced in this paper uses the logical regression model to estimate the ad click rate by extracting the features of advertisement, user and page information. The logical regression model is trained from the offline advertising history log. Compared with the traditional method, the information used by the click rate estimation technology is more comprehensive. Mining information training model from history log also makes correlation calculation more accurate. This paper mainly introduces the design and realization of the prediction system of click rate. Firstly, it introduces various methods of calculating the correlation of advertisement at home and abroad, and leads to the prediction of click rate. Then it introduces the algorithm principle and main technology used in the process of realizing the prediction system of click rate. In the following chapters, through the analysis of the whole structure and design idea of the content advertising system, The requirements for the prediction of click rate include function, performance and internal and external interfaces. The design and implementation of the system are introduced around the demand. The performance and the convenience of algorithm experiment are analyzed and optimized in detail. Finally, the effect of the click rate prediction system on the whole content advertising system is analyzed in detail. The improvement direction and application prospect of the technology are further analyzed.
【學位授予單位】:南京大學
【學位級別】:碩士
【學位授予年份】:2012
【分類號】:TP311.52
【相似文獻】
相關期刊論文 前10條
1 鄭曉霞;劉超;鄒鈺;;基于邏輯回歸模型的中文垃圾短信過濾[J];黑龍江工程學院學報(自然科學版);2010年04期
2 俞慶生;;基于云平臺的邏輯回歸模型構建算法的設計與實現(xiàn)[J];科技通報;2013年06期
3 劉遵雄;黃志強;鄭淑娟;張恒;;基于內點法的稀疏邏輯回歸財務預警模型[J];計算機工程與設計;2013年06期
4 邢秋菊,趙純勇,高克昌,郭躍;基于GIS的滑坡危險性邏輯回歸評價研究[J];地理與地理信息科學;2004年03期
5 吳敏;何瓏;;融合多特征的產品垃圾評論識別[J];微型機與應用;2012年22期
6 王賢;張自力;;基于邏輯回歸的案件關聯(lián)[J];西南師范大學學報(自然科學版);2009年03期
7 齊超;陳鴻昶;于巖;;基于行為分析的微博信息傳播效果[J];計算機應用;2014年08期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相關碩士學位論文 前4條
1 祁全昌;基于內容廣告平臺的點擊率預估系統(tǒng)的設計與實現(xiàn)[D];南京大學;2012年
2 劉力銀;基于邏輯回歸的推薦技術研究及應用[D];電子科技大學;2013年
3 王兵;一種基于邏輯回歸模型的搜索廣告點擊率預估方法的研究[D];浙江大學;2013年
4 劉建明;高管變更對民營企業(yè)進入高壁壘行業(yè)的影響研究[D];南開大學;2011年
,本文編號:1516239
本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/1516239.html