基于深度學(xué)習(xí)的搜索廣告點擊率預(yù)測方法研究
發(fā)布時間:2017-06-13 14:12
本文關(guān)鍵詞:基于深度學(xué)習(xí)的搜索廣告點擊率預(yù)測方法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,海量數(shù)據(jù)背景下的網(wǎng)絡(luò)營銷方式越來越受青睞。在線廣告作為新的廣告形式應(yīng)運而生,展現(xiàn)出了巨大的市場潛力和商業(yè)價值,搜索廣告是規(guī)模最大,增長最快的在線廣告形式,它根據(jù)用戶搜索的內(nèi)容投放相關(guān)的廣告,如今已經(jīng)成為互聯(lián)網(wǎng)行業(yè)的主要收入來源之一。搜索廣告背后最為關(guān)鍵的技術(shù)是廣告點擊率的預(yù)測,它不但關(guān)系到廣告投放的排名,也影響著廣告點擊的收費。因此,如何有效的利用海量歷史數(shù)據(jù)對搜索廣告的點擊率進行預(yù)測是一項非常有意義的工作。目前已有的工作大多基于淺層模型進行搜索廣告的點擊率預(yù)測,淺層模型在特征學(xué)習(xí)方面是直接使用統(tǒng)計學(xué)習(xí)方法計算得到的特征,特征中每一維的含義固定并且孤立,不能表達內(nèi)部之間的關(guān)系。本文研究的目標(biāo)是通過給定的信息預(yù)測搜索廣告的點擊率,通過使用深度學(xué)習(xí)模型,挖掘更多的特征之間的關(guān)系,從而能更有效的提高預(yù)測的結(jié)果。具體地,本文主要包含如下三方面的研究內(nèi)容。第一、本文從搜索廣告點擊率預(yù)測的定義出發(fā),分析了數(shù)據(jù)集的數(shù)據(jù)的分布和特點并對數(shù)據(jù)集進行了預(yù)處理,在此基礎(chǔ)上,本文根據(jù)對搜索廣告的認(rèn)識和在實際應(yīng)用中的特性,提取了六類不同的特征。其次,針對深度學(xué)習(xí)在搜索廣告點擊率預(yù)測應(yīng)用中的訓(xùn)練耗時和內(nèi)存限制,本文設(shè)計了一種基于GPU計算的分塊實現(xiàn)方案。第二、本文首先使用了樸素貝葉斯模型、邏輯斯蒂回歸模型和支持向量回歸模型等主流方法對點擊率進行預(yù)測,并分析了他們的不足。進而使用基于深度神經(jīng)網(wǎng)絡(luò)模型的搜索廣告點擊率預(yù)測的方法,我們使用dropout方法來降低在訓(xùn)練時過擬合造成的影響。實驗結(jié)果表明,在特征相同的情況下,本文使用的深度神經(jīng)網(wǎng)絡(luò)模型方法能取得比主流方法更好的預(yù)測結(jié)果。第三、本文提出了面向搜索廣告點擊率預(yù)測的卷積神經(jīng)網(wǎng)絡(luò)模型,通過基于局部窗口概念的卷積操作和亞采樣操作,完成了從局部到整體的特征學(xué)習(xí)。在KDD Cup 2012中Track 2數(shù)據(jù)集上的實驗結(jié)果表明,本文所使用的基于卷積神經(jīng)網(wǎng)絡(luò)的搜索廣告點擊率預(yù)測的方法能有效的提高點擊率預(yù)測的結(jié)果。
【關(guān)鍵詞】:點擊率預(yù)測 搜索廣告 深度學(xué)習(xí) 深度神經(jīng)網(wǎng)絡(luò) 卷積神經(jīng)網(wǎng)絡(luò)
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.3;TP18
【目錄】:
- 摘要4-5
- ABSTRACT5-8
- 第1章 緒論8-15
- 1.1 本文研究的背景和意義8-9
- 1.2 國內(nèi)外研究現(xiàn)狀9-12
- 1.2.1 搜索廣告點擊率預(yù)測的研究現(xiàn)狀9-11
- 1.2.2 深度學(xué)習(xí)的研究現(xiàn)狀11-12
- 1.3 問題的難點和本文的研究思路12-13
- 1.4 本文內(nèi)容安排13-15
- 第2章 問題定義和特征提取15-28
- 2.1 引言15
- 2.2 問題定義15-16
- 2.3 數(shù)據(jù)預(yù)處理16-18
- 2.4 特征提取18-23
- 2.4.1 類別稀疏特征18-19
- 2.4.2 歷史點擊率特征19
- 2.4.3 相似度特征19-20
- 2.4.4 位置信息特征20-21
- 2.4.5 高影響力特征21
- 2.4.6 詞向量特征21-23
- 2.5 計算實現(xiàn)23-25
- 2.6 問題的評價指標(biāo)25-26
- 2.7 本章小結(jié)26-28
- 第3章 基于深度神經(jīng)網(wǎng)絡(luò)模型的廣告點擊率預(yù)測28-45
- 3.1 引言28
- 3.2 基于淺層學(xué)習(xí)模型的廣告點擊率預(yù)測28-32
- 3.2.1 基于樸素貝葉斯模型的廣告點擊率預(yù)測28-29
- 3.2.2 基于邏輯斯蒂回歸模型的廣告點擊率預(yù)測29-30
- 3.2.3 基于支持向量回歸模型的廣告點擊率預(yù)測30-32
- 3.3 深度神經(jīng)網(wǎng)絡(luò)模型32-36
- 3.3.1 人工神經(jīng)元模型32-33
- 3.3.2 BP神經(jīng)網(wǎng)絡(luò)33-34
- 3.3.3 深度神經(jīng)網(wǎng)絡(luò)模型34-36
- 3.4 面向廣告點擊率預(yù)測的深度神經(jīng)網(wǎng)絡(luò)模型36-37
- 3.5 實驗評測37-44
- 3.5.1 實驗設(shè)置37
- 3.5.2 實驗結(jié)果與分析37-44
- 3.6 本章小結(jié)44-45
- 第4章 基于卷積神經(jīng)網(wǎng)絡(luò)模型的廣告點擊率預(yù)測45-57
- 4.1 引言45
- 4.2 卷積神經(jīng)網(wǎng)絡(luò)模型45-50
- 4.2.1 稀疏連接46-47
- 4.2.2 權(quán)值共享47-48
- 4.2.3 卷積層48-49
- 4.2.4 亞采樣層49
- 4.2.5 全連接層49-50
- 4.3 面向廣告點擊率預(yù)測的卷積神經(jīng)網(wǎng)絡(luò)模型50-51
- 4.3.1 基于卷積神經(jīng)網(wǎng)絡(luò)的廣告點擊率預(yù)測模型結(jié)構(gòu)50
- 4.3.2 基于卷積神經(jīng)網(wǎng)絡(luò)的廣告點擊率預(yù)測過程50-51
- 4.4 實驗評測51-55
- 4.4.1 實驗設(shè)置51-52
- 4.4.2 實驗結(jié)果與分析52-55
- 4.5 本章小結(jié)55-57
- 結(jié)論57-59
- 參考文獻59-63
- 攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文63-65
- 致謝65
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 孫志軍;薛磊;許陽明;王正;;深度學(xué)習(xí)研究綜述[J];計算機應(yīng)用研究;2012年08期
本文關(guān)鍵詞:基于深度學(xué)習(xí)的搜索廣告點擊率預(yù)測方法研究,,由筆耕文化傳播整理發(fā)布。
本文編號:446756
本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/446756.html
最近更新
教材專著