圖片廣告點(diǎn)擊率預(yù)測(cè)方法的研究及改進(jìn)
發(fā)布時(shí)間:2017-10-08 15:33
本文關(guān)鍵詞:圖片廣告點(diǎn)擊率預(yù)測(cè)方法的研究及改進(jìn)
更多相關(guān)文章: 廣告點(diǎn)擊率 數(shù)據(jù)稀疏 圖片特征 特征學(xué)習(xí) 用戶屬性推斷
【摘要】:近年來,隨著互聯(lián)網(wǎng)科技的飛速發(fā)展,在線廣告逐漸成為各大互聯(lián)網(wǎng)企業(yè)的主要盈利方式。因此針對(duì)提升用戶對(duì)廣告滿意度,提高廣告主利潤(rùn)的研究越來越重要。其中常見的研究圍繞利用海量的用戶點(diǎn)擊日志挖掘用戶個(gè)性化信息這一方向進(jìn)行,而研究中最重要的問題是如何提升廣告點(diǎn)擊率預(yù)測(cè)結(jié)果的精度。目前常見的廣告點(diǎn)擊率預(yù)測(cè)方法依賴用戶對(duì)廣告的歷史點(diǎn)擊數(shù)據(jù)學(xué)習(xí)模式進(jìn)行預(yù)測(cè)。然而用戶對(duì)廣告的歷史點(diǎn)擊數(shù)據(jù)中用戶行為數(shù)據(jù)稀疏以及用戶屬性缺失的特點(diǎn),對(duì)現(xiàn)有廣告點(diǎn)擊率預(yù)測(cè)方法提出了很大的挑戰(zhàn)。本課題針對(duì)這一挑戰(zhàn),引入了更高效的廣告圖片特征來改進(jìn)現(xiàn)有的圖片廣告點(diǎn)擊率預(yù)測(cè)方法。改進(jìn)方法的核心思想是通過高效的廣告圖片特征為新廣告找到相應(yīng)的相似廣告,利用相似廣告的歷史信息提高新廣告的點(diǎn)擊率預(yù)測(cè)精度。本課題先分析了現(xiàn)有的圖片廣告點(diǎn)擊率預(yù)測(cè)方法,以及其中相關(guān)技術(shù)的的原理。接著對(duì)當(dāng)前圖片廣告點(diǎn)擊率預(yù)測(cè)方法中廣告圖片特征提取以及用戶屬性推斷兩個(gè)環(huán)節(jié)進(jìn)行研究。針對(duì)這兩個(gè)環(huán)節(jié)中,廣告圖片視覺特征的表示能力有限、任務(wù)獨(dú)立問題和用戶屬性推斷的數(shù)據(jù)稀疏記錄預(yù)測(cè)精度偏低問題進(jìn)行改進(jìn)。為了解決這些問題,本課題利用深度卷積神經(jīng)網(wǎng)絡(luò)模型圖片特征表示能力強(qiáng)的特點(diǎn),設(shè)計(jì)了一種新的廣告圖片特征學(xué)習(xí)架構(gòu)。利用這一架構(gòu),本課題從原始廣告圖片和用戶反饋信息中抽取了廣告圖片高層抽象特征。這種方式相比傳統(tǒng)的圖片特征提取方式提取的特征更加靈活,適用于點(diǎn)擊率預(yù)測(cè)任務(wù)且不需要人工篩選組合特征。通過引入廣告圖片高層抽象特征,改進(jìn)了現(xiàn)有的用戶屬性推斷方法。并將廣告圖片高層抽象特征與點(diǎn)擊率預(yù)估模型相結(jié)合進(jìn)行預(yù)測(cè),緩解了圖片廣告點(diǎn)擊率預(yù)測(cè)中數(shù)據(jù)稀疏造成的新廣告點(diǎn)擊率預(yù)測(cè)低的問題。本課題的實(shí)驗(yàn)使用2014CCF大數(shù)據(jù)技術(shù)創(chuàng)新大賽騰訊公布的大約1G的圖片廣告點(diǎn)擊日志數(shù)據(jù)。實(shí)驗(yàn)結(jié)果驗(yàn)證了改進(jìn)的圖片廣告點(diǎn)擊率預(yù)測(cè)方法能有效提高新廣告記錄的點(diǎn)擊率預(yù)測(cè)精度。該改進(jìn)利用本課題提出的廣告圖片特征學(xué)習(xí)架構(gòu)更好的表示了用戶對(duì)廣告圖片的反應(yīng),從而實(shí)現(xiàn)新廣告記錄點(diǎn)擊率預(yù)測(cè)結(jié)果精度的提高。
【關(guān)鍵詞】:廣告點(diǎn)擊率 數(shù)據(jù)稀疏 圖片特征 特征學(xué)習(xí) 用戶屬性推斷
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP393.09
【目錄】:
- 摘要4-5
- ABSTRACT5-9
- 第1章 緒論9-15
- 1.1 課題研究背景及意義9-10
- 1.2 國內(nèi)外研究現(xiàn)狀及分析10-13
- 1.2.1 國外研究現(xiàn)狀10-12
- 1.2.2 國內(nèi)研究現(xiàn)狀12-13
- 1.3 本文主要研究?jī)?nèi)容13
- 1.4 本文的結(jié)構(gòu)13-15
- 第2章 圖片廣告特征及相關(guān)模型介紹15-26
- 2.1 引言15
- 2.2 圖片廣告特征的選取15-20
- 2.2.1 常用基礎(chǔ)特征16-17
- 2.2.2 圖片視覺特征17-18
- 2.2.3 特征選擇和特征轉(zhuǎn)換18-20
- 2.3 點(diǎn)擊率預(yù)測(cè)模型的選擇20-25
- 2.3.1 樸素貝葉斯模型20-21
- 2.3.2 決策樹集成模型21-23
- 2.3.3 因子分解機(jī)模型23-25
- 2.4 本章小結(jié)25-26
- 第3章 圖片廣告CTR預(yù)測(cè)方法與改進(jìn)研究26-39
- 3.1 引言26
- 3.2 廣告圖片特征學(xué)習(xí)方法的改進(jìn)研究26-34
- 3.2.1 圖片視覺特征效果分析26-29
- 3.2.2 傳統(tǒng)的圖片分類學(xué)習(xí)架構(gòu)29-31
- 3.2.3 設(shè)計(jì)的廣告圖片特征學(xué)習(xí)架構(gòu)31-33
- 3.2.4 改進(jìn)后廣告圖片特征學(xué)習(xí)實(shí)驗(yàn)33-34
- 3.3 用戶屬性推斷方法的改進(jìn)研究34-36
- 3.4 改進(jìn)方法在模型中的應(yīng)用36-38
- 3.4.1 聚類算法特征離散化36-37
- 3.4.2 圖片特征在模型中的應(yīng)用37-38
- 3.5 本章小結(jié)38-39
- 第4章 改進(jìn)的圖片廣告CTR預(yù)測(cè)方法實(shí)驗(yàn)39-52
- 4.1 騰訊廣告點(diǎn)擊日志數(shù)據(jù)39-41
- 4.1.1 數(shù)據(jù)描述39-40
- 4.1.2 數(shù)據(jù)分析40
- 4.1.3 訓(xùn)練預(yù)測(cè)數(shù)據(jù)集生成40-41
- 4.2 模型評(píng)價(jià)指標(biāo)41-42
- 4.3 用戶屬性推斷實(shí)驗(yàn)設(shè)計(jì)與分析42-44
- 4.3.1 用戶屬性的影響分析42-43
- 4.3.2 改進(jìn)用戶屬性推斷實(shí)驗(yàn)分析43-44
- 4.4 貝葉斯模型實(shí)驗(yàn)設(shè)計(jì)及分析44-47
- 4.4.1 改進(jìn)圖片特征提取的效果分析45-46
- 4.4.2 不同聚類數(shù)下的效果分析46-47
- 4.5 因子分解機(jī)模型實(shí)驗(yàn)設(shè)計(jì)及分析47-51
- 4.5.1 模型參數(shù)的影響分析48-49
- 4.5.2 改進(jìn)圖片特征提取的效果分析49-50
- 4.5.3 不同特征聚類數(shù)下的影響分析50-51
- 4.6 本章小結(jié)51-52
- 結(jié)論52-54
- 參考文獻(xiàn)54-60
- 致謝60
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前4條
1 智穎;;2015全球廣告預(yù)測(cè)報(bào)告[J];中國廣告;2015年03期
2 施夢(mèng)圜;顧津吉;;基于平衡采樣的輕量級(jí)廣告點(diǎn)擊率預(yù)估方法[J];計(jì)算機(jī)應(yīng)用研究;2014年01期
3 涂丹丹;舒承椿;余海燕;;基于聯(lián)合概率矩陣分解的上下文廣告推薦算法[J];軟件學(xué)報(bào);2013年03期
4 劉曉明;田雨;何徽;仲元紅;;一種改進(jìn)的非局部均值圖像去噪算法[J];計(jì)算機(jī)工程;2012年04期
,本文編號(hào):994833
本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/994833.html
最近更新
教材專著