天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 文藝論文 > 廣告藝術(shù)論文 >

搜索廣告點(diǎn)擊率預(yù)測算法研究與實(shí)現(xiàn)

發(fā)布時間:2020-09-08 15:50
   互聯(lián)網(wǎng)廣告主要分為搜索廣告、展示廣告等形式,而在這其中,搜索廣告是規(guī)模最大,增長最快的廣告投放方式。搜索廣告是依據(jù)用戶提供的查詢關(guān)鍵字對廣告進(jìn)行投放,是最了解用戶搜索意圖的廣告投放形式。搜索廣告最關(guān)鍵的技術(shù)是廣告點(diǎn)擊率的預(yù)測,廣告點(diǎn)擊率預(yù)測就是預(yù)測分析用戶行為對投放的廣告的點(diǎn)擊率,廣告點(diǎn)擊率關(guān)系著廣告投放的排序和廣告點(diǎn)擊收費(fèi)等因素,因此研究廣告點(diǎn)擊率對整個搜索廣告收入提高有著至關(guān)重要的意義。搜索廣告利用搜索引擎的技術(shù),分析用戶輸入的查詢意圖,提取相應(yīng)的關(guān)鍵詞,根據(jù)提取到的關(guān)鍵詞,進(jìn)行語義相關(guān)度計算,從廣告庫中進(jìn)行索引,給出相應(yīng)符合用戶需求的廣告檢索結(jié)果。當(dāng)搜索引擎等平臺提供的檢索排序候選結(jié)果中的廣告,與用戶輸入的關(guān)鍵詞等相關(guān)性越高,用戶越感興趣,點(diǎn)擊的行為可能性越高,相應(yīng)的廣告點(diǎn)擊率越高,廣告收入越高。本文的主要研究和實(shí)現(xiàn)內(nèi)容安排如下:(1)首先對數(shù)據(jù)集進(jìn)行清洗和預(yù)處理,統(tǒng)計數(shù)據(jù)信息,提取淺層的特征,并采用常見的機(jī)器學(xué)習(xí)方法進(jìn)行特征工程。邏輯斯蒂回歸模型作為基線方法,將預(yù)測的點(diǎn)擊率問題作為分類問題,在采用傳統(tǒng)機(jī)器學(xué)習(xí)方法中,使用GBDT模型與邏輯斯蒂回歸模型融合的方案,對特征組合,進(jìn)一步深入挖掘影響點(diǎn)擊率的因素,提高模型的非線性學(xué)習(xí)能力。對于數(shù)據(jù)集中出現(xiàn)的數(shù)據(jù)稀疏和缺失問題,采用近幾年在各種比賽中效果比較好的因子分解機(jī)FM算法,與基線方法比較優(yōu)化結(jié)果。(2)搜索廣告中的用戶查詢請求與廣告標(biāo)題之間的相似度對點(diǎn)擊率有至關(guān)重要的作用,本文首先采用卷積神經(jīng)網(wǎng)絡(luò)模型來提取深層次的相似度特征,并將其與人工挖掘到的特征相結(jié)合,共同輸入到點(diǎn)擊率的預(yù)測模型中,得到實(shí)驗(yàn)結(jié)果,實(shí)現(xiàn)效果提升。(3)循環(huán)神經(jīng)網(wǎng)絡(luò)更適合處理序列數(shù)據(jù),因此本文也研究了基于循環(huán)神經(jīng)網(wǎng)絡(luò)的相似度的特征提取。實(shí)驗(yàn)分析對比不同類型循環(huán)神經(jīng)網(wǎng)絡(luò)模型的實(shí)驗(yàn)結(jié)果,如長短期記憶單元網(wǎng)絡(luò),門控循環(huán)單元網(wǎng)絡(luò),及相應(yīng)的雙向網(wǎng)絡(luò)形式等,并結(jié)合靜態(tài)注意力和動態(tài)注意力機(jī)制比較實(shí)驗(yàn)結(jié)果,提取最好的相似度特征,從而優(yōu)化最終的點(diǎn)擊率預(yù)測結(jié)果。
【學(xué)位單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP391.3
【部分圖文】:

廣告,關(guān)鍵詞,用戶輸入,廣告主


的廣告的鏈接,最終被用戶發(fā)現(xiàn),消費(fèi)和分散了用戶如今互聯(lián)網(wǎng)中,最稀缺的資源就是用戶的注意力,就給廣告主等需求方提供一種購買用戶注意力(流量)的告抵達(dá)用戶。在搜索引擎中,用戶輸入關(guān)鍵詞來進(jìn)了一定比例的流量。廣告主買斷一些關(guān)鍵詞,當(dāng)用有購買該關(guān)鍵詞的廣告主進(jìn)行實(shí)時競價,從而獲得的核心關(guān)鍵技術(shù)之一就是廣告點(diǎn)擊率預(yù)測,廣告點(diǎn)TR)的定義是用戶點(diǎn)擊該廣告的次數(shù) num_click 與用impression 的比值。公式如 2-1 下: 影響著投放廣告的順序,同時也影響著廣告的出價策詞“手機(jī)”時,廣告主通過競價買斷了關(guān)鍵詞“手機(jī)”,主投放的有關(guān)“手機(jī)”的廣告,平臺就會按照一定的廣告,如圖 2-1 所示:

函數(shù)曲線圖,凸函數(shù),極大似然估計方法,邊際分布


圖 3- 1 Sigmoid 函數(shù)曲線圖數(shù)的輸出結(jié)果是介于(0,1)之間,中間值 c 是 0.5,則出 h(x)代表數(shù)據(jù)屬于某一類別的概率,對于輸入 x 率分別為 ( ) ( ), ( ) 中的極大似然估計方法去求損失函數(shù),概率函數(shù)如 ( ) ( ( ) ( ( ) 據(jù)獨(dú)立分布,聯(lián)合分布可表示為各個邊際分布的乘積 ( ) ∏ ( ( )| ( ) ( ) ∏ ( ( ) ( ) ( ( ) ( )凸函數(shù),由于凸函數(shù)的局部最小值等同于全局最小得到 3-6 式:

點(diǎn)擊率,長尾分布,廣告,特征提取


哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文Fm 1(x) 為當(dāng)前的模型,模型通過經(jīng)驗(yàn)風(fēng)險極小化來確定下一個弱分類器參數(shù)。具體到損失函數(shù)本身的選擇也就是 L 的選擇,有平方損失函數(shù),0-1 損函數(shù),對數(shù)損失函數(shù)等等。當(dāng)選擇平方損失函數(shù)時,這個差值就是殘差。GBDT 幾乎適用于所有線性和非線性的回歸問題,同時也可以設(shè)置閾值解二分類問題,應(yīng)用范圍比較廣。GBDT 可以給邏輯斯蒂回歸模型訓(xùn)練,提高告點(diǎn)擊率。如圖 3-2 所示,輸入樣本 x,GBDT 模型得到兩顆樹 tree1 和 tree2,兩棵樹個葉子節(jié)點(diǎn)都是 LR 模型的一個維度特征,在求和每個葉子權(quán)重及時 LR 模型分類結(jié)果。

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張明紅;佘廉;耿波;;基于情景的結(jié)構(gòu)化突發(fā)事件相似度研究[J];中國管理科學(xué);2017年01期

2 陳葉斐;張學(xué)軍;黃衛(wèi)東;;基于干擾相似度的多話題演化模型[J];電信科學(xué);2017年09期

3 任雪利;代余彪;;軟件相似度在成本估算中的應(yīng)用[J];計算機(jī)應(yīng)用與軟件;2015年06期

4 譚明超;刁興春;曹建軍;馮徑;;一種基于函數(shù)依賴的屬性相似度調(diào)整算法[J];上海交通大學(xué)學(xué)報;2015年08期

5 陳立鳳;;河馬找親戚[J];學(xué)生之友(童花果);2016年12期

6 周嫻莉;;十個中文流行語翻譯[J];初中生輔導(dǎo);2016年36期

7 杜碧涵;;母愛[J];少年月刊;2017年05期

8 張呈宇;;熱點(diǎn)話題相似度常用算法比較[J];好家長;2017年12期

9 仇麗青;陳卓艷;;基于共同鄰居相似度的社區(qū)發(fā)現(xiàn)算法[J];信息系統(tǒng)工程;2014年05期

10 詹雪艷;林兆洲;段天璇;李磊;喬延江;;色譜指紋圖譜相似度方法的適應(yīng)性研究[J];中國中醫(yī)藥信息雜志;2012年05期

相關(guān)會議論文 前10條

1 張乃岳;張學(xué)燕;;基于個體詞語相似度的定制化動態(tài)信息檢索[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年

2 李紅蓮;潘建軍;范京;;音節(jié)相似度及其在語音識別中的應(yīng)用[A];第十四屆全國信號處理學(xué)術(shù)年會(CCSP-2009)論文集[C];2009年

3 丁維龍;吳水生;陳琦;程志君;;基于樹形結(jié)構(gòu)相似度的植物種類識別系統(tǒng)[A];2013年中國智能自動化學(xué)術(shù)會議論文集(第五分冊)[C];2013年

4 董刊生;方金云;;基于向量距離的詞序相似度算法[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年

5 郭瑛媚;史曉東;陳毅東;高燕;;基于詞的話題分布相似度的無監(jiān)督日文旅游意見詞翻譯[A];機(jī)器翻譯研究進(jìn)展——第七屆全國機(jī)器翻譯研討會論文集[C];2011年

6 王茜;張衛(wèi)星;;基于分類樹相似度加權(quán)的協(xié)同過濾算法[A];2008年計算機(jī)應(yīng)用技術(shù)交流會論文集[C];2008年

7 Peng Ding;Xin Yan;Zhihong Liu;Jiewen Du;Yuehua Xu;Qiong Gu;Jun Xu;;TarExplorer:基于三維相似度的活性小分子尋靶平臺(英文)[A];中國化學(xué)會第30屆學(xué)術(shù)年會摘要集-第二十五分會:化學(xué)信息學(xué)與化學(xué)計量學(xué)[C];2016年

8 劉曉平;陸勁挺;;任意功能樹的物元相似度求解方法[A];全國第21屆計算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2010)暨全國第2屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會議論文集[C];2010年

9 劉海波;鄭德權(quán);趙鐵軍;;基于相似度線性加權(quán)方法的檢索結(jié)果聚類研究[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年

10 羅辛;歐陽元新;熊璋;袁滿;;通過相似度支持度優(yōu)化基于K近鄰的協(xié)同過濾算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集A輯一[C];2010年

相關(guān)重要報紙文章 前10條

1 楊林;住宿按“相似度”分 體現(xiàn)學(xué)生視角[N];北京日報;2017年

2 證券時報記者  韓如冰;基金投資相似度趨高[N];證券時報;2006年

3 本報記者 王斌 本報實(shí)習(xí)生 蒲曉磊;版權(quán)局官員:相似度極高的不受保護(hù)[N];法制日報;2012年

4 記者 李學(xué)梅;研究證實(shí):父親“偏愛”與自己相像的孩子[N];新華每日電訊;2009年

5 天相投資顧問公司 張新文;風(fēng)格穩(wěn)定基金業(yè)績更勝一籌[N];證券時報;2007年

6 記者 劉妮;曾維會見日本新任駐沈總領(lǐng)事[N];沈陽日報;2012年

7 小新;妊娠中毒癥與夫婦HLA基因相似度有關(guān)[N];中國醫(yī)藥報;2007年

8 海潮;俄研究發(fā)現(xiàn)妊娠中毒癥疑與夫婦HLA基因相似度有關(guān)[N];中國醫(yī)藥報;2007年

9 欒海;妊娠中毒癥可能與夫婦 HLA基因相似度有關(guān)[N];醫(yī)藥經(jīng)濟(jì)報;2007年

10 海納;“娛樂”模仿的憂慮[N];河北日報;2013年

相關(guān)博士學(xué)位論文 前10條

1 王玉標(biāo);基于動態(tài)信任建模的云服務(wù)可信性評估與選擇研究[D];重慶大學(xué);2018年

2 高欣健;多模態(tài)相似度學(xué)習(xí)方法研究[D];合肥工業(yè)大學(xué);2017年

3 夏云慶;IHSMTS系統(tǒng)中啟發(fā)式類比翻譯處理機(jī)制(HATM)的設(shè)計與實(shí)現(xiàn)[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2001年

4 武威;異質(zhì)數(shù)據(jù)相似度學(xué)習(xí)及其在網(wǎng)絡(luò)搜索中的應(yīng)用[D];北京大學(xué);2012年

5 張明西;信息網(wǎng)絡(luò)中的相似度搜索問題研究[D];復(fù)旦大學(xué);2013年

6 朱娜斐;基于RTT相似度的網(wǎng)絡(luò)延遲估測理論和方法[D];北京工業(yè)大學(xué);2012年

7 錢鵬飛;基于模糊相似度的異構(gòu)本體映射、合并及校驗(yàn)方法的研究[D];上海交通大學(xué);2008年

8 朱笑塵;異質(zhì)過程數(shù)據(jù)集成與修復(fù)[D];清華大學(xué);2015年

9 賈連印;內(nèi)存數(shù)據(jù)庫中集合相似度及集合包含問題的研究[D];華南理工大學(xué);2012年

10 崔曉蘭;面向在線抱怨自動處理的推薦方法研究[D];華中科技大學(xué);2017年

相關(guān)碩士學(xué)位論文 前10條

1 呂如州;基于結(jié)構(gòu)元理論的模糊數(shù)相似度及應(yīng)用研究[D];遼寧工程技術(shù)大學(xué);2016年

2 夏雨;在線評論中產(chǎn)品特征提取與意見挖掘研究[D];武漢理工大學(xué);2016年

3 方敏;基于節(jié)點(diǎn)相似度的線要素匹配方法設(shè)計[D];北京建筑大學(xué);2018年

4 張學(xué)理;基于多因子標(biāo)簽相似度的標(biāo)簽聚類算法的研究[D];遼寧大學(xué);2018年

5 李凱翔;產(chǎn)科知識圖譜的構(gòu)建與研究[D];鄭州大學(xué);2018年

6 李超男;基于節(jié)點(diǎn)相似度的社會網(wǎng)絡(luò)社團(tuán)發(fā)現(xiàn)的算法研究[D];重慶師范大學(xué);2018年

7 花凌鋒;面向位置的移動新聞推薦研究[D];安徽理工大學(xué);2018年

8 丁明珠;基于混合相似度指標(biāo)的社團(tuán)劃分算法研究[D];山東師范大學(xué);2018年

9 楊飛;基于LSTM的文本相似度識別方法研究[D];吉林大學(xué);2018年

10 常明;搜索廣告點(diǎn)擊率預(yù)測算法研究與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2018年



本文編號:2814354

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/2814354.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d5f52***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com