搜索廣告點(diǎn)擊率預(yù)測算法研究與實(shí)現(xiàn)
【學(xué)位單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP391.3
【部分圖文】:
的廣告的鏈接,最終被用戶發(fā)現(xiàn),消費(fèi)和分散了用戶如今互聯(lián)網(wǎng)中,最稀缺的資源就是用戶的注意力,就給廣告主等需求方提供一種購買用戶注意力(流量)的告抵達(dá)用戶。在搜索引擎中,用戶輸入關(guān)鍵詞來進(jìn)了一定比例的流量。廣告主買斷一些關(guān)鍵詞,當(dāng)用有購買該關(guān)鍵詞的廣告主進(jìn)行實(shí)時競價,從而獲得的核心關(guān)鍵技術(shù)之一就是廣告點(diǎn)擊率預(yù)測,廣告點(diǎn)TR)的定義是用戶點(diǎn)擊該廣告的次數(shù) num_click 與用impression 的比值。公式如 2-1 下: 影響著投放廣告的順序,同時也影響著廣告的出價策詞“手機(jī)”時,廣告主通過競價買斷了關(guān)鍵詞“手機(jī)”,主投放的有關(guān)“手機(jī)”的廣告,平臺就會按照一定的廣告,如圖 2-1 所示:
圖 3- 1 Sigmoid 函數(shù)曲線圖數(shù)的輸出結(jié)果是介于(0,1)之間,中間值 c 是 0.5,則出 h(x)代表數(shù)據(jù)屬于某一類別的概率,對于輸入 x 率分別為 ( ) ( ), ( ) 中的極大似然估計方法去求損失函數(shù),概率函數(shù)如 ( ) ( ( ) ( ( ) 據(jù)獨(dú)立分布,聯(lián)合分布可表示為各個邊際分布的乘積 ( ) ∏ ( ( )| ( ) ( ) ∏ ( ( ) ( ) ( ( ) ( )凸函數(shù),由于凸函數(shù)的局部最小值等同于全局最小得到 3-6 式:
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文Fm 1(x) 為當(dāng)前的模型,模型通過經(jīng)驗(yàn)風(fēng)險極小化來確定下一個弱分類器參數(shù)。具體到損失函數(shù)本身的選擇也就是 L 的選擇,有平方損失函數(shù),0-1 損函數(shù),對數(shù)損失函數(shù)等等。當(dāng)選擇平方損失函數(shù)時,這個差值就是殘差。GBDT 幾乎適用于所有線性和非線性的回歸問題,同時也可以設(shè)置閾值解二分類問題,應(yīng)用范圍比較廣。GBDT 可以給邏輯斯蒂回歸模型訓(xùn)練,提高告點(diǎn)擊率。如圖 3-2 所示,輸入樣本 x,GBDT 模型得到兩顆樹 tree1 和 tree2,兩棵樹個葉子節(jié)點(diǎn)都是 LR 模型的一個維度特征,在求和每個葉子權(quán)重及時 LR 模型分類結(jié)果。
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張明紅;佘廉;耿波;;基于情景的結(jié)構(gòu)化突發(fā)事件相似度研究[J];中國管理科學(xué);2017年01期
2 陳葉斐;張學(xué)軍;黃衛(wèi)東;;基于干擾相似度的多話題演化模型[J];電信科學(xué);2017年09期
3 任雪利;代余彪;;軟件相似度在成本估算中的應(yīng)用[J];計算機(jī)應(yīng)用與軟件;2015年06期
4 譚明超;刁興春;曹建軍;馮徑;;一種基于函數(shù)依賴的屬性相似度調(diào)整算法[J];上海交通大學(xué)學(xué)報;2015年08期
5 陳立鳳;;河馬找親戚[J];學(xué)生之友(童花果);2016年12期
6 周嫻莉;;十個中文流行語翻譯[J];初中生輔導(dǎo);2016年36期
7 杜碧涵;;母愛[J];少年月刊;2017年05期
8 張呈宇;;熱點(diǎn)話題相似度常用算法比較[J];好家長;2017年12期
9 仇麗青;陳卓艷;;基于共同鄰居相似度的社區(qū)發(fā)現(xiàn)算法[J];信息系統(tǒng)工程;2014年05期
10 詹雪艷;林兆洲;段天璇;李磊;喬延江;;色譜指紋圖譜相似度方法的適應(yīng)性研究[J];中國中醫(yī)藥信息雜志;2012年05期
相關(guān)會議論文 前10條
1 張乃岳;張學(xué)燕;;基于個體詞語相似度的定制化動態(tài)信息檢索[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
2 李紅蓮;潘建軍;范京;;音節(jié)相似度及其在語音識別中的應(yīng)用[A];第十四屆全國信號處理學(xué)術(shù)年會(CCSP-2009)論文集[C];2009年
3 丁維龍;吳水生;陳琦;程志君;;基于樹形結(jié)構(gòu)相似度的植物種類識別系統(tǒng)[A];2013年中國智能自動化學(xué)術(shù)會議論文集(第五分冊)[C];2013年
4 董刊生;方金云;;基于向量距離的詞序相似度算法[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
5 郭瑛媚;史曉東;陳毅東;高燕;;基于詞的話題分布相似度的無監(jiān)督日文旅游意見詞翻譯[A];機(jī)器翻譯研究進(jìn)展——第七屆全國機(jī)器翻譯研討會論文集[C];2011年
6 王茜;張衛(wèi)星;;基于分類樹相似度加權(quán)的協(xié)同過濾算法[A];2008年計算機(jī)應(yīng)用技術(shù)交流會論文集[C];2008年
7 Peng Ding;Xin Yan;Zhihong Liu;Jiewen Du;Yuehua Xu;Qiong Gu;Jun Xu;;TarExplorer:基于三維相似度的活性小分子尋靶平臺(英文)[A];中國化學(xué)會第30屆學(xué)術(shù)年會摘要集-第二十五分會:化學(xué)信息學(xué)與化學(xué)計量學(xué)[C];2016年
8 劉曉平;陸勁挺;;任意功能樹的物元相似度求解方法[A];全國第21屆計算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會議(CACIS·2010)暨全國第2屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會議論文集[C];2010年
9 劉海波;鄭德權(quán);趙鐵軍;;基于相似度線性加權(quán)方法的檢索結(jié)果聚類研究[A];中國計算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
10 羅辛;歐陽元新;熊璋;袁滿;;通過相似度支持度優(yōu)化基于K近鄰的協(xié)同過濾算法[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集A輯一[C];2010年
相關(guān)重要報紙文章 前10條
1 楊林;住宿按“相似度”分 體現(xiàn)學(xué)生視角[N];北京日報;2017年
2 證券時報記者 韓如冰;基金投資相似度趨高[N];證券時報;2006年
3 本報記者 王斌 本報實(shí)習(xí)生 蒲曉磊;版權(quán)局官員:相似度極高的不受保護(hù)[N];法制日報;2012年
4 記者 李學(xué)梅;研究證實(shí):父親“偏愛”與自己相像的孩子[N];新華每日電訊;2009年
5 天相投資顧問公司 張新文;風(fēng)格穩(wěn)定基金業(yè)績更勝一籌[N];證券時報;2007年
6 記者 劉妮;曾維會見日本新任駐沈總領(lǐng)事[N];沈陽日報;2012年
7 小新;妊娠中毒癥與夫婦HLA基因相似度有關(guān)[N];中國醫(yī)藥報;2007年
8 海潮;俄研究發(fā)現(xiàn)妊娠中毒癥疑與夫婦HLA基因相似度有關(guān)[N];中國醫(yī)藥報;2007年
9 欒海;妊娠中毒癥可能與夫婦 HLA基因相似度有關(guān)[N];醫(yī)藥經(jīng)濟(jì)報;2007年
10 海納;“娛樂”模仿的憂慮[N];河北日報;2013年
相關(guān)博士學(xué)位論文 前10條
1 王玉標(biāo);基于動態(tài)信任建模的云服務(wù)可信性評估與選擇研究[D];重慶大學(xué);2018年
2 高欣健;多模態(tài)相似度學(xué)習(xí)方法研究[D];合肥工業(yè)大學(xué);2017年
3 夏云慶;IHSMTS系統(tǒng)中啟發(fā)式類比翻譯處理機(jī)制(HATM)的設(shè)計與實(shí)現(xiàn)[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2001年
4 武威;異質(zhì)數(shù)據(jù)相似度學(xué)習(xí)及其在網(wǎng)絡(luò)搜索中的應(yīng)用[D];北京大學(xué);2012年
5 張明西;信息網(wǎng)絡(luò)中的相似度搜索問題研究[D];復(fù)旦大學(xué);2013年
6 朱娜斐;基于RTT相似度的網(wǎng)絡(luò)延遲估測理論和方法[D];北京工業(yè)大學(xué);2012年
7 錢鵬飛;基于模糊相似度的異構(gòu)本體映射、合并及校驗(yàn)方法的研究[D];上海交通大學(xué);2008年
8 朱笑塵;異質(zhì)過程數(shù)據(jù)集成與修復(fù)[D];清華大學(xué);2015年
9 賈連印;內(nèi)存數(shù)據(jù)庫中集合相似度及集合包含問題的研究[D];華南理工大學(xué);2012年
10 崔曉蘭;面向在線抱怨自動處理的推薦方法研究[D];華中科技大學(xué);2017年
相關(guān)碩士學(xué)位論文 前10條
1 呂如州;基于結(jié)構(gòu)元理論的模糊數(shù)相似度及應(yīng)用研究[D];遼寧工程技術(shù)大學(xué);2016年
2 夏雨;在線評論中產(chǎn)品特征提取與意見挖掘研究[D];武漢理工大學(xué);2016年
3 方敏;基于節(jié)點(diǎn)相似度的線要素匹配方法設(shè)計[D];北京建筑大學(xué);2018年
4 張學(xué)理;基于多因子標(biāo)簽相似度的標(biāo)簽聚類算法的研究[D];遼寧大學(xué);2018年
5 李凱翔;產(chǎn)科知識圖譜的構(gòu)建與研究[D];鄭州大學(xué);2018年
6 李超男;基于節(jié)點(diǎn)相似度的社會網(wǎng)絡(luò)社團(tuán)發(fā)現(xiàn)的算法研究[D];重慶師范大學(xué);2018年
7 花凌鋒;面向位置的移動新聞推薦研究[D];安徽理工大學(xué);2018年
8 丁明珠;基于混合相似度指標(biāo)的社團(tuán)劃分算法研究[D];山東師范大學(xué);2018年
9 楊飛;基于LSTM的文本相似度識別方法研究[D];吉林大學(xué);2018年
10 常明;搜索廣告點(diǎn)擊率預(yù)測算法研究與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2018年
本文編號:2814354
本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/2814354.html