天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于分類模型的廣告推薦方法研究

發(fā)布時間:2017-05-17 16:20

  本文關(guān)鍵詞:基于分類模型的廣告推薦方法研究,由筆耕文化傳播整理發(fā)布。


【摘要】:伴隨著互聯(lián)網(wǎng)數(shù)據(jù)爆炸式地增長,用戶面對的信息量和種類也越來越多,海量數(shù)據(jù)挖掘技術(shù)在個性化推薦系統(tǒng)中的應用成為了一個研究熱點。 本文首先總結(jié)了常見的幾類推薦方法,主要包括協(xié)同過濾方法、基于內(nèi)容的推薦方法和混合推薦方法,以及它們涉及到的數(shù)據(jù)挖掘技術(shù),并分析了這幾類方法的優(yōu)點與不足。在此基礎(chǔ)上,本文從廣告推薦問題入手,介紹了計算廣告的相關(guān)概念和方法,并引出了兩種基于內(nèi)容的廣告推薦方法,即單標記分類模型和多標記分類模型。 論文的主要工作如下。第一,我們結(jié)合Hadoop平臺實現(xiàn)了針對某互聯(lián)網(wǎng)公司提供的廣告日志數(shù)據(jù)的可視化統(tǒng)計與分析工具,利用該工具對數(shù)據(jù)進行分析并發(fā)現(xiàn)了特征之間和廣告之間的依賴關(guān)系。第二,提出了利用非廣告特征和廣告特征依賴關(guān)系的單標記分類模型的一種改進方法,其利用了互信息來選擇組合特征從而加入特征之間的依賴關(guān)系。第三,提出了利用廣告之間依賴關(guān)系的多標記分類模型改進方法,其通過一種啟發(fā)式的方法來構(gòu)建分類器鏈從而更好地利用廣告之間的依賴關(guān)系。最后,在Hadoop平臺上的設(shè)計了相關(guān)實驗,實驗結(jié)果表明這兩種改進方法都能夠比改進前的方法得到更好的結(jié)果。因此,無論是特征之間還是廣告之間的依賴關(guān)系,都是廣告推薦問題中不可忽視的影響因素。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 推薦系統(tǒng) 多標記分類
【學位授予單位】:北京交通大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP391.3
【目錄】:
  • 致謝5-6
  • 中文摘要6-7
  • ABSTRACT7-10
  • 1 引言10-12
  • 1.1 研究背景和意義10-11
  • 1.2 本文主要工作11
  • 1.3 本文組織結(jié)構(gòu)11-12
  • 2 推薦系統(tǒng)綜述12-23
  • 2.1 問題定義13-14
  • 2.2 協(xié)同過濾推薦14-17
  • 2.2.1 相似度計算15-16
  • 2.2.2 冷啟動問題16-17
  • 2.2.3 數(shù)據(jù)稀疏性17
  • 2.3 基于內(nèi)容的推薦17-20
  • 2.3.1 特征提取18
  • 2.3.2 效用函數(shù)與模型18-19
  • 2.3.3 制約因素19-20
  • 2.4 混合型推薦20-21
  • 2.4.1 兩種獨立方法的結(jié)合20
  • 2.4.2 協(xié)同過濾中加入內(nèi)容特性20
  • 2.4.3 基于內(nèi)容方法中加入?yún)f(xié)同過濾20-21
  • 2.4.4 建立單個統(tǒng)一的推薦模型21
  • 2.5 本章總結(jié)21-23
  • 3 在線廣告推薦23-33
  • 3.1 計算廣告24-25
  • 3.2 點擊率(CTR)預估25-28
  • 3.2.1 點擊率預估的意義25-26
  • 3.2.2 點擊率預估框架26-28
  • 3.3 基于分類器的廣告推薦28-32
  • 3.3.1 情景感知(Context-Aware)28-29
  • 3.3.2 傳統(tǒng)分類模型29-30
  • 3.3.3 多標記分類模型30-32
  • 3.4 本章總結(jié)32-33
  • 4 基于分類器的方法改進33-48
  • 4.1 單標記分類模型改進——NBkPlus算法33-39
  • 4.1.1 樸素貝葉斯33-35
  • 4.1.2 特征間的依賴關(guān)系35-38
  • 4.1.3 一種基于互信息的改進38-39
  • 4.2 多標記分類模型改進—OCC算法39-47
  • 4.2.1 分類器鏈算法40-42
  • 4.2.2 廣告間的依賴關(guān)系42-44
  • 4.2.3 一種啟發(fā)式的改進44-47
  • 4.3 本章總結(jié)47-48
  • 5 實驗及結(jié)果分析48-59
  • 5.1 實驗平臺48-49
  • 5.2 實驗數(shù)據(jù)49-52
  • 5.2.1 數(shù)據(jù)特征50
  • 5.2.2 數(shù)據(jù)可視化工具50-52
  • 5.3 評價指標52-53
  • 5.4 NBkPlus算法結(jié)果及分析53-55
  • 5.4.1 特征間的互信息53-55
  • 5.4.2 AUC結(jié)果及分析55
  • 5.5 OCC算法結(jié)果及分析55-58
  • 5.5.1 廣告數(shù)據(jù)集實驗55-56
  • 5.5.2 多標記標準測試集實驗56-58
  • 5.6 本章總結(jié)58-59
  • 6 總結(jié)與展望59-60
  • 參考文獻60-64
  • 作者簡歷64-66
  • 學位論文數(shù)據(jù)集66

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前2條

1 周傲英;周敏奇;宮學慶;;計算廣告:以數(shù)據(jù)為核心的Web綜合應用[J];計算機學報;2011年10期

2 李哲;王志海;何穎婧;付彬;;一種啟發(fā)式多標記分類器選擇與排序策略[J];中文信息學報;2013年04期


  本文關(guān)鍵詞:基于分類模型的廣告推薦方法研究,,由筆耕文化傳播整理發(fā)布。



本文編號:373826

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/373826.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9fc79***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com