流數(shù)據(jù)分類挖掘在動態(tài)廣告推薦系統(tǒng)中的應(yīng)用
本文關(guān)鍵詞:流數(shù)據(jù)分類挖掘在動態(tài)廣告推薦系統(tǒng)中的應(yīng)用,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著大數(shù)據(jù)時代的來臨,信息過載逐漸成為用戶體驗(yàn)所不能忽視的一個障礙。人們逐漸意識到數(shù)據(jù)中的蘊(yùn)含的價值。推薦系統(tǒng)就是人們在大量的數(shù)據(jù)中挖掘價值的一類典型應(yīng)用,它通過對用戶的行為的分析,對用戶的興趣的建模,完成對用戶感興趣的物品的推薦。論文中,首先總結(jié)了推薦系統(tǒng)常用的幾類方法:基于協(xié)同過濾的方法、基于內(nèi)容的方法、兩者的混合方法,以及推薦系統(tǒng)已有的對動態(tài)特性的研究。緊接著介紹了在線分析的兩個關(guān)鍵技術(shù),流處理技術(shù)和流數(shù)據(jù)挖掘。在線分析處理大數(shù)據(jù)已經(jīng)成為一個較新的研究熱點(diǎn)。然后介紹了挖掘算法在推薦系統(tǒng)中的應(yīng)用。最后以計(jì)算廣告推薦為切入點(diǎn),對廣告推薦系統(tǒng)的概念和方法進(jìn)行了詳細(xì)的介紹。論文的主要工作如下:首先,提出了一種基于用戶特征以及廣告特征等內(nèi)容特征的分類挖掘推薦方法,并介紹了基于此方法的完整廣告推薦系統(tǒng)的模型。其次,結(jié)合將流數(shù)據(jù)挖掘中的流式?jīng)Q策樹分類方法應(yīng)用到廣告推薦當(dāng)中使之具備實(shí)時處理數(shù)據(jù)的能力;運(yùn)用bagging技術(shù),使之具備了處理動態(tài)特性的能力,能夠根據(jù)用戶行為的變化實(shí)時更新推薦模型,具有更好的分類效果。最后,結(jié)合流處理工具、流分類挖掘算法,設(shè)計(jì)并實(shí)現(xiàn)了能夠在線更新推薦模型的實(shí)時分析系統(tǒng)。
【關(guān)鍵詞】:流數(shù)據(jù)分類 流處理 動態(tài)推薦系統(tǒng) 廣告點(diǎn)擊率預(yù)估
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.3
【目錄】:
- 摘要5-6
- Abstract6-10
- 第一章 緒論10-13
- 1.1 課題來源與研究背景10-11
- 1.2 論文的研究目的與意義11-12
- 1.3 論文的主要工作與論文結(jié)構(gòu)12-13
- 第二章 相關(guān)研究綜述13-27
- 2.1 推薦系統(tǒng)的方法13-18
- 2.1.1 基于協(xié)同過濾的推薦(Collaborative Filtering)15-16
- 2.1.2 基于內(nèi)容的推薦(Content-Based Filtering)16-17
- 2.1.3 基于協(xié)同與內(nèi)容混合的推薦(Hybrid Filtering)17
- 2.1.4 推薦系統(tǒng)動態(tài)特性的研究現(xiàn)狀17-18
- 2.2 流處理技術(shù)18-23
- 2.3 流數(shù)據(jù)挖掘23-26
- 2.4 本章小結(jié)26-27
- 第三章 動態(tài)廣告推薦27-36
- 3.1 計(jì)算廣告27-29
- 3.2 與推薦系統(tǒng)的關(guān)系29
- 3.3 點(diǎn)擊率預(yù)估29-32
- 3.4 基于分類的廣告推薦32-33
- 3.5 動態(tài)廣告推薦33-34
- 3.6 效率的改進(jìn)34-35
- 3.7 本章小結(jié)35-36
- 第四章 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)36-53
- 4.1 系統(tǒng)總體模型36-38
- 4.1.1 核心分類模塊37-38
- 4.2 流處理工具38-41
- 4.2.1 StreamBase39-41
- 4.3 流分類挖掘41-45
- 4.3.1 傳統(tǒng)決策樹方法41-42
- 4.3.2 VFDT42-45
- 4.4 系統(tǒng)實(shí)現(xiàn)45-52
- 4.4.1 核心分類模塊實(shí)現(xiàn)45-50
- 4.4.2 VFDT實(shí)現(xiàn)50-51
- 4.4.3 評估實(shí)現(xiàn)51-52
- 4.5 本章小結(jié)52-53
- 第五章 實(shí)驗(yàn)及結(jié)果分析53-60
- 5.1 實(shí)驗(yàn)數(shù)據(jù)53-54
- 5.2 評價指標(biāo)54-56
- 5.3 結(jié)果分析56-59
- 5.4 本章小結(jié)59-60
- 第六章 總結(jié)與展望60-61
- 6.1 總結(jié)60
- 6.2 展望60-61
- 致謝61-62
- 參考文獻(xiàn)62-66
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前6條
1 黃荷;;大數(shù)據(jù)時代降臨[J];黨政論壇(干部文摘);2012年11期
2 孫玉芬;盧炎生;;流數(shù)據(jù)挖掘綜述[J];計(jì)算機(jī)科學(xué);2007年01期
3 賈澎濤;何華燦;劉麗;孫濤;;時間序列數(shù)據(jù)挖掘綜述[J];計(jì)算機(jī)應(yīng)用研究;2007年11期
4 紀(jì)文迪;王曉玲;周傲英;;廣告點(diǎn)擊率估算技術(shù)綜述[J];華東師范大學(xué)學(xué)報(自然科學(xué)版);2013年03期
5 李哲;王志海;何穎婧;付彬;;一種啟發(fā)式多標(biāo)記分類器選擇與排序策略[J];中文信息學(xué)報;2013年04期
6 袁磊;張陽;李梅;李雪;王勇;;在數(shù)據(jù)流管理系統(tǒng)中實(shí)現(xiàn)快速決策樹算法(英文)[J];計(jì)算機(jī)科學(xué)與探索;2010年08期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 梁春泉;不確定數(shù)據(jù)流分類算法研究[D];西北農(nóng)林科技大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 李為;基于日志代理的安全審計(jì)綜合分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2008年
2 黃海波;在線推薦系統(tǒng)的算法研究及其應(yīng)用[D];電子科技大學(xué);2012年
3 李哲;基于分類模型的廣告推薦方法研究[D];北京交通大學(xué);2014年
本文關(guān)鍵詞:流數(shù)據(jù)分類挖掘在動態(tài)廣告推薦系統(tǒng)中的應(yīng)用,,由筆耕文化傳播整理發(fā)布。
本文編號:266073
本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/266073.html