天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

廣告定向中基于潛在語義的用戶分組方法

發(fā)布時間:2017-05-17 06:12

  本文關(guān)鍵詞:廣告定向中基于潛在語義的用戶分組方法,由筆耕文化傳播整理發(fā)布。


【摘要】:互聯(lián)網(wǎng)的普及極大推動了在線廣告活動的發(fā)展。與傳統(tǒng)媒體廣告相比,在線廣告有非常豐富的信息資源,并且可以通過定向技術(shù)實現(xiàn)廣告的精準投放。這些豐富的信息資源不僅包括用戶的姓名、年齡、地域等靜態(tài)屬性,也包括用戶的在線查找、廣告點擊等動態(tài)行為信息。對于大多數(shù)比較受歡迎的網(wǎng)站,活動用戶的數(shù)量是非常龐大的,如果針對單個用戶逐一投放廣告,往往會給系統(tǒng)帶來較大的負擔(dān)。而用戶分組正是減輕這一負擔(dān)的一種有效方式。 用戶分組把相似的用戶分在同一個組中,然后對用戶組內(nèi)的用戶投放相關(guān)廣告。對于行為定向技術(shù),用戶分組從用戶的動態(tài)行為信息中挖掘用戶的興趣,這樣,一個用戶組就代表了一種潛在的興趣。針對用戶組投放與該興趣相關(guān)的廣告后,用戶組內(nèi)的用戶會有較大的概率去點擊廣告,進而產(chǎn)生購買等轉(zhuǎn)換行為,給廣告主帶來更大的收益,F(xiàn)有的用戶分組方法存在兩個比較大的挑戰(zhàn)。 1.基于無監(jiān)督聚類算法(例如K-means算法)的用戶分組方法沒有考慮用戶屬性之間的語義關(guān)系,并且只允許一個用戶屬于一個用戶組。但是在實際情況中,用戶的一系列行為屬性之間存在潛在的語義關(guān)聯(lián),一個用戶可能同時會產(chǎn)生多個不同的興趣。如果考慮數(shù)據(jù)間的潛在語義,并且允許一個用戶分在多個用戶組中,能夠更加精準地表達用戶的興趣或購買意圖。 2.基于潛在語義算法(例如PLSA或LDA)的用戶分組方法能夠考慮到用戶數(shù)據(jù)之間的關(guān)聯(lián),也允許一個用戶同時屬于多個用戶組中。但是這種方法把用戶看作數(shù)據(jù)實例,即使?jié)撛诘恼Z義是被嵌入在經(jīng)過轉(zhuǎn)換后的數(shù)據(jù)中的,聚類算法也仍然間接地對用戶進行聚類。而且現(xiàn)有的分組方法只從用戶的在線查詢行為中挖掘其興趣,忽略了廣告和用戶興趣之間的關(guān)系。 針對以上問題,本文提出一種基于LDA的用戶分組方法。與現(xiàn)有的基于LDA的用戶分組方法不同,首先,本文不僅考慮用戶的單個查詢行為信息,而且將用戶發(fā)出的查詢和點擊過的廣告結(jié)合起來,更加精準地描述用戶的在線行為。其次,本文的數(shù)據(jù)實例采用用戶發(fā)出的查詢和點擊過的廣告,把與之相關(guān)聯(lián)的用戶作為屬性,能夠直接得到用戶分組結(jié)果。本文的主要貢獻包括以下幾個部分: 1.給出了用戶分組問題的形式化定義。現(xiàn)有的基于潛在語義的用戶分組方法只采用用戶發(fā)出的查詢數(shù)據(jù)對用戶進行分組,本文首次引入用戶點擊過的廣告,提出一種更加精確的描述用戶在線行為特征的觀點。通過分析用戶發(fā)出的查詢和點擊過的廣告與用戶的興趣之間的關(guān)系,結(jié)合用戶發(fā)出的查詢和用戶點擊過的廣告共同刻畫用戶畫像,并在此基礎(chǔ)上給出用戶分組的形式化定義。此外,本文從曝光和點擊的角度出發(fā),關(guān)注用戶分組之后用戶組的質(zhì)量對廣告投放帶來的影響,定義用戶分組結(jié)果優(yōu)化的問題。 2.提出了一種基于LDA的用戶分組方法,F(xiàn)有的基于潛在語義的用戶分組方法將用戶發(fā)出的查詢作為特征向量代表用戶,對用戶進行間接聚類。本文分析比較LSA、PLSA和LDA三種能夠用于潛在語義分組的聚類方法,LSA算法的結(jié)果只能從數(shù)學(xué)的角度解釋,PLSA算法參數(shù)空間的大小隨著訓(xùn)練集的增大而增大,因此本文基于LDA算法對用戶進行分組。與現(xiàn)有的方法不同,本文將用戶發(fā)出的查詢,用戶點擊過的廣告組合作為數(shù)據(jù)實例,與之相關(guān)的用戶作為屬性,運用到LDA算法中,直接獲取分好的用戶組。 3.設(shè)計了三種用戶分組結(jié)果優(yōu)化方法。現(xiàn)有的用戶分組相關(guān)研究沒有涉及對用戶分組之后的結(jié)果進行后續(xù)優(yōu)化的工作。本文提出三種方法來優(yōu)化用戶組的質(zhì)量。第一種用戶組合并法主要針對小用戶組現(xiàn)象,在保證CTR值的同時補充用戶以滿足曝光量;第二種固定閾值法主要針對用戶組中低成員概率的問題,為所有的用戶組定義一個固定閾值來移除不滿足閾值的用戶,以得到點擊率(Click-through Rate, CTR)提高值更大的用戶組,但這種策略可能會引起小用戶組現(xiàn)象;第三種動態(tài)閾值法基于前兩種策略,根據(jù)各個用戶組中的用戶分布動態(tài)分配閾值,同時保證了高曝光和高CTR。 本文提出一種基于LDA的用戶分組方法,并對分組后的用戶組質(zhì)量進行優(yōu)化,在真實的數(shù)據(jù)集上對用戶分組方法和用戶分組結(jié)果優(yōu)化方法進行了全面的實驗。多組實驗結(jié)果表明,比起現(xiàn)有的用戶分組方法,文章提出的基于LDA的用戶分組方法使用簡單的查詢和點擊信息就能夠在新廣告上獲得更高的CTR值,針對用戶分組結(jié)果的優(yōu)化方法能夠得到更高質(zhì)量的用戶組。
【關(guān)鍵詞】:在線廣告 行為定向 用戶分組 LDA 點擊率
【學(xué)位授予單位】:華東師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:F713.8;TP391.1
【目錄】:
  • 摘要6-8
  • ABSTRACT8-12
  • 第一章 緒論12-22
  • 1.1 研究背景12-15
  • 1.2 研究內(nèi)容15-19
  • 1.2.1 在線廣告投放15-16
  • 1.2.2 廣告定向中行為定向技術(shù)16-17
  • 1.2.3 行為定向中用戶分組方法17-19
  • 1.2.4 用戶分組結(jié)果優(yōu)化19
  • 1.3 本文貢獻19-21
  • 1.4 文章結(jié)構(gòu)21-22
  • 第二章 國內(nèi)外研究現(xiàn)狀22-27
  • 2.1 在線廣告中CTR預(yù)測的研究現(xiàn)狀22-23
  • 2.2 廣告定向中行為定向技術(shù)的研究現(xiàn)狀23-24
  • 2.3 行為定向中用戶分組方法的研究現(xiàn)狀24-26
  • 2.3.1 用戶畫像生成方法對比24
  • 2.3.2 用戶分組方法對比24-26
  • 2.4 本章小結(jié)26-27
  • 第三章 問題定義27-35
  • 3.1 用戶分組問題定義27-32
  • 3.1.1 用戶畫像27-29
  • 3.1.2 基于用戶畫像的用戶分組29-30
  • 3.1.3 用戶分組目標30-32
  • 3.2 用戶分組結(jié)果優(yōu)化問題定義32-34
  • 3.2.1 基于曝光量的用戶分組結(jié)果優(yōu)化33
  • 3.2.2 基于CTR的用戶分組結(jié)果優(yōu)化33-34
  • 3.3 本章小結(jié)34-35
  • 第四章 用戶分組方法35-50
  • 4.1 基于LDA的用戶分組方法35-37
  • 4.2 用戶分組方法在已有廣告上的有效性驗證37-47
  • 4.2.1 實驗數(shù)據(jù)集38-40
  • 4.2.2 CTR提高40-43
  • 4.2.3 小用戶組占比43-45
  • 4.2.4 F-Measure值45-47
  • 4.3 用戶分組方法在新廣告上的有效性驗證47-49
  • 4.4 本章小結(jié)49-50
  • 第五章 用戶分組結(jié)果優(yōu)化方法50-60
  • 5.1 面向小用戶組現(xiàn)象的用戶組優(yōu)化50-52
  • 5.2 面向低成員概率的用戶組優(yōu)化52-55
  • 5.3 兼顧小用戶組和低成員概率的用戶組優(yōu)化55-58
  • 5.4 本章小結(jié)58-60
  • 第六章 總結(jié)與展望60-62
  • 6.1 本文工作60
  • 6.2 未來展望60-62
  • 參考文獻62-68
  • 致謝68-69
  • 攻讀碩士學(xué)位期間發(fā)表論文和科研情況69

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前2條

1 宋浩遠;;基于模型的聚類方法研究[J];重慶科技學(xué)院學(xué)報(自然科學(xué)版);2008年03期

2 周傲英;周敏奇;宮學(xué)慶;;計算廣告:以數(shù)據(jù)為核心的Web綜合應(yīng)用[J];計算機學(xué)報;2011年10期


  本文關(guān)鍵詞:廣告定向中基于潛在語義的用戶分組方法,由筆耕文化傳播整理發(fā)布。

,

本文編號:372689

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/372689.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶faab2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com