電商搜索廣告中語義理解和廣告排序方法研究
發(fā)布時間:2021-10-12 12:31
電商搜索廣告中的查詢語義理解和廣告排序問題一直都是學(xué)術(shù)界和工業(yè)界研究的熱點,兩者是相互依存的關(guān)系,排序是最終目的,而只有做好查詢短語的語義理解才能實現(xiàn)精準(zhǔn)廣告排序,兩者缺一不可。其中語義理解的關(guān)鍵技術(shù)有查詢意圖預(yù)測和查詢語義擴展,而排序過程涉及到廣告相關(guān)性計算和廣告點擊率預(yù)估。語義理解的精度直接影響到返回給用戶的廣告質(zhì)量和廣告排序的精度,而傳統(tǒng)的基于概率的方法雖能一定程度上理解用戶的查詢語義,但是不夠精細(xì)。本文的語義理解方法通過提取強有力的特征來描述用戶的查詢,其中通過引入MCI(mutual click intent)來描述兩個查詢項之間的關(guān)聯(lián)度,通過改進的PageRank算法來計算查詢項的貢獻度,進而提取出與關(guān)聯(lián)度、貢獻度相關(guān)的特征,再將提取出的兩類特征應(yīng)用進分類器中,實現(xiàn)精準(zhǔn)預(yù)測用戶查詢意圖。另外,針對貢獻度求解模型中查詢有向圖可能存在無用有向邊干擾算法迭代的問題,采用“剪枝”操作去除掉查詢有向圖中的無用有向邊,提升貢獻度值求解的精度,并最終提升查詢意圖預(yù)測分類器的性能。同時為了檢索出更多相關(guān)的廣告,方法基于Word2Vec模型做了查詢的語義擴展。隨后,我們設(shè)計了一系列實驗來證明...
【文章來源】:西南交通大學(xué)四川省 211工程院校 教育部直屬院校
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 語義理解
1.2.2 廣告排序
1.3 論文研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 語義理解和廣告排序的研究方法
2.1 預(yù)備知識
2.1.1 PageRank算法
2.1.2 Word2Vec模型
2.1.3 TF-IDF算法
2.1.4 GBDT模型
2.2 查詢短語的語義理解
2.2.1 問題定義
2.2.2 研究思路概述
2.3 多查詢下的廣告排序?qū)崿F(xiàn)
2.3.1 問題定義
2.3.2 研究思路概述
2.4 本章小結(jié)
第3章 融入查詢短語潛在信息的語義理解方法
3.1 基于概率的語義理解方法
3.2 本文的語義理解方法線上線下的工作過程
3.3 基于查詢短語潛在信息的查詢意圖預(yù)測
3.3.1 特征描述
3.3.2 特征提取與計算
3.3.3 預(yù)測流程
3.3.4 案例分析
3.4 基于Word2Vec的查詢語義擴展
3.4.1 訓(xùn)練語料庫中短語的提取
3.4.2 擴展流程
3.4.3 案例說明
3.5 本章小結(jié)
第4章 廣告排序的方法研究
4.1 本文的廣告排序方法線上線下的工作過程
4.2 基于貢獻度求解模型和標(biāo)準(zhǔn)TF-IDF模型的廣告相關(guān)性計算
4.2.1 兩種常見廣告相關(guān)性計算方法
4.2.2 融入貢獻度求解模型的廣告相關(guān)性計算
4.3 基于GBDT模型的廣告點擊率預(yù)估
4.4 多查詢條件下廣告排序的解決方案
4.5 本章小結(jié)
第5章 實驗分析
5.1 實驗相關(guān)數(shù)據(jù)
5.2 評測方法
5.2.1 語義理解評測方法
5.2.2 廣告排序評測方法
5.3 實驗環(huán)境及系統(tǒng)整體結(jié)構(gòu)
5.4 語義理解方法的實驗結(jié)果及結(jié)果分析
5.5 多查詢下廣告排序方法的實驗結(jié)果及結(jié)果分析
5.6 本章小結(jié)
總結(jié)與展望
工作總結(jié)
工作展望
致謝
參考文獻
攻讀碩士學(xué)位期間發(fā)表的論文及參與的科研項目
【參考文獻】:
期刊論文
[1]基于N-Gram的計算機病毒特征碼自動提取的改進方法[J]. 楊燕,蔣國平. 計算機科學(xué). 2017(S2)
[2]基于連續(xù)Skip-gram及深度學(xué)習(xí)的圖像描述方法[J]. 曹劉彬,張麗紅. 測試技術(shù)學(xué)報. 2017(05)
[3]基于特征學(xué)習(xí)的廣告點擊率預(yù)估技術(shù)研究[J]. 張志強,周永,謝曉芹,潘海為. 計算機學(xué)報. 2016(04)
[4]Word2vec的核心架構(gòu)及其應(yīng)用[J]. 熊富林,鄧怡豪,唐曉晟. 南京師范大學(xué)學(xué)報(工程技術(shù)版). 2015(01)
[5]基于網(wǎng)頁鏈接與用戶反饋的PageRank算法改進研究[J]. 曹姍姍,王沖. 計算機科學(xué). 2014(12)
[6]一種無位置偏見的廣告協(xié)同推薦算法[J]. 霍曉駿,賀樑,楊燕. 計算機工程. 2014(12)
[7]基于PageRank的有向加權(quán)復(fù)雜網(wǎng)絡(luò)節(jié)點重要性評估方法[J]. 張琨,李配配,朱保平,胡滿玉. 南京航空航天大學(xué)學(xué)報. 2013(03)
[8]搜索引擎廣告用戶行為預(yù)測與特征分析[J]. 王海雷,賀一駿,俞學(xué)寧,張銘. 計算機應(yīng)用研究. 2013(05)
[9]利用查詢重構(gòu)識別查詢意圖[J]. 張曉娟,陸偉. 現(xiàn)代圖書情報技術(shù). 2013(01)
[10]基于語義理解的智能搜索引擎的研究[J]. 趙文娟,劉忠寶. 計算機與網(wǎng)絡(luò). 2012(01)
碩士論文
[1]基于GBDT模型的股價趨勢預(yù)測研究[D]. 洪嘉灝.暨南大學(xué) 2017
[2]結(jié)合N-gram模型與句法分析的語法糾錯[D]. 沈濤.東南大學(xué) 2017
[3]基于主題模型的藏漢跨語言信息檢索查詢擴展研究[D]. 高璐.中央民族大學(xué) 2017
[4]對TF-IDF算法的改進及實驗研究[D]. 何曉靜.吉林大學(xué) 2017
[5]搜索廣告長尾查詢的在線擴展方法研究[D]. 李亞林.哈爾濱工程大學(xué) 2017
[6]基于改進的GBDT算法的乘客出行預(yù)測研究[D]. 王天華.大連理工大學(xué) 2016
[7]基于用戶意圖識別的查詢重構(gòu)研究[D]. 吳家麗.哈爾濱工程大學(xué) 2016
[8]基于深度學(xué)習(xí)的搜索廣告點擊率預(yù)測方法研究[D]. 李思琴.哈爾濱工業(yè)大學(xué) 2015
[9]基于長尾查詢需求理解的搜索引擎性能改進[D]. 霍帥.清華大學(xué) 2015
[10]一種利用TF-IDF方法結(jié)合詞匯語義信息的文本相似度量方法研究[D]. 王子慕.吉林大學(xué) 2015
本文編號:3432585
【文章來源】:西南交通大學(xué)四川省 211工程院校 教育部直屬院校
【文章頁數(shù)】:71 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 語義理解
1.2.2 廣告排序
1.3 論文研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 語義理解和廣告排序的研究方法
2.1 預(yù)備知識
2.1.1 PageRank算法
2.1.2 Word2Vec模型
2.1.3 TF-IDF算法
2.1.4 GBDT模型
2.2 查詢短語的語義理解
2.2.1 問題定義
2.2.2 研究思路概述
2.3 多查詢下的廣告排序?qū)崿F(xiàn)
2.3.1 問題定義
2.3.2 研究思路概述
2.4 本章小結(jié)
第3章 融入查詢短語潛在信息的語義理解方法
3.1 基于概率的語義理解方法
3.2 本文的語義理解方法線上線下的工作過程
3.3 基于查詢短語潛在信息的查詢意圖預(yù)測
3.3.1 特征描述
3.3.2 特征提取與計算
3.3.3 預(yù)測流程
3.3.4 案例分析
3.4 基于Word2Vec的查詢語義擴展
3.4.1 訓(xùn)練語料庫中短語的提取
3.4.2 擴展流程
3.4.3 案例說明
3.5 本章小結(jié)
第4章 廣告排序的方法研究
4.1 本文的廣告排序方法線上線下的工作過程
4.2 基于貢獻度求解模型和標(biāo)準(zhǔn)TF-IDF模型的廣告相關(guān)性計算
4.2.1 兩種常見廣告相關(guān)性計算方法
4.2.2 融入貢獻度求解模型的廣告相關(guān)性計算
4.3 基于GBDT模型的廣告點擊率預(yù)估
4.4 多查詢條件下廣告排序的解決方案
4.5 本章小結(jié)
第5章 實驗分析
5.1 實驗相關(guān)數(shù)據(jù)
5.2 評測方法
5.2.1 語義理解評測方法
5.2.2 廣告排序評測方法
5.3 實驗環(huán)境及系統(tǒng)整體結(jié)構(gòu)
5.4 語義理解方法的實驗結(jié)果及結(jié)果分析
5.5 多查詢下廣告排序方法的實驗結(jié)果及結(jié)果分析
5.6 本章小結(jié)
總結(jié)與展望
工作總結(jié)
工作展望
致謝
參考文獻
攻讀碩士學(xué)位期間發(fā)表的論文及參與的科研項目
【參考文獻】:
期刊論文
[1]基于N-Gram的計算機病毒特征碼自動提取的改進方法[J]. 楊燕,蔣國平. 計算機科學(xué). 2017(S2)
[2]基于連續(xù)Skip-gram及深度學(xué)習(xí)的圖像描述方法[J]. 曹劉彬,張麗紅. 測試技術(shù)學(xué)報. 2017(05)
[3]基于特征學(xué)習(xí)的廣告點擊率預(yù)估技術(shù)研究[J]. 張志強,周永,謝曉芹,潘海為. 計算機學(xué)報. 2016(04)
[4]Word2vec的核心架構(gòu)及其應(yīng)用[J]. 熊富林,鄧怡豪,唐曉晟. 南京師范大學(xué)學(xué)報(工程技術(shù)版). 2015(01)
[5]基于網(wǎng)頁鏈接與用戶反饋的PageRank算法改進研究[J]. 曹姍姍,王沖. 計算機科學(xué). 2014(12)
[6]一種無位置偏見的廣告協(xié)同推薦算法[J]. 霍曉駿,賀樑,楊燕. 計算機工程. 2014(12)
[7]基于PageRank的有向加權(quán)復(fù)雜網(wǎng)絡(luò)節(jié)點重要性評估方法[J]. 張琨,李配配,朱保平,胡滿玉. 南京航空航天大學(xué)學(xué)報. 2013(03)
[8]搜索引擎廣告用戶行為預(yù)測與特征分析[J]. 王海雷,賀一駿,俞學(xué)寧,張銘. 計算機應(yīng)用研究. 2013(05)
[9]利用查詢重構(gòu)識別查詢意圖[J]. 張曉娟,陸偉. 現(xiàn)代圖書情報技術(shù). 2013(01)
[10]基于語義理解的智能搜索引擎的研究[J]. 趙文娟,劉忠寶. 計算機與網(wǎng)絡(luò). 2012(01)
碩士論文
[1]基于GBDT模型的股價趨勢預(yù)測研究[D]. 洪嘉灝.暨南大學(xué) 2017
[2]結(jié)合N-gram模型與句法分析的語法糾錯[D]. 沈濤.東南大學(xué) 2017
[3]基于主題模型的藏漢跨語言信息檢索查詢擴展研究[D]. 高璐.中央民族大學(xué) 2017
[4]對TF-IDF算法的改進及實驗研究[D]. 何曉靜.吉林大學(xué) 2017
[5]搜索廣告長尾查詢的在線擴展方法研究[D]. 李亞林.哈爾濱工程大學(xué) 2017
[6]基于改進的GBDT算法的乘客出行預(yù)測研究[D]. 王天華.大連理工大學(xué) 2016
[7]基于用戶意圖識別的查詢重構(gòu)研究[D]. 吳家麗.哈爾濱工程大學(xué) 2016
[8]基于深度學(xué)習(xí)的搜索廣告點擊率預(yù)測方法研究[D]. 李思琴.哈爾濱工業(yè)大學(xué) 2015
[9]基于長尾查詢需求理解的搜索引擎性能改進[D]. 霍帥.清華大學(xué) 2015
[10]一種利用TF-IDF方法結(jié)合詞匯語義信息的文本相似度量方法研究[D]. 王子慕.吉林大學(xué) 2015
本文編號:3432585
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3432585.html
最近更新
教材專著