基于遞歸自編碼器的廣告短語相關(guān)性
本文關(guān)鍵詞:基于遞歸自編碼器的廣告短語相關(guān)性 出處:《計算機應(yīng)用》2016年01期 論文類型:期刊論文
更多相關(guān)文章: 深度學(xué)習(xí) 遞歸自編碼器 詞向量 計算廣告 搜索引擎
【摘要】:針對現(xiàn)有廣告短語相關(guān)性研究成果多采用字面匹配,忽略了短語所包含的深層語義信息,限制了任務(wù)的性能等問題,提出了采用深度學(xué)習(xí)算法研究廣告短語的相關(guān)性,采用遞歸自編碼器(RAE)對短語進行深層結(jié)構(gòu)分析,使得短語向量包含深層的語義信息,以此來構(gòu)建廣告語境下的短語相關(guān)性計算方法。具體地,給定一個包含若干詞的序列,序列中所有相鄰的兩個元素嘗試合并產(chǎn)生一個重構(gòu)誤差,遍歷將重構(gòu)誤差最小的元素兩兩合并,形成類似哈夫曼樹結(jié)構(gòu)的短語樹。采用梯度下降法最小化短語樹的重構(gòu)誤差,采用余弦距離度量短語之間的相關(guān)性。實驗結(jié)果顯示,通過引入詞語權(quán)重信息,加大了重要詞語在最終短語向量表示中貢獻的信息量,使得RAE更適合短語計算;比起傳統(tǒng)LDA和BM25算法,在50%召回率的條件下,提出的算法的準確率分別提高了4.59個百分點和3.21個百分點,這證明了所提算法的有效性。
[Abstract]:In view of the existing research on the relevance of advertising phrases, most of them use literal matching, ignoring the deep semantic information contained in the phrase, limiting the performance of the task and so on. A depth learning algorithm is proposed to study the correlation of advertising phrases, and a recursive self-encoder is used to analyze the deep structure of phrases, which makes phrase vectors contain deep semantic information. Specifically, given a sequence containing a number of words, all the adjacent elements in the sequence try to merge to produce a reconstruction error. Traversing the elements with the minimum reconstruction error to form a phrase tree similar to the Huffman tree, the gradient descent method is used to minimize the reconstruction error of the phrase tree. CoSine distance is used to measure the correlation between phrases. The experimental results show that by introducing word weight information, the amount of information contributed by important words in the final phrase vector representation is increased. Make RAE more suitable for phrase calculation; Compared with the traditional LDA and BM25 algorithms, the accuracy of the proposed algorithm is increased by 4.59% and 3.21% respectively under the condition of 50% recall rate. This proves the validity of the proposed algorithm.
【作者單位】: 武漢大學(xué)計算機學(xué)院;桂林航天工業(yè)學(xué)院廣西高校機器人與焊接技術(shù)重點實驗室培育基地;
【基金】:國家自然科學(xué)基金資助項目(11301106) 廣西自然科學(xué)基金資助項目(2014GXNSFAA1183105) 廣西高?蒲匈Y助項目(ZD2014147,YB2014431)~~
【分類號】:TP18;TP391.3
【正文快照】: 0引言計算廣告指的是基于用戶給定的搜索信息,通過計算得到與之最匹配的廣告,然后進行精準定向投放的廣告機制。采用該機制可以大幅度提高廣告主投放廣告的點擊率,加大廣告投放所在網(wǎng)站的訪問量,從而幫助用戶獲得優(yōu)質(zhì)的信息。計算廣告是支撐互聯(lián)網(wǎng)廣告產(chǎn)業(yè)鏈發(fā)展的基礎(chǔ),其涉及
【參考文獻】
相關(guān)碩士學(xué)位論文 前1條
1 張建梁;基于云計算的語義搜索引擎研究[D];復(fù)旦大學(xué);2009年
【共引文獻】
相關(guān)期刊論文 前4條
1 于志良;;云計算現(xiàn)狀研究[J];電腦開發(fā)與應(yīng)用;2010年10期
2 陸小麗;何加銘;;基于Map/Reduce的索引數(shù)據(jù)云存儲模型研究[J];寧波大學(xué)學(xué)報(理工版);2011年03期
3 魏清鳳;羅長壽;孫素芬;張峻峰;;云計算在我國農(nóng)業(yè)信息服務(wù)中的研究現(xiàn)狀與思考[J];中國農(nóng)業(yè)科技導(dǎo)報;2013年04期
4 劉靜;徐斌;;Kaas環(huán)境下的圖書館用戶個性化信息服務(wù)研究[J];圖書館學(xué)研究;2014年22期
相關(guān)博士學(xué)位論文 前3條
1 方雷;基于云計算的土地資源服務(wù)高效處理平臺關(guān)鍵技術(shù)探索與研究[D];浙江大學(xué);2011年
2 陳旭毅;基于索引云的企業(yè)搜索引擎實現(xiàn)研究[D];武漢大學(xué);2011年
3 張莉艷;基于云計算的鐵路信息共享平臺及關(guān)鍵技術(shù)研究[D];中國鐵道科學(xué)研究院;2013年
相關(guān)碩士學(xué)位論文 前10條
1 申志強;基于云計算的IPv6協(xié)議應(yīng)用研究[D];東北財經(jīng)大學(xué);2010年
2 郭雷風(fēng);農(nóng)業(yè)科研云原型系統(tǒng)設(shè)計與應(yīng)用理論研究[D];中國農(nóng)業(yè)科學(xué)院;2011年
3 閆金剛;基于云計算的分布式智能語義搜索方法研究[D];電子科技大學(xué);2011年
4 桂許軍;基于JavaEE平臺與Lucene的信息文檔搜索引擎系統(tǒng)的設(shè)計與實現(xiàn)[D];西南交通大學(xué);2011年
5 葛輝;基于Nimbus的云計算平臺研究及應(yīng)用[D];成都理工大學(xué);2011年
6 宮彥磊;基于云計算的車載GPS導(dǎo)航終端的研究與設(shè)計[D];延邊大學(xué);2011年
7 胡曉崠;通信終端網(wǎng)絡(luò)多媒體資源交互系統(tǒng)研究與實現(xiàn)[D];寧波大學(xué);2010年
8 聞建芬;通信終端個人信息交互系統(tǒng)研究與應(yīng)用[D];寧波大學(xué);2011年
9 陳鵬飛;基于個性化本體的語義搜索引擎技術(shù)的研究與設(shè)計[D];河北工業(yè)大學(xué);2011年
10 楊潔;云計算在權(quán)限管理中的應(yīng)用研究[D];遼寧工程技術(shù)大學(xué);2010年
,本文編號:1428847
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1428847.html