一種融入用戶(hù)點(diǎn)擊模型Word2Vec查詢(xún)?cè)~聚類(lèi)
發(fā)布時(shí)間:2017-10-16 17:36
本文關(guān)鍵詞:一種融入用戶(hù)點(diǎn)擊模型Word2Vec查詢(xún)?cè)~聚類(lèi)
更多相關(guān)文章: 查詢(xún)?cè)~ 聚類(lèi) WordVec 點(diǎn)擊模型 CT-WordVec
【摘要】:用戶(hù)查詢(xún)聚類(lèi)能夠幫助搜索引擎了解當(dāng)前熱點(diǎn)、用戶(hù)興趣及需求,在搜索引擎性能優(yōu)化及定向廣告投放等起到了非常重要的作用.基于用戶(hù)查詢(xún)?cè)~長(zhǎng)度非常短的特點(diǎn),提出基于Word2Vec的詞向量的用戶(hù)查詢(xún)?cè)~表示方法.并在Word2Vec的基礎(chǔ)上提出CT-Word2Vec神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型.CT-Word2Vec模型不僅利用詞匯的上下文信息將詞轉(zhuǎn)化成向量,而且還將用戶(hù)的搜索點(diǎn)擊行為融入詞向量的學(xué)習(xí)過(guò)程當(dāng)中.聚類(lèi)實(shí)驗(yàn)結(jié)果表明,基于Word2Vec的詞向量的查詢(xún)?cè)~表示方法相對(duì)于傳統(tǒng)的詞袋法在熵、純度衡量指標(biāo)上有20%到30%的提高.基于CT-Word2Vec的詞向量表示方法與Word2Vec相比有2%到4%的提升.
【作者單位】: 華東師范大學(xué)計(jì)算機(jī)應(yīng)用研究所;華東師范大學(xué)上海市多維度信息處理重點(diǎn)實(shí)驗(yàn)室;
【關(guān)鍵詞】: 查詢(xún)?cè)~ 聚類(lèi) WordVec 點(diǎn)擊模型 CT-WordVec
【基金】:國(guó)家科技支撐項(xiàng)目(2012BAH93F03)資助 上海市科委項(xiàng)目(14511107000)資助
【分類(lèi)號(hào)】:TP391.3
【正文快照】: 1引言隨著信息技術(shù)的極速發(fā)展,互聯(lián)網(wǎng)信息呈現(xiàn)了指數(shù)型增長(zhǎng),人們只能在搜索引擎的幫助下從海量的信息當(dāng)中獲得特定的信息.用戶(hù)的搜索行為直接或間接地反應(yīng)了用戶(hù)的潛在興趣及需求.用戶(hù)提供的查詢(xún)?cè)~是搜索行為當(dāng)中最為重要的一部分.用戶(hù)查詢(xún)?cè)~聚類(lèi)是用戶(hù)查詢(xún)?cè)~挖掘中最常用的方,
本文編號(hào):1044001
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1044001.html
最近更新
教材專(zhuān)著