基于詞向量的標(biāo)簽語義推薦算法研究
發(fā)布時間:2020-06-21 21:15
【摘要】:在Web2.0的環(huán)境下,鼓勵用戶創(chuàng)造內(nèi)容是主基調(diào)。社會化標(biāo)簽作為一種使用靈活、對用戶友好、無約束的分類方式,在業(yè)界得到了廣泛的應(yīng)用。社會標(biāo)簽具備組織、分享、檢索和發(fā)現(xiàn)新資源、新用戶等良好特性。但同樣也存在標(biāo)簽分布稀疏、標(biāo)簽使用率低、用戶標(biāo)注隨意以致出現(xiàn)噪聲標(biāo)簽甚至惡意標(biāo)簽等情況。為趨利避害,標(biāo)簽推薦技術(shù)應(yīng)運而生,得到學(xué)界的廣泛關(guān)注,也成為推薦系統(tǒng)的熱門研究方向。本文圍繞社會標(biāo)簽系統(tǒng)的標(biāo)簽推薦技術(shù)展開。具體工作如下:第一、本文首先對推薦系統(tǒng)的組成以及推薦原理進行介紹,并對目前標(biāo)簽推薦技術(shù)的文獻進行梳理,對算法分類整理并總結(jié)優(yōu)缺點,為后續(xù)在標(biāo)簽推薦技術(shù)領(lǐng)域的研究提供一定的參考。本文發(fā)現(xiàn)目前大多數(shù)的標(biāo)簽推薦技術(shù)缺乏對標(biāo)簽語義的研究,而且現(xiàn)有的標(biāo)簽語義研究適用范圍有限。因此提出基于詞向量的標(biāo)簽語義推薦算法,以開發(fā)出兼具內(nèi)容過濾和協(xié)同過濾優(yōu)越性的標(biāo)簽推薦技術(shù)。第二、本文采用了Skip-gram算法計算標(biāo)簽相似度。與目前主流的Wu Palmer概念相似度算法相比,具備三個優(yōu)點:一是適用范圍更廣,Wu Palmer概念相似度算法僅局限于英文;二是詞語對象完備,Wu Palmer概念相似度算法是建立在WordNet語義層次結(jié)構(gòu)上,然而WordNet語義字典只收錄155287個詞語,無法對超出字典的詞語進行處理;三是能計算短語的相似度。WordNet字典無法解析短語,如"less than 300 ratings",標(biāo)簽系統(tǒng)中類似的短語標(biāo)簽是很常見的?偠灾,Skip-gram算法在標(biāo)簽推薦領(lǐng)域?qū)嵱眯愿鼜姟5谌、本文提出的基于詞向量的標(biāo)簽語義推薦算法,結(jié)合了神經(jīng)網(wǎng)絡(luò)語言模型和匈牙利算法,較好地解決了標(biāo)簽與標(biāo)簽相似度和用戶與用戶之間相似度計算問題。并通過實驗,與現(xiàn)有算法比較,在推薦精度上有一定的提高。
【學(xué)位授予單位】:廣東工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:H030
【圖文】:
逑(邋社群影響邋飛逡逑圖3-1社群影響和個人意向之間的關(guān)系逡逑Fig邋3-1邋The邋relationship邋between邋the邋social邋influence邋and邋personal邋intention逡逑3.2社會標(biāo)簽系統(tǒng)模型逡逑社會化標(biāo)簽系統(tǒng)由用戶、資源、標(biāo)簽三類對象和一種標(biāo)注行為構(gòu)成,如圖3-2所逡逑不。逡逑r>9P邋同逡逑
本文編號:2724650
【學(xué)位授予單位】:廣東工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:H030
【圖文】:
逑(邋社群影響邋飛逡逑圖3-1社群影響和個人意向之間的關(guān)系逡逑Fig邋3-1邋The邋relationship邋between邋the邋social邋influence邋and邋personal邋intention逡逑3.2社會標(biāo)簽系統(tǒng)模型逡逑社會化標(biāo)簽系統(tǒng)由用戶、資源、標(biāo)簽三類對象和一種標(biāo)注行為構(gòu)成,如圖3-2所逡逑不。逡逑r>9P邋同逡逑
本文編號:2724650
本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/2724650.html
最近更新
教材專著