天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于主題模型的標(biāo)簽推薦方法

發(fā)布時間:2020-12-31 20:41
  隨著大數(shù)據(jù)時代的到來,互聯(lián)網(wǎng)上各種數(shù)據(jù)信息呈指數(shù)級增長,雖然用戶能訪問到幾乎所有互聯(lián)網(wǎng)資源,但由于很多資源未被整理以及數(shù)據(jù)過載等問題,在搜索想要的資源時通常效率較低且十分耗時。此外,如何高效地管理如此巨大的數(shù)據(jù)庫已經(jīng)成為管理者面臨的嚴(yán)峻挑戰(zhàn)。標(biāo)簽是用戶對資源語義信息的簡單描述,充分利用標(biāo)簽信息不僅可以有效提高信息檢索效率,還可以幫助網(wǎng)站對資源進(jìn)行分類和建立索引。隨著標(biāo)簽系統(tǒng)的發(fā)展,互聯(lián)網(wǎng)上出現(xiàn)了大量標(biāo)簽,但標(biāo)簽的質(zhì)量卻良莠不齊。由于用戶的標(biāo)注習(xí)慣、文化水平、拼寫錯誤等主觀因素,標(biāo)簽中出現(xiàn)了大量的不規(guī)則、無意義、有歧義的標(biāo)簽,這類質(zhì)量較低的標(biāo)簽嚴(yán)重影響了信息檢索的質(zhì)量和標(biāo)簽推薦的效果。因此,有必要研究出一種穩(wěn)定、有效的自動標(biāo)簽推薦方法。目前大部分標(biāo)簽推薦方法主要通過挖掘資源的內(nèi)容信息進(jìn)行推薦。然而,現(xiàn)實世界中很多數(shù)據(jù)信息并非獨立存在,如文獻(xiàn)數(shù)據(jù)通過相互引用關(guān)系而形成復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)。研究表明資源的拓?fù)浣Y(jié)構(gòu)信息和文本內(nèi)容信息可分別從兩個不同角度對同一資源的語義特征進(jìn)行概括,并且從兩方面觀察到的信息可以互為補(bǔ)充和解釋。基于此,本文在已有研究工作的基礎(chǔ)上,主要做了以下兩個方面的工作:(1)提出了... 

【文章來源】:湖南科技大學(xué)湖南省

【文章頁數(shù)】:58 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于主題模型的標(biāo)簽推薦方法


CiteULike網(wǎng)站中的一篇文章實例Fig.1.1AnarticleintheCiteULikewebsite

標(biāo)簽,資源


第1章緒論-2-圖1.1CiteULike網(wǎng)站中的一篇文章實例Fig.1.1AnarticleintheCiteULikewebsite圖1.2使用標(biāo)簽“mesophase”和“petroleum”進(jìn)行搜索的結(jié)果Fig.1.2Searchresultsbyusingkeywords“mephase”and“petroleum”1.2國內(nèi)外研究現(xiàn)狀在Web2.0時代,由于標(biāo)簽在信息檢索、信息處理、信息管理等方面發(fā)揮了巨大的作用,近些年來得到了科學(xué)界與工業(yè)界的廣泛關(guān)注,被學(xué)者們認(rèn)為是解決信息爆炸時代數(shù)據(jù)組織、管理和挖掘的最有效工具。本小節(jié)把現(xiàn)有的國內(nèi)外標(biāo)簽推薦方法分為基于協(xié)同過濾的標(biāo)簽推薦方法、基于內(nèi)容的標(biāo)簽推薦方法和基于混合的標(biāo)簽推薦方法三類。(1)基于協(xié)同過濾的標(biāo)簽推薦技術(shù)。在使用協(xié)同過濾算法進(jìn)行標(biāo)簽推薦時,常常會遇到冷啟動、資源稀疏、系統(tǒng)可擴(kuò)展性差等問題[9-11],目前大多數(shù)研究工作都是圍繞解決這些問題而展開的。Mishne等人[12]度量了不同用戶之間配置文件的相關(guān)性,使用基于用戶的協(xié)同過濾方法為目標(biāo)用戶推薦和其配置文件主題最相近用戶的標(biāo)簽,實驗結(jié)果表明,該方法在為微博用戶推薦標(biāo)簽上取得了較好的效果。Lipcazk等人[13]提出了一種新穎的計算資源主題相似度的方法,該方法通過計算不同資源主題之間的相似度,將與目標(biāo)資源主題相似度較高的資源的標(biāo)簽推薦給目標(biāo)資源,但僅僅使用資源之間的相關(guān)度會忽略標(biāo)簽之間的語義歧義性,有可能出現(xiàn)標(biāo)簽過擬合的情況,導(dǎo)致推薦效果一般。Gemmell等人[14]通過挖掘社會化標(biāo)注系統(tǒng)中用戶之間及資源之間的相關(guān)性,挖掘資源的主題分布并對標(biāo)簽進(jìn)行分類,最后通過不同用戶或不同資源之間的特征推薦最符合的標(biāo)

模型圖,主題,模型,資源


湖南科技大學(xué)碩士學(xué)位論文-13-(()=|())=(())+(())+(2.4)(()|()=)=(())+()+(2.5)圖2.4Tag-LDA主題模型Fig.2.4PlatenotationofTag-LDAmodel2.3.3RTM主題模型RTM(RelationTopicModel,RTM)模型認(rèn)為資源的主題分部信息不僅可以由資源的文本內(nèi)容信息體現(xiàn),還可以由與該資源有網(wǎng)絡(luò)鏈接關(guān)系的資源的主題體現(xiàn)。在標(biāo)簽推薦任務(wù)中,使用RTM主題模型不僅可以挖掘資源本體的主題信息,還可以挖掘與資源有鏈接關(guān)系資源的主題信息,將二者結(jié)合可以有效地推斷資源的主題分布,找到資源之間的相似關(guān)系后為新資源推薦主題最相近資源的標(biāo)簽。模型圖如圖2.5所示:"(c)θα(c)θ"(c)iz"c,cy"(c)iW(c)iW"(c)WW(c)Tβ(c)iz圖2.5RTM主題模型Fig.2.5PlatenotationofRTMmodel其中,()表示文章C的主題分布向量,(′)表示和文章C有引用關(guān)系的文章的向量。,′是一個可觀測到的變量,表示兩篇文章是否有引用關(guān)系。每兩篇文章都有這樣

【參考文獻(xiàn)】:
期刊論文
[1]一種融合個性化與多樣性的人物標(biāo)簽推薦方法[J]. 顓悅,熊錦華,程學(xué)旗.  中文信息學(xué)報. 2017(02)
[2]基于標(biāo)簽混合語義空間的音樂推薦方法研究[J]. 閆俊,劉文飛,林鴻飛.  中文信息學(xué)報. 2014(04)
[3]面向微博用戶標(biāo)簽推薦的關(guān)系約束主題模型[J]. 徐彬,楊丹,張昱,李封,高克寧.  計算機(jī)科學(xué)與探索. 2014(03)
[4]融合關(guān)系與內(nèi)容分析的社會標(biāo)簽推薦[J]. 張斌,張引,高克寧,郭朋偉,孫達(dá)明.  軟件學(xué)報. 2012(03)
[5]一種面向微博用戶的標(biāo)簽推薦方法[J]. 陳淵,林磊,孫承杰,劉秉權(quán).  智能計算機(jī)與應(yīng)用. 2011(05)



本文編號:2950281

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2950281.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶af5f6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com