天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于潛在語義分析的社會化標(biāo)注系統(tǒng)標(biāo)簽語義檢索研究

發(fā)布時間:2020-04-15 23:57
【摘要】:Web2.0環(huán)境下,社會化標(biāo)注系統(tǒng)逐漸發(fā)展為重要的資源組織與共享平臺,成為Web的主流發(fā)展方向之一。由于標(biāo)簽的模糊和不規(guī)范易造成漏檢,或因標(biāo)注資源龐大,檢索用戶需要過濾龐大的搜尋結(jié)果,檢索效率不高。因社會化標(biāo)注系統(tǒng)中絕大多數(shù)用戶的標(biāo)注行為符合社會共同認(rèn)識,所以存在基本的、潛在的語義結(jié)構(gòu)支配標(biāo)簽的出現(xiàn)和資源語義構(gòu)成,鑒于這一特點(diǎn),再結(jié)合潛在語義分析這一信息檢索代數(shù)模型,本文試圖尋找一種一方法來自動獲取標(biāo)簽間的語義關(guān)系,對資源賦予語義,將標(biāo)簽和資源以某種可計算性高、可操作性強(qiáng)、代表語義的形式表示和存儲,來提高標(biāo)簽的檢索效率。 本文所做的工作主要體現(xiàn)在如下四方面: (1)在對相關(guān)文獻(xiàn)進(jìn)行綜述的基礎(chǔ)上,介紹了社會化標(biāo)注發(fā)展歷程,定義、系統(tǒng)模型、以及潛在語義分析方法,分析了社會化標(biāo)注系統(tǒng)的3個主要要素,以及系統(tǒng)在標(biāo)簽檢索方面的不足,闡述了潛在語義分析方法的數(shù)學(xué)依據(jù),在此基礎(chǔ)上,提出基于潛在語義分析的標(biāo)簽語義檢索模型,討論了該方法應(yīng)用于社會化標(biāo)注的適用性。 (2)對社會化標(biāo)注系統(tǒng)的標(biāo)簽語義標(biāo)注進(jìn)行研究,改進(jìn)了資源模型,提出標(biāo)簽-資源矩陣的權(quán)重計算算法,用局部權(quán)重、標(biāo)簽全局權(quán)重、資源全局權(quán)重三個參數(shù)對常用的TF-IDF計算方法進(jìn)行改進(jìn)。用標(biāo)簽全局權(quán)重值來衡量標(biāo)簽在分辨資源時的重要程度和能力,用資源、全局權(quán)重值來描述資源對標(biāo)簽集所能提供的信息量,從行計算和列計算兩個方面對原始標(biāo)簽-資源矩陣權(quán)重進(jìn)行改進(jìn),使得新的矩陣更能體現(xiàn)社會化標(biāo)注系統(tǒng)的整體性。 (3)研究了社會化標(biāo)注系統(tǒng)標(biāo)簽語義檢索中的相似度計算和排序算法。首先介紹6種相似性計算算法,然后用改進(jìn)的余弦相似公式作為檢索式與資源集間的相似度計算算法。借鑒目前流行的排序算法,從標(biāo)簽和資源的“長尾”現(xiàn)象出發(fā),分析標(biāo)簽和資源的形成分布規(guī)律,利用相似用戶和資源的時序特性對排序算法進(jìn)行改進(jìn),使得檢索出的結(jié)果中相關(guān)性越強(qiáng)的資源排列越靠前。 (4)為驗證本文方案的可行性和優(yōu)越性,對提出的算法進(jìn)行了實(shí)驗。首先以具有代表性的delicious.com網(wǎng)站為例,抓取近20萬條原始數(shù)據(jù)并進(jìn)行清洗,分析資源、用戶和標(biāo)簽的關(guān)系,構(gòu)建三者網(wǎng)絡(luò)。借助軟件工具matlab,對這些數(shù)據(jù)用本文提出的算法和傳統(tǒng)的算法進(jìn)行2組檢索實(shí)驗,得出不同的排列結(jié)果。從查全率、查準(zhǔn)率曲線,查全率/查準(zhǔn)率曲線,查全率、查準(zhǔn)率直方圖,MAP指標(biāo)對二組實(shí)驗得出的不同結(jié)果進(jìn)行分析評價,證實(shí)了本文提出的標(biāo)簽語義檢索改進(jìn)方法優(yōu)于傳統(tǒng)的向量空間模型方法。 最后對全文的研究工作進(jìn)行總結(jié),指出本研究所存在的一些不足,對未來的研究進(jìn)行展望。
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2011
【分類號】:G354

【參考文獻(xiàn)】

相關(guān)期刊論文 前5條

1 張春元;康耀紅;伍小芹;;Web信息檢索排序算法研究[J];海南大學(xué)學(xué)報(自然科學(xué)版);2009年01期

2 劉昌鈺,唐常杰,于中華,杜永萍,郭穎;基于潛在語義分析的BBS文檔Bayes鑒別器[J];計算機(jī)學(xué)報;2004年04期

3 張玫;張曉林;;Connotea中Social Tagging機(jī)制研究[J];現(xiàn)代圖書情報技術(shù);2007年07期

4 竇玉萌;趙丹群;;協(xié)作標(biāo)注系統(tǒng)研究綜述[J];現(xiàn)代圖書情報技術(shù);2009年02期

5 Hak Lae Kim;Simon Scerri;John G.Breslin;Stefan Decker;Hong Gee Kim;丁鵬宇;;最新標(biāo)簽本體:標(biāo)簽和民俗分類法語義模型[J];現(xiàn)代圖書情報技術(shù);2009年03期

相關(guān)博士學(xué)位論文 前1條

1 余傳明;基于本體的語義信息系統(tǒng)研究[D];武漢大學(xué);2005年



本文編號:2629140

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/2629140.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶54acf***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com