基于大眾分類的互聯(lián)網(wǎng)對象概要建立與對象關系的深入探究
發(fā)布時間:2023-10-12 01:05
進入web 2.0時代,互聯(lián)網(wǎng)產(chǎn)品的內(nèi)容可由用戶主導而生成,用戶協(xié)作的應用場景越來越普及,大眾分類便是用戶協(xié)作應用中的殺手級應用。在大眾分類系統(tǒng)中,用戶可以自由、簡單地用標簽標記其感興趣的資源。此過程中,用戶、標簽和資源三者之間存在三種關系:標簽與資源之間的標記作用力,即標簽是對資源內(nèi)容的描述;標簽與用戶之間的標記反作用力,即標簽是對用戶喜好的描述;以及用戶和資源之間的互為因果關系,即用戶的某一愛好與其所標記的資源的內(nèi)容是一致的,F(xiàn)有工作中,用戶-資源間的互為因果關系尚未被使用,本文第一次發(fā)掘了這一關系,并進行了實驗檢驗。本文首先利用大眾分類中的用戶-標簽、資源-標簽關系為互聯(lián)網(wǎng)對象(用戶和資源)生成概要,并根據(jù)用戶-資源關系對用戶概要進行擴充;然后,將大眾分類標簽空間中的全部標簽根據(jù)語義關系進行結(jié)構(gòu)化;接著,以梳理出的標簽結(jié)構(gòu)為工具,以對象概要為輸入,輸出對象之間的相似度;最后,根據(jù)相似度排序,為互聯(lián)網(wǎng)用戶進行資源推薦。為對標簽進行結(jié)構(gòu)化,本文提出了一種提出的基于統(tǒng)計學理論進行語義包含關系提取算法(Confidence and Support Based Semantic Relat...
【文章頁數(shù)】:75 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
主要符號對照表
第一章 緒論
1.1 研究背景
1.2 應用場景
1.3 研究現(xiàn)狀
1.3.1 用戶概要建立
1.3.2 標簽語義關系提取
1.3.3 標簽結(jié)構(gòu)化
1.4 研究目的與意義
1.4.1 用戶-資源關系的深入探究
1.4.2 對標簽語義信息的挖掘
1.5 本章小結(jié)與文章內(nèi)容安排
第二章 理論背景
2.1 概率與統(tǒng)計
2.1.1 TF-IDF
2.1.2 概率分布函數(shù)與置信水平
2.1.3 關聯(lián)規(guī)則
2.1.4 精確率與召回率
2.2 圖論
2.2.1 隨機游走
2.2.2 二部圖匹配
2.3 推薦算法
2.3.1 潛層語義分析
2.3.2 協(xié)同過濾
2.4 本章小結(jié)
第三章 問題建模
3.1 問題表述與分析
3.2 基本假設與說明
3.2.1 冗余信息價值
3.2.2 標簽語義關系
3.2.3 對象的特征標簽
3.3 問題形式化
3.4 本章小結(jié)
第四章 算法提出
4.1 對象概要的生成與擴充
4.1.1 標簽初步獲取
4.1.2 確定特征標簽
4.1.3 用戶概要擴充
4.2 標簽的結(jié)構(gòu)化
4.2.1 語義關系提取
4.2.2 標簽一般性
4.2.3 標簽結(jié)構(gòu)化
4.3 對象相似性計算
4.4 本章小結(jié)
第五章 實驗驗證
5.1 實驗環(huán)境
5.2 數(shù)據(jù)集與預處理
5.3關于標簽語義提取的實驗
5.3.1 FBOV
5.3.2 CSSRE
5.3.3 結(jié)果分析
5.4關于對象概要建模的實驗
5.4.1 基于TASHR建模的資源推薦
5.4.2 基于LSI建模的資源推薦
5.4.3 基于IBCF建模的資源推薦
5.4.4 結(jié)果分析
5.5 關于用戶概要擴充的實驗
5.5.1 TASHR擴充前后
5.5.2 結(jié)果分析
5.6 本章小結(jié)
第六章 全文總結(jié)與展望
6.1 本文工作總結(jié)
6.2 未來工作展望
參考文獻
致謝
攻讀學位期間發(fā)表的學術(shù)論文
本文編號:3853142
【文章頁數(shù)】:75 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
主要符號對照表
第一章 緒論
1.1 研究背景
1.2 應用場景
1.3 研究現(xiàn)狀
1.3.1 用戶概要建立
1.3.2 標簽語義關系提取
1.3.3 標簽結(jié)構(gòu)化
1.4 研究目的與意義
1.4.1 用戶-資源關系的深入探究
1.4.2 對標簽語義信息的挖掘
1.5 本章小結(jié)與文章內(nèi)容安排
第二章 理論背景
2.1 概率與統(tǒng)計
2.1.1 TF-IDF
2.1.2 概率分布函數(shù)與置信水平
2.1.3 關聯(lián)規(guī)則
2.1.4 精確率與召回率
2.2 圖論
2.2.1 隨機游走
2.2.2 二部圖匹配
2.3 推薦算法
2.3.1 潛層語義分析
2.3.2 協(xié)同過濾
2.4 本章小結(jié)
第三章 問題建模
3.1 問題表述與分析
3.2 基本假設與說明
3.2.1 冗余信息價值
3.2.2 標簽語義關系
3.2.3 對象的特征標簽
3.3 問題形式化
3.4 本章小結(jié)
第四章 算法提出
4.1 對象概要的生成與擴充
4.1.1 標簽初步獲取
4.1.2 確定特征標簽
4.1.3 用戶概要擴充
4.2 標簽的結(jié)構(gòu)化
4.2.1 語義關系提取
4.2.2 標簽一般性
4.2.3 標簽結(jié)構(gòu)化
4.3 對象相似性計算
4.4 本章小結(jié)
第五章 實驗驗證
5.1 實驗環(huán)境
5.2 數(shù)據(jù)集與預處理
5.3關于標簽語義提取的實驗
5.3.1 FBOV
5.3.2 CSSRE
5.3.3 結(jié)果分析
5.4關于對象概要建模的實驗
5.4.1 基于TASHR建模的資源推薦
5.4.2 基于LSI建模的資源推薦
5.4.3 基于IBCF建模的資源推薦
5.4.4 結(jié)果分析
5.5 關于用戶概要擴充的實驗
5.5.1 TASHR擴充前后
5.5.2 結(jié)果分析
5.6 本章小結(jié)
第六章 全文總結(jié)與展望
6.1 本文工作總結(jié)
6.2 未來工作展望
參考文獻
致謝
攻讀學位期間發(fā)表的學術(shù)論文
本文編號:3853142
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3853142.html
最近更新
教材專著