面向服務(wù)的社會(huì)化標(biāo)注方法研究
發(fā)布時(shí)間:2023-01-29 20:20
在過(guò)去一些年中,由于資源易于分類以及可以使用標(biāo)簽來(lái)檢索內(nèi)容,社會(huì)標(biāo)簽系統(tǒng)越來(lái)越受歡迎。社會(huì)標(biāo)注是Web2.0引入的一種新穎和有用的機(jī)制。日益增多的用戶通過(guò)社會(huì)標(biāo)注行為提供資源的信息,于是就出現(xiàn)基于標(biāo)簽的搜索方法,通過(guò)用戶所標(biāo)注的標(biāo)簽就揭示了用戶對(duì)于內(nèi)容的偏好。因此,標(biāo)注信息可用于做推薦。社會(huì)標(biāo)注系統(tǒng)的用戶可以定義個(gè)人分類,其他用戶也可以瀏覽相關(guān)資源,盡管如此,由于缺乏對(duì)標(biāo)注過(guò)程的有效管理,以及缺乏標(biāo)簽之間的關(guān)系的定義,用戶所做的資源分類不見得是很合理的,這就產(chǎn)生了資源共享的局限性。 目前利用標(biāo)簽進(jìn)行推薦的方法主要有三種:基于三部圖的推薦方法,基于概率模型的推薦方法,基于協(xié)同過(guò)濾的推薦方法;谌繄D存在的不足是將用戶、對(duì)象、標(biāo)簽看成三類不同的節(jié)點(diǎn),連邊只在不同類節(jié)點(diǎn)之間,同類節(jié)點(diǎn)之間不存在連邊,這種人為的劃分方式割裂了三類節(jié)點(diǎn)相互之間的“共現(xiàn)”關(guān)系,從而不可避免地會(huì)造成信息丟失;诟怕誓P退惴ù嬖诘牟蛔闶且詸C(jī)器學(xué)習(xí)為基礎(chǔ),這種方法一般采用Gibbs抽樣,或者期望最大化方法來(lái)迭代獲得最優(yōu)的推薦結(jié)果,因此對(duì)計(jì)算機(jī)的計(jì)算能力要求較高。特別是當(dāng)數(shù)據(jù)量規(guī)模非常大的時(shí)候,使用基于概率模型的...
【文章頁(yè)數(shù)】:109 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景
1.1.1 Web服務(wù)
1.1.2 Web服務(wù)索引
1.1.3 社會(huì)化標(biāo)簽的起源
1.1.4 社會(huì)化標(biāo)簽系統(tǒng)模型
1.1.5 社會(huì)化標(biāo)簽系統(tǒng)的特點(diǎn)與不足
1.1.6 個(gè)性化信息推薦
1.2 問(wèn)題的提出及意義
1.3 本文研究的主要內(nèi)容及研究體系
1.4 論文的組織結(jié)構(gòu)
第二章 相關(guān)研究
2.1 引言
2.2 信息檢索(IR)
2.2.1 信息檢索簡(jiǎn)介
2.2.2 信息檢索的目標(biāo)
2.2.3 信息檢索的基本方法
2.3 Web服務(wù)發(fā)現(xiàn)
2.3.1 擴(kuò)充服務(wù)請(qǐng)求
2.3.2 使用圖匹配的BPEL過(guò)程排序
2.3.3 基于層次的Web服務(wù)發(fā)現(xiàn)
2.3.4 在異構(gòu)網(wǎng)絡(luò)中的服務(wù)發(fā)現(xiàn)
2.4 個(gè)性化信息推薦研究現(xiàn)狀
2.5 標(biāo)注分布
2.5.1 標(biāo)注系統(tǒng)詞匯
2.5.2 資源的標(biāo)簽增長(zhǎng)
2.5.3 用戶標(biāo)簽詞匯的增長(zhǎng)
2.6 推薦標(biāo)簽
第三章 基于隨機(jī)游走的標(biāo)簽推薦和服務(wù)發(fā)現(xiàn)方法
3.1 引言
3.2 相關(guān)研究工作
3.3 基于隨機(jī)游走的標(biāo)簽推薦方法
3.3.1 網(wǎng)絡(luò)模型
3.3.2 隨機(jī)游走模型
3.3.3 在TTN上的隨機(jī)游走
3.4 API服務(wù)的相似性
3.4.1 文本文檔的向量空間模型
3.4.2 余弦相似度
3.5 基于隨機(jī)游走的服務(wù)查詢和標(biāo)簽推薦方法
3.5.1 標(biāo)簽推薦
3.5.2 基于標(biāo)簽的服務(wù)查詢
3.5.3 算法復(fù)雜性分析
3.6 實(shí)驗(yàn)及分析
3.6.1 數(shù)據(jù)收集
3.6.2 標(biāo)簽過(guò)濾
3.6.3 度量指標(biāo)
3.6.4 標(biāo)簽推薦
3.6.5 對(duì)比試驗(yàn)
3.6.6 系統(tǒng)驗(yàn)證
3.7 本章小結(jié)
第四章 基于標(biāo)簽推薦的服務(wù)聚類方法
4.1 引言
4.2 相關(guān)研究工作
4.3 基于擴(kuò)充和精化的標(biāo)簽推薦
4.4 Web服務(wù)聚類
4.4.1 預(yù)處理文檔
4.4.2 皮爾遜相關(guān)系數(shù)
4.4.3 API、Tag相似性
4.4.4 相似性集成
4.4.5 常用的聚類方法
4.4.6 基于Mashup服務(wù)相似性的K-Means算法
4.5 實(shí)驗(yàn)
4.5.1 數(shù)據(jù)集和評(píng)價(jià)指標(biāo)
4.5.2 實(shí)驗(yàn)方法
4.5.3 實(shí)驗(yàn)結(jié)果分析
4.6 本章小結(jié)
第五章 基于主題的標(biāo)簽排序
5.1 引言
5.2 相關(guān)研究工作
5.3 標(biāo)簽推薦
5.3.1 問(wèn)題定義
5.3.2 Latent Dirichlet Allocation(LDA)
5.3.3 基于話題的標(biāo)簽推薦
5.4 標(biāo)簽話題提取
5.5 實(shí)驗(yàn)
5.5.1 文本和網(wǎng)頁(yè)的預(yù)處理
5.5.2 數(shù)據(jù)收集和分析
5.5.3 實(shí)驗(yàn)設(shè)置及評(píng)價(jià)方法
5.5.4 delicious數(shù)據(jù)集的結(jié)果
5.5.5 ProgrammableWeb數(shù)據(jù)集的結(jié)果
5.6 本章小結(jié)
第六章 基于主動(dòng)標(biāo)注的標(biāo)簽預(yù)測(cè)
6.1 引言
6.2 相關(guān)研究工作
6.3 主動(dòng)學(xué)習(xí)理論
6.3.1 主動(dòng)學(xué)習(xí)的簡(jiǎn)單介紹
6.3.2 主動(dòng)學(xué)習(xí)樣本選擇策略
6.4 主動(dòng)標(biāo)注
6.4.1 樣本選擇
6.4.2 標(biāo)簽預(yù)測(cè)
6.5 實(shí)驗(yàn)
6.5.1 數(shù)據(jù)集和參數(shù)設(shè)置
6.5.2 實(shí)驗(yàn)步驟
6.5.3 實(shí)驗(yàn)結(jié)果
6.6 本章小結(jié)
第七章 總結(jié)與展望
7.1 論文總結(jié)
7.2 下一步工作展望
參考文獻(xiàn)
攻讀博士學(xué)位期間的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于軟件網(wǎng)絡(luò)的服務(wù)自動(dòng)分類和推薦方法研究[J]. 潘偉豐,李兵,邵波,何鵬. 計(jì)算機(jī)學(xué)報(bào). 2011(12)
[2]高校圖書館用戶信息行為研究述略[J]. 熊菊敏,喻華林. 科技管理研究. 2007(12)
本文編號(hào):3732843
【文章頁(yè)數(shù)】:109 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景
1.1.1 Web服務(wù)
1.1.2 Web服務(wù)索引
1.1.3 社會(huì)化標(biāo)簽的起源
1.1.4 社會(huì)化標(biāo)簽系統(tǒng)模型
1.1.5 社會(huì)化標(biāo)簽系統(tǒng)的特點(diǎn)與不足
1.1.6 個(gè)性化信息推薦
1.2 問(wèn)題的提出及意義
1.3 本文研究的主要內(nèi)容及研究體系
1.4 論文的組織結(jié)構(gòu)
第二章 相關(guān)研究
2.1 引言
2.2 信息檢索(IR)
2.2.1 信息檢索簡(jiǎn)介
2.2.2 信息檢索的目標(biāo)
2.2.3 信息檢索的基本方法
2.3 Web服務(wù)發(fā)現(xiàn)
2.3.1 擴(kuò)充服務(wù)請(qǐng)求
2.3.2 使用圖匹配的BPEL過(guò)程排序
2.3.3 基于層次的Web服務(wù)發(fā)現(xiàn)
2.3.4 在異構(gòu)網(wǎng)絡(luò)中的服務(wù)發(fā)現(xiàn)
2.4 個(gè)性化信息推薦研究現(xiàn)狀
2.5 標(biāo)注分布
2.5.1 標(biāo)注系統(tǒng)詞匯
2.5.2 資源的標(biāo)簽增長(zhǎng)
2.5.3 用戶標(biāo)簽詞匯的增長(zhǎng)
2.6 推薦標(biāo)簽
第三章 基于隨機(jī)游走的標(biāo)簽推薦和服務(wù)發(fā)現(xiàn)方法
3.1 引言
3.2 相關(guān)研究工作
3.3 基于隨機(jī)游走的標(biāo)簽推薦方法
3.3.1 網(wǎng)絡(luò)模型
3.3.2 隨機(jī)游走模型
3.3.3 在TTN上的隨機(jī)游走
3.4 API服務(wù)的相似性
3.4.1 文本文檔的向量空間模型
3.4.2 余弦相似度
3.5 基于隨機(jī)游走的服務(wù)查詢和標(biāo)簽推薦方法
3.5.1 標(biāo)簽推薦
3.5.2 基于標(biāo)簽的服務(wù)查詢
3.5.3 算法復(fù)雜性分析
3.6 實(shí)驗(yàn)及分析
3.6.1 數(shù)據(jù)收集
3.6.2 標(biāo)簽過(guò)濾
3.6.3 度量指標(biāo)
3.6.4 標(biāo)簽推薦
3.6.5 對(duì)比試驗(yàn)
3.6.6 系統(tǒng)驗(yàn)證
3.7 本章小結(jié)
第四章 基于標(biāo)簽推薦的服務(wù)聚類方法
4.1 引言
4.2 相關(guān)研究工作
4.3 基于擴(kuò)充和精化的標(biāo)簽推薦
4.4 Web服務(wù)聚類
4.4.1 預(yù)處理文檔
4.4.2 皮爾遜相關(guān)系數(shù)
4.4.3 API、Tag相似性
4.4.4 相似性集成
4.4.5 常用的聚類方法
4.4.6 基于Mashup服務(wù)相似性的K-Means算法
4.5 實(shí)驗(yàn)
4.5.1 數(shù)據(jù)集和評(píng)價(jià)指標(biāo)
4.5.2 實(shí)驗(yàn)方法
4.5.3 實(shí)驗(yàn)結(jié)果分析
4.6 本章小結(jié)
第五章 基于主題的標(biāo)簽排序
5.1 引言
5.2 相關(guān)研究工作
5.3 標(biāo)簽推薦
5.3.1 問(wèn)題定義
5.3.2 Latent Dirichlet Allocation(LDA)
5.3.3 基于話題的標(biāo)簽推薦
5.4 標(biāo)簽話題提取
5.5 實(shí)驗(yàn)
5.5.1 文本和網(wǎng)頁(yè)的預(yù)處理
5.5.2 數(shù)據(jù)收集和分析
5.5.3 實(shí)驗(yàn)設(shè)置及評(píng)價(jià)方法
5.5.4 delicious數(shù)據(jù)集的結(jié)果
5.5.5 ProgrammableWeb數(shù)據(jù)集的結(jié)果
5.6 本章小結(jié)
第六章 基于主動(dòng)標(biāo)注的標(biāo)簽預(yù)測(cè)
6.1 引言
6.2 相關(guān)研究工作
6.3 主動(dòng)學(xué)習(xí)理論
6.3.1 主動(dòng)學(xué)習(xí)的簡(jiǎn)單介紹
6.3.2 主動(dòng)學(xué)習(xí)樣本選擇策略
6.4 主動(dòng)標(biāo)注
6.4.1 樣本選擇
6.4.2 標(biāo)簽預(yù)測(cè)
6.5 實(shí)驗(yàn)
6.5.1 數(shù)據(jù)集和參數(shù)設(shè)置
6.5.2 實(shí)驗(yàn)步驟
6.5.3 實(shí)驗(yàn)結(jié)果
6.6 本章小結(jié)
第七章 總結(jié)與展望
7.1 論文總結(jié)
7.2 下一步工作展望
參考文獻(xiàn)
攻讀博士學(xué)位期間的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于軟件網(wǎng)絡(luò)的服務(wù)自動(dòng)分類和推薦方法研究[J]. 潘偉豐,李兵,邵波,何鵬. 計(jì)算機(jī)學(xué)報(bào). 2011(12)
[2]高校圖書館用戶信息行為研究述略[J]. 熊菊敏,喻華林. 科技管理研究. 2007(12)
本文編號(hào):3732843
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3732843.html
最近更新
教材專著