基于小數(shù)據(jù)融合的數(shù)字圖書館個性化推薦研究
發(fā)布時間:2020-12-23 02:03
隨著數(shù)字資源數(shù)量的迅猛增長,用戶在數(shù)字圖書館中找到符合自身需求或感興趣的資源愈加困難。數(shù)字圖書館提供個性化的服務,主動為用戶推薦符合其需求的內(nèi)容是應對這一困難的有效手段。經(jīng)過專家學者大量的研究,數(shù)字圖書館個性化推薦模型已經(jīng)比較成熟,通常由用戶信息模塊,用戶興趣模塊,推薦算法模塊三部分構成。其中,用戶信息模塊是數(shù)字圖書館個性化推薦的基礎,在一定程度上決定著推薦效果的優(yōu)劣,F(xiàn)有數(shù)字圖書館個性化推薦研究中的用戶信息多是來源于數(shù)字圖書館管理系統(tǒng)內(nèi)部,數(shù)據(jù)利用率較低,難以充分表示用戶特征。隨著科學技術的持續(xù)發(fā)展,可穿戴設備、傳感器等電子設備的不斷涌現(xiàn),關于用戶個體行為的細粒度數(shù)據(jù)得到了很好地記錄與收集,將這些數(shù)據(jù)結合使用可以更加全面且深刻地刻畫用戶行為。這種記錄了關于用戶日常行為、愛好、習慣等的數(shù)據(jù)被稱作“小數(shù)據(jù)”,是對用戶個體進行全方位、多角度、細粒度量化的數(shù)據(jù)。將數(shù)字圖書館系統(tǒng)內(nèi)外以及電子設備中的用戶小數(shù)據(jù)結合在一起可以更全面、更深刻、更立體化的描述用戶特征。小數(shù)據(jù)來源廣泛,形式多樣,結構復雜。想要高效利用小數(shù)據(jù)中深藏的價值,有必要對其進行有效地組織與融合。本文探討使用小數(shù)據(jù)融合的方法進行數(shù)...
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【部分圖文】:
圖2.1數(shù)字圖書館個性化推薦通用模型圖??
妒墾?宦畚模崳姡停粒櫻裕牛遙В櫻牐裕齲牛櫻桑櫻崳?并通過資源分類樹來對用戶興趣庫進行更新,定期分析用戶興趣的衰減與增強,反??映用戶的即時偏好,其模型結構如圖2.2。??興趣衰減??用戶訪問日志^??資源分類樹——?用戶興趣庫??評估????//??!?^f?1?'???|?^資源關聯(lián)^^??用戶聚類??圖2.2基于資源分類樹的數(shù)字圖書館用戶興趣模型結構圖??2.3.2基于本體的方法??基于本體的用戶建模方法使用向量空間表示用戶模型,推薦系統(tǒng)中用戶模型需??要與數(shù)字圖書館的領域本體和概念進行匹配計算,匹配過程中需要和領域本體庫進??行交互,因此在建立推薦系統(tǒng)的前期首先要使用領域本體庫對資源進行表示。用戶??興趣抽取部分模塊任務是對采集到的用戶數(shù)據(jù)使用合適的方法進行分析。用戶數(shù)據(jù)??的采集范圍包括用戶在數(shù)字圖書館中的使用記錄、瀏覽記錄以及用戶操作時的模式??等,在其中挖掘用戶的需求和偏好。用戶興趣信息更新部分模塊需要結合已經(jīng)建立??好的用戶模型以及系統(tǒng)持續(xù)挖掘的用戶興趣,對用戶模型進行實時的更新。系統(tǒng)為??用戶提供推薦服務后,用戶對服務進行反饋以此反映用戶個體的偏好,判斷用戶模??型的優(yōu)劣,繼續(xù)通過數(shù)據(jù)采集模塊收集用戶數(shù)據(jù),循環(huán)往復,不斷循環(huán);诒倔w??的數(shù)字圖
的檢索者訪問信息傳給文本分析模塊,文本分析模塊接收到信息后,到文檔模型庫??中查找相應的頁面內(nèi)容信息,同時系統(tǒng)根據(jù)檢索者在頁面的操作來推測檢索這的興??趣愛好與內(nèi)容的關系,結構如圖2.4。??I?1??用戶??;?▲?1??丁??丄??.?;?I??個1?1?I?(????性?文本分析?用戶主動維護檢索日志分析??化?II?卜??數(shù)??據(jù)?——」?.?^???預??處?用戶模型生成和聚類??理?I?1??I??:?x????^??3^????’??圖2.4基于用戶檢索行為的數(shù)字圖書館用戶模型結構圖??2.4數(shù)字圖書館個性化推薦系統(tǒng)??個性化推薦在數(shù)字圖書館發(fā)展過程中變得越來越重要,目前已經(jīng)有一些成熟的??數(shù)字圖書館個性化推薦系統(tǒng),本節(jié)將詳細介紹國內(nèi)外較成熟的應用系統(tǒng)。??2.4.1國外數(shù)字圖書館個性化推薦系統(tǒng)??國外較成熟的數(shù)字圖書館個性化推薦系統(tǒng)包括美國施樂公司開發(fā)的Tapestry系??統(tǒng),美國斯坦福大學開發(fā)的Fab系統(tǒng),美國NEC實驗室開發(fā)的Citeseer系統(tǒng),美國??俄勒岡州立大學開發(fā)的SERF系統(tǒng)以及美國加州大學開發(fā)的Melvyl系統(tǒng)[37]。??Tapestry是一個管理電子文檔的實驗系統(tǒng)
【參考文獻】:
期刊論文
[1]養(yǎng)老服務數(shù)據(jù)融合需求分析和框架設計[J]. 朱慶華,吳瓊,郭雨辰,左美云. 文獻與數(shù)據(jù)學報. 2020(03)
[2]國內(nèi)圖書館界小數(shù)據(jù)研究進展[J]. 曹霞. 圖書情報工作. 2020(14)
本文編號:2932861
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【部分圖文】:
圖2.1數(shù)字圖書館個性化推薦通用模型圖??
妒墾?宦畚模崳姡停粒櫻裕牛遙В櫻牐裕齲牛櫻桑櫻崳?并通過資源分類樹來對用戶興趣庫進行更新,定期分析用戶興趣的衰減與增強,反??映用戶的即時偏好,其模型結構如圖2.2。??興趣衰減??用戶訪問日志^??資源分類樹——?用戶興趣庫??評估????//??!?^f?1?'???|?^資源關聯(lián)^^??用戶聚類??圖2.2基于資源分類樹的數(shù)字圖書館用戶興趣模型結構圖??2.3.2基于本體的方法??基于本體的用戶建模方法使用向量空間表示用戶模型,推薦系統(tǒng)中用戶模型需??要與數(shù)字圖書館的領域本體和概念進行匹配計算,匹配過程中需要和領域本體庫進??行交互,因此在建立推薦系統(tǒng)的前期首先要使用領域本體庫對資源進行表示。用戶??興趣抽取部分模塊任務是對采集到的用戶數(shù)據(jù)使用合適的方法進行分析。用戶數(shù)據(jù)??的采集范圍包括用戶在數(shù)字圖書館中的使用記錄、瀏覽記錄以及用戶操作時的模式??等,在其中挖掘用戶的需求和偏好。用戶興趣信息更新部分模塊需要結合已經(jīng)建立??好的用戶模型以及系統(tǒng)持續(xù)挖掘的用戶興趣,對用戶模型進行實時的更新。系統(tǒng)為??用戶提供推薦服務后,用戶對服務進行反饋以此反映用戶個體的偏好,判斷用戶模??型的優(yōu)劣,繼續(xù)通過數(shù)據(jù)采集模塊收集用戶數(shù)據(jù),循環(huán)往復,不斷循環(huán);诒倔w??的數(shù)字圖
的檢索者訪問信息傳給文本分析模塊,文本分析模塊接收到信息后,到文檔模型庫??中查找相應的頁面內(nèi)容信息,同時系統(tǒng)根據(jù)檢索者在頁面的操作來推測檢索這的興??趣愛好與內(nèi)容的關系,結構如圖2.4。??I?1??用戶??;?▲?1??丁??丄??.?;?I??個1?1?I?(????性?文本分析?用戶主動維護檢索日志分析??化?II?卜??數(shù)??據(jù)?——」?.?^???預??處?用戶模型生成和聚類??理?I?1??I??:?x????^??3^????’??圖2.4基于用戶檢索行為的數(shù)字圖書館用戶模型結構圖??2.4數(shù)字圖書館個性化推薦系統(tǒng)??個性化推薦在數(shù)字圖書館發(fā)展過程中變得越來越重要,目前已經(jīng)有一些成熟的??數(shù)字圖書館個性化推薦系統(tǒng),本節(jié)將詳細介紹國內(nèi)外較成熟的應用系統(tǒng)。??2.4.1國外數(shù)字圖書館個性化推薦系統(tǒng)??國外較成熟的數(shù)字圖書館個性化推薦系統(tǒng)包括美國施樂公司開發(fā)的Tapestry系??統(tǒng),美國斯坦福大學開發(fā)的Fab系統(tǒng),美國NEC實驗室開發(fā)的Citeseer系統(tǒng),美國??俄勒岡州立大學開發(fā)的SERF系統(tǒng)以及美國加州大學開發(fā)的Melvyl系統(tǒng)[37]。??Tapestry是一個管理電子文檔的實驗系統(tǒng)
【參考文獻】:
期刊論文
[1]養(yǎng)老服務數(shù)據(jù)融合需求分析和框架設計[J]. 朱慶華,吳瓊,郭雨辰,左美云. 文獻與數(shù)據(jù)學報. 2020(03)
[2]國內(nèi)圖書館界小數(shù)據(jù)研究進展[J]. 曹霞. 圖書情報工作. 2020(14)
本文編號:2932861
本文鏈接:http://sikaile.net/tushudanganlunwen/2932861.html
教材專著