基于用戶行為建模和大數(shù)據(jù)挖掘的圖書館個性化服務研究
發(fā)布時間:2021-08-10 06:37
[目的 /意義]大數(shù)據(jù)背景下,如何構建合適的用戶行為模型并基于海量的行為日志數(shù)據(jù)提供個性化服務,是當前圖書館大數(shù)據(jù)應用落地迫切需要解決的問題。[方法 /過程]首先分析用戶行為模型構建的研究現(xiàn)狀及存在的困境,接著密切結合大數(shù)據(jù)背景下個性化服務的特征,針對性提出基于本體的高校圖書館用戶行為模型的構建策略和構建方法,并設計一種利用用戶日志庫提取用戶顯性興趣和隱性需求本體的個性化服務方案,最后給出基于流行的Hadoop大數(shù)據(jù)分析平臺和MapReduce計算框架的圖書館個性化服務的應用案例。[結果/結論]基于本體構建的用戶行為模型,技術上可與大數(shù)據(jù)分析平臺實現(xiàn)無縫對接,從而提供實時而精準的服務,能有效應對當前大數(shù)據(jù)環(huán)境下圖書館個性化服務面臨的"知識迷航""信息過載"和"情感缺失"的挑戰(zhàn)。
【文章來源】:圖書情報工作. 2017,61(01)北大核心CSSCI
【文章頁數(shù)】:7 頁
【部分圖文】:
用戶行為模型構建與個性化服務策略圖1中,實時性和交互性是海量數(shù)據(jù)情景下用戶
?棖?則是用戶深層次的隱性情感需要,一般需應用相關數(shù)據(jù)挖掘算法才能發(fā)現(xiàn)。利用建立在用戶行為日志數(shù)據(jù)分析之上的用戶顯性興趣統(tǒng)計和隱性需求挖掘方法,能為不同興趣和不同需求的用戶主動提供個性化服務,同時體現(xiàn)“人性化”關懷,竭力滿足用戶的情感需求,有利于提升大數(shù)據(jù)環(huán)境下圖書館服務質量和水平。根據(jù)以上分析,本研究擬基于本體和關聯(lián)數(shù)據(jù)技術,構建用戶行為模型,通過分析顯性用戶興趣和隱性用戶需求,提供大數(shù)據(jù)情景下的圖書館個性化服務。3.2用戶行為模型構建方法3.2.1用戶行為本體模型的設計模型如圖2所示:圖2基于本體和關聯(lián)數(shù)據(jù)的用戶行為模型描述用戶行為的“用戶圖書服務信息”類包括“圖書瀏覽、檢索、收藏、評論和借閱”5個子類(subclass);“用戶知識服務信息”類包括“知識瀏覽、檢索、收藏、評論和下載”5個子類。由于“用戶行為信息”日志數(shù)據(jù)庫的記錄由用戶的基本屬性和圖書信息(或知識信息)的屬性組成,因此“用戶圖書(知識)服務信息”類需要和“用戶基本信息”類以及“圖書(知識)信息”類通過關聯(lián)數(shù)據(jù)技術產生關聯(lián)。為方便理解,一個依據(jù)本模型的實例見表1。3.2.2用戶行為模型中相關類的屬性設計“用戶基本信息”類包含的屬性分別為“用戶ID”“用戶姓名”“單位”和“教育水平”,屬性數(shù)據(jù)用來描述用戶基本特征,在用戶使用圖書館服務系統(tǒng)平臺時,通過注冊個人資料時獲取;“圖書信息”類對應的屬性為“書目名稱”“作者”“出版社”和“ISBN書號”,“知識信息”類對應的屬性為“知識ID”“知識標題”和“知識創(chuàng)建者”,其屬性數(shù)據(jù)來自于各自領域的本體數(shù)據(jù)庫。經過細致調研,參照大英圖書館為BNB所設計的關聯(lián)數(shù)據(jù)本體模型[21],并選擇萬維網(wǎng)聯(lián)盟W3C組織推薦的知名本體庫(如<http://p
略?次檢索2次;評論6次;下載1次檢索5次;收藏1次;評論3次知識標題“大數(shù)據(jù)定義、特征、應用與發(fā)展趨勢”文檔“數(shù)據(jù)挖掘十大經典算法理論及應用”文檔“云計算背景、概念、特點、應用及服務形式”文檔“關聯(lián)數(shù)據(jù)概念、技術規(guī)范和實現(xiàn)工具”文檔本體術語“大數(shù)據(jù)”“數(shù)據(jù)挖掘”“云計算”“關聯(lián)數(shù)據(jù)”部分)確定關聯(lián)關系和對應的屬性類別,以方便數(shù)據(jù)交互和知識共享。3.3基于用戶行為模型的個性化服務方案個性化服務方案由用戶行為本體數(shù)據(jù)庫構建、用戶興趣和需求本體挖掘和基于本體的個性化服務3部分組成。如圖3所示:圖3基于用戶行為模型的個性化服務方案3.3.1用戶行為本體數(shù)據(jù)庫構建過程按照圖2所示的用戶行為本體模型架構,生成對應的數(shù)據(jù)庫字段,密切結合圖書館書目(或知識領域)本體概念庫,從原始的用戶服務日志和用戶基本信息的數(shù)據(jù)庫中解析出對應字段的數(shù)據(jù),組合構建成為用戶行為本體數(shù)據(jù)庫,該數(shù)據(jù)庫需要依據(jù)日志變化以更新本體模型中的術語:即通過對用戶原始的日志信息分析和挖掘,提取概念或主題,并按照本體技術進行規(guī)范后,加入到本體庫中。3.3.2用戶顯性興趣和隱性需求本體提取過程依據(jù)對每個用戶行為日志庫的分析統(tǒng)計,提取用戶顯性興趣本體術語以準確反映用戶的偏好;另外通過對該庫的全體用戶日志的數(shù)據(jù)挖掘,提取隱性需求本體,注意這種基于數(shù)據(jù)挖掘算法“發(fā)現(xiàn)”的本體術語,是系統(tǒng)對用戶行為日志庫中所有用戶的歷史行為“學習”和“挖掘”后,找出的與用戶顯性興趣本體術語“密切相關”的術語,能夠滿足用戶擴展和隱性的需求。3.3.3個性化推薦過程當用戶登錄服務平臺時,根據(jù)用戶的興趣本體,查詢相關數(shù)據(jù)庫(如書目、論文、專利和知識庫等),將結果推送給用戶,實現(xiàn)用戶顯性興趣的個性化推?
【參考文獻】:
期刊論文
[1]國內基于本體的個性化服務研究綜述[J]. 曹霞. 圖書館工作與研究. 2016(08)
[2]基于大數(shù)據(jù)挖掘與決策分析體系的高校圖書館個性化服務研究[J]. 李艷,呂鵬,李瓏. 圖書情報知識. 2016(02)
[3]大數(shù)據(jù)時代數(shù)字圖書館面臨的機遇和挑戰(zhàn)[J]. 蘇新寧. 中國圖書館學報. 2015(06)
[4]移動數(shù)字圖書館用戶行為模型構建研究[J]. 劉錦宏,余思慧,徐麗芳. 大學圖書館學報. 2015(05)
[5]面向科研跟蹤推送的個性化知識服務模型[J]. 陳祖琴,劉喜文,鄭昌興. 圖書館學研究. 2015(01)
[6]基于知識聚合的數(shù)字圖書館信息智能檢索模型[J]. 王敬東. 圖書館學研究. 2014(21)
[7]用戶信息行為與個性化知識服務關聯(lián)性分析[J]. 李冬冬,宋拓,畢思達. 情報科學. 2014(08)
[8]云制造環(huán)境下基于用戶行為感知的個性化知識服務技術[J]. 李穎新,敬石開,李向前,占紅飛,周競濤,楊海成,張宏,牟向峰. 計算機集成制造系統(tǒng). 2015(03)
[9]數(shù)字圖書館個性化服務資源推薦模式分析[J]. 熊擁軍. 圖書館. 2014(02)
[10]面向關聯(lián)數(shù)據(jù)的語義數(shù)字圖書館資源描述與組織框架設計與實現(xiàn)[J]. 歐石燕. 中國圖書館學報. 2012(06)
博士論文
[1]基于關聯(lián)數(shù)據(jù)和用戶本體的個性化知識服務關鍵技術研究[D]. 陳毅波.武漢大學 2012
本文編號:3333668
【文章來源】:圖書情報工作. 2017,61(01)北大核心CSSCI
【文章頁數(shù)】:7 頁
【部分圖文】:
用戶行為模型構建與個性化服務策略圖1中,實時性和交互性是海量數(shù)據(jù)情景下用戶
?棖?則是用戶深層次的隱性情感需要,一般需應用相關數(shù)據(jù)挖掘算法才能發(fā)現(xiàn)。利用建立在用戶行為日志數(shù)據(jù)分析之上的用戶顯性興趣統(tǒng)計和隱性需求挖掘方法,能為不同興趣和不同需求的用戶主動提供個性化服務,同時體現(xiàn)“人性化”關懷,竭力滿足用戶的情感需求,有利于提升大數(shù)據(jù)環(huán)境下圖書館服務質量和水平。根據(jù)以上分析,本研究擬基于本體和關聯(lián)數(shù)據(jù)技術,構建用戶行為模型,通過分析顯性用戶興趣和隱性用戶需求,提供大數(shù)據(jù)情景下的圖書館個性化服務。3.2用戶行為模型構建方法3.2.1用戶行為本體模型的設計模型如圖2所示:圖2基于本體和關聯(lián)數(shù)據(jù)的用戶行為模型描述用戶行為的“用戶圖書服務信息”類包括“圖書瀏覽、檢索、收藏、評論和借閱”5個子類(subclass);“用戶知識服務信息”類包括“知識瀏覽、檢索、收藏、評論和下載”5個子類。由于“用戶行為信息”日志數(shù)據(jù)庫的記錄由用戶的基本屬性和圖書信息(或知識信息)的屬性組成,因此“用戶圖書(知識)服務信息”類需要和“用戶基本信息”類以及“圖書(知識)信息”類通過關聯(lián)數(shù)據(jù)技術產生關聯(lián)。為方便理解,一個依據(jù)本模型的實例見表1。3.2.2用戶行為模型中相關類的屬性設計“用戶基本信息”類包含的屬性分別為“用戶ID”“用戶姓名”“單位”和“教育水平”,屬性數(shù)據(jù)用來描述用戶基本特征,在用戶使用圖書館服務系統(tǒng)平臺時,通過注冊個人資料時獲取;“圖書信息”類對應的屬性為“書目名稱”“作者”“出版社”和“ISBN書號”,“知識信息”類對應的屬性為“知識ID”“知識標題”和“知識創(chuàng)建者”,其屬性數(shù)據(jù)來自于各自領域的本體數(shù)據(jù)庫。經過細致調研,參照大英圖書館為BNB所設計的關聯(lián)數(shù)據(jù)本體模型[21],并選擇萬維網(wǎng)聯(lián)盟W3C組織推薦的知名本體庫(如<http://p
略?次檢索2次;評論6次;下載1次檢索5次;收藏1次;評論3次知識標題“大數(shù)據(jù)定義、特征、應用與發(fā)展趨勢”文檔“數(shù)據(jù)挖掘十大經典算法理論及應用”文檔“云計算背景、概念、特點、應用及服務形式”文檔“關聯(lián)數(shù)據(jù)概念、技術規(guī)范和實現(xiàn)工具”文檔本體術語“大數(shù)據(jù)”“數(shù)據(jù)挖掘”“云計算”“關聯(lián)數(shù)據(jù)”部分)確定關聯(lián)關系和對應的屬性類別,以方便數(shù)據(jù)交互和知識共享。3.3基于用戶行為模型的個性化服務方案個性化服務方案由用戶行為本體數(shù)據(jù)庫構建、用戶興趣和需求本體挖掘和基于本體的個性化服務3部分組成。如圖3所示:圖3基于用戶行為模型的個性化服務方案3.3.1用戶行為本體數(shù)據(jù)庫構建過程按照圖2所示的用戶行為本體模型架構,生成對應的數(shù)據(jù)庫字段,密切結合圖書館書目(或知識領域)本體概念庫,從原始的用戶服務日志和用戶基本信息的數(shù)據(jù)庫中解析出對應字段的數(shù)據(jù),組合構建成為用戶行為本體數(shù)據(jù)庫,該數(shù)據(jù)庫需要依據(jù)日志變化以更新本體模型中的術語:即通過對用戶原始的日志信息分析和挖掘,提取概念或主題,并按照本體技術進行規(guī)范后,加入到本體庫中。3.3.2用戶顯性興趣和隱性需求本體提取過程依據(jù)對每個用戶行為日志庫的分析統(tǒng)計,提取用戶顯性興趣本體術語以準確反映用戶的偏好;另外通過對該庫的全體用戶日志的數(shù)據(jù)挖掘,提取隱性需求本體,注意這種基于數(shù)據(jù)挖掘算法“發(fā)現(xiàn)”的本體術語,是系統(tǒng)對用戶行為日志庫中所有用戶的歷史行為“學習”和“挖掘”后,找出的與用戶顯性興趣本體術語“密切相關”的術語,能夠滿足用戶擴展和隱性的需求。3.3.3個性化推薦過程當用戶登錄服務平臺時,根據(jù)用戶的興趣本體,查詢相關數(shù)據(jù)庫(如書目、論文、專利和知識庫等),將結果推送給用戶,實現(xiàn)用戶顯性興趣的個性化推?
【參考文獻】:
期刊論文
[1]國內基于本體的個性化服務研究綜述[J]. 曹霞. 圖書館工作與研究. 2016(08)
[2]基于大數(shù)據(jù)挖掘與決策分析體系的高校圖書館個性化服務研究[J]. 李艷,呂鵬,李瓏. 圖書情報知識. 2016(02)
[3]大數(shù)據(jù)時代數(shù)字圖書館面臨的機遇和挑戰(zhàn)[J]. 蘇新寧. 中國圖書館學報. 2015(06)
[4]移動數(shù)字圖書館用戶行為模型構建研究[J]. 劉錦宏,余思慧,徐麗芳. 大學圖書館學報. 2015(05)
[5]面向科研跟蹤推送的個性化知識服務模型[J]. 陳祖琴,劉喜文,鄭昌興. 圖書館學研究. 2015(01)
[6]基于知識聚合的數(shù)字圖書館信息智能檢索模型[J]. 王敬東. 圖書館學研究. 2014(21)
[7]用戶信息行為與個性化知識服務關聯(lián)性分析[J]. 李冬冬,宋拓,畢思達. 情報科學. 2014(08)
[8]云制造環(huán)境下基于用戶行為感知的個性化知識服務技術[J]. 李穎新,敬石開,李向前,占紅飛,周競濤,楊海成,張宏,牟向峰. 計算機集成制造系統(tǒng). 2015(03)
[9]數(shù)字圖書館個性化服務資源推薦模式分析[J]. 熊擁軍. 圖書館. 2014(02)
[10]面向關聯(lián)數(shù)據(jù)的語義數(shù)字圖書館資源描述與組織框架設計與實現(xiàn)[J]. 歐石燕. 中國圖書館學報. 2012(06)
博士論文
[1]基于關聯(lián)數(shù)據(jù)和用戶本體的個性化知識服務關鍵技術研究[D]. 陳毅波.武漢大學 2012
本文編號:3333668
本文鏈接:http://sikaile.net/tushudanganlunwen/3333668.html