數(shù)字圖書館資源聚合與服務(wù)推薦研究
發(fā)布時間:2018-04-01 05:05
本文選題:數(shù)字圖書館資源 切入點:資源聚合 出處:《吉林大學(xué)》2017年博士論文
【摘要】:大數(shù)據(jù)環(huán)境下,以數(shù)字化存儲與呈現(xiàn)、網(wǎng)絡(luò)化檢索與獲取為特征的數(shù)字圖書館,成為集用戶獲取知識、傳播知識、交流等多功能為一體的知識集散中心。各種數(shù)字對象(知識作為一種對象,可以表現(xiàn)為各種文獻、事實/科研數(shù)據(jù)、數(shù)據(jù)庫、知識庫和知識體系)構(gòu)成了可充分集成關(guān)聯(lián)的數(shù)字圖書館領(lǐng)域的大數(shù)據(jù)環(huán)境,數(shù)字圖書館資源規(guī)模化增長是不可逆轉(zhuǎn)的客觀事實。隨著數(shù)字圖書館資源的迅猛增加,以及智能技術(shù)的普及,推薦服務(wù)的智能化和個性化已經(jīng)成為服務(wù)推薦發(fā)展的趨勢。然而傳統(tǒng)的個性化服務(wù)已經(jīng)無法滿足用戶需求以及數(shù)字圖書館的發(fā)展。一方面,用戶需求越來越復(fù)雜,如何準確描述和充分挖掘用戶的個性化復(fù)雜需求,根據(jù)用戶需求向其進行資源服務(wù)推薦成為難題;另一方面,數(shù)字圖書館資源數(shù)量巨大,如何有效對海量資源聚合并支持高效檢索和推薦,充分挖掘數(shù)字圖書館資源內(nèi)在的語義聯(lián)系成為關(guān)注重點。數(shù)字圖書館資源"聚合"旨在發(fā)現(xiàn)資源之間及其內(nèi)在的語義關(guān)聯(lián),通過系統(tǒng)匯聚、挖掘利用、有效整合多源異構(gòu)的數(shù)字圖書館資源,構(gòu)建一個內(nèi)容相互關(guān)聯(lián)、多維度、多層次的資源體系,形成集概念主題、學(xué)科內(nèi)容和科研對象為一體的立體化知識網(wǎng)絡(luò);服務(wù)推薦作為一種有效的智能化信息過濾技術(shù),能夠結(jié)合數(shù)字圖書館資源的內(nèi)容特征,通過對用戶的興趣偏好和資源訪問行為進行自動分析與挖掘,主動向用戶推薦滿足其需求的數(shù)字圖書館資源。可見,基于數(shù)字圖書館資源聚合實現(xiàn)服務(wù)推薦已成為滿足用戶精準化需求的重要途徑。本文以領(lǐng)域本體、數(shù)據(jù)挖掘、復(fù)雜網(wǎng)絡(luò)理論及分析方法等技術(shù)和方法為基礎(chǔ),借鑒相應(yīng)聚合及個性化推薦的成果,提出了面向用戶復(fù)雜需求的資源聚合方法與服務(wù)推薦技術(shù),為數(shù)字圖書館資源服務(wù)推薦提供相應(yīng)參考。主要研究內(nèi)容如下:(1)界定了數(shù)字圖書館資源聚合及服務(wù)推薦概念,分析了數(shù)字圖書館資源聚合同服務(wù)推薦之間的關(guān)系。數(shù)字圖書館資源聚合是服務(wù)推薦的基礎(chǔ),服務(wù)推薦是數(shù)字圖書館資源聚合的目標。服務(wù)推薦又從用戶需求方面引導(dǎo)聚合的質(zhì)量,更進一步揭示了學(xué)科領(lǐng)域的知識結(jié)構(gòu)與發(fā)展規(guī)律,從而能夠在提高數(shù)字圖書館資源聚合能力和效率基礎(chǔ)上滿足用戶個性化需求、提升服務(wù)推薦效果。(2)闡述了數(shù)字圖書館資源語義化概念,分析了數(shù)字圖書館資源語義化、語義關(guān)系以及數(shù)字圖書館資源的文本語義距離。語義概念和語義關(guān)系構(gòu)成了數(shù)字圖書館資源聚合的基礎(chǔ),將領(lǐng)域本體看做由節(jié)點(語義概念)和弧線鏈(語義關(guān)系)組成的帶有標記的有向網(wǎng)絡(luò)。基于復(fù)雜網(wǎng)絡(luò)理論對其進行分析,深度揭示概念之間的網(wǎng)絡(luò)關(guān)系,進而挖掘、建立、利用資源之間的聯(lián)系,將繁雜、無序的內(nèi)容通過聚合以呈現(xiàn)關(guān)聯(lián)性。(3)對數(shù)字圖書館資源聚合的特征、維度等問題進行系統(tǒng)研究,綜合運用復(fù)雜網(wǎng)絡(luò)理論及其指標、語義相似度計算等理論方法和工具,構(gòu)建了數(shù)字圖書館資源聚合模型?偨Y(jié)了數(shù)字圖書館資源聚合的特征:數(shù)字圖書館資源聚合對象的多元化、數(shù)字圖書館資源聚合方法的多樣化、數(shù)字圖書館資源聚合維度的立體化以及數(shù)字圖書館資源聚合過程的動態(tài)化。在此基礎(chǔ)上,提出了數(shù)字圖書館資源聚合模型。該模型框架包括數(shù)據(jù)資源層、資源語義化層、資源聚合層、應(yīng)用層四個層次,即從數(shù)字圖書館資源甄選及資源語義化(微觀)到資源的系統(tǒng)匯聚(中觀)再到資源的深度挖掘與利用(宏觀)。(4)分析了基于維基百科構(gòu)建的領(lǐng)域本體的網(wǎng)絡(luò)結(jié)構(gòu),結(jié)合復(fù)雜網(wǎng)絡(luò)指標中的度、集聚系數(shù)等指標測度提出了重要節(jié)點識別方法,以此作為聚合的基礎(chǔ)。依據(jù)D-S證據(jù)理論,在識別框架(high,low)下構(gòu)建基本概率分配函數(shù),表示節(jié)點重要性程度,通過D-S證據(jù)理論合成公式進行合并,以概率的形式對節(jié)點重要性進行量化,并得到節(jié)點重要性的評價指標。對構(gòu)建的領(lǐng)域本體進行分析,發(fā)掘網(wǎng)絡(luò)的重要節(jié)點,能夠為充分挖掘本體的語義信息、發(fā)現(xiàn)本體中的隱含知識、對特定領(lǐng)域的相關(guān)知識結(jié)構(gòu)進行分析和呈現(xiàn)、解決領(lǐng)域知識共享等問題提供方法和參考。(5)通過改進基于本體的語義相似度計算方法以及基于《同義詞詞林擴展版》的語義相似度計算方法,提出了改進的譜聚類算法。在資源聚合中應(yīng)用文本聚類分析的方法,從資源內(nèi)部以及外部特征出發(fā),利用資源聚合原理使資源呈現(xiàn)出集簇狀,進而根據(jù)資源呈現(xiàn)出的層次簇狀結(jié)構(gòu)為之選擇一種或多種合適的表示結(jié)構(gòu),從而深入地挖掘出隱含在資源之間的語義關(guān)系。(6)提出了 3種服務(wù)推薦方法:基于本體規(guī)則推理和語義相似度計算的服務(wù)推薦方法、基于關(guān)聯(lián)語義鏈的服務(wù)推薦方法、基于譜聚類的服務(wù)推薦方法。通過對數(shù)字圖書館資源有效聚合,將資源語義化并進行語義關(guān)聯(lián),在此基礎(chǔ)上,挖掘用戶需求信息,根據(jù)用戶偏好對其進行推薦。實驗結(jié)果表明:在對數(shù)字圖書館資源聚合的基礎(chǔ)上利用服務(wù)推薦方法對用戶進行推薦,可以提高推薦準確性,使得推薦結(jié)果更加符合用戶對于數(shù)字圖書館資源的偏好。利用本體、數(shù)據(jù)挖掘以及服務(wù)推薦等方法,對數(shù)字圖書館資源聚合以及服務(wù)推薦進行研究,為資源聚合與服務(wù)推薦的深入研究搭建了一個新的框架,從而為優(yōu)化其資源再組織結(jié)構(gòu)和提升知識服務(wù)能力提供有價值的參考與指導(dǎo)。(7)將知網(wǎng)文獻資源作為數(shù)據(jù)源,驗證了本文第4章和第5章所提出的聚合和推薦方法,從技術(shù)實現(xiàn)的角度采用JAVA語言和MYSQL數(shù)據(jù)庫開發(fā)設(shè)計了數(shù)字圖書館資源服務(wù)推薦應(yīng)用平臺。該系統(tǒng)采用C/S系統(tǒng)架構(gòu),集成了本文所提出的聚合方法和推薦方法,實現(xiàn)了數(shù)字圖書館資源聚合及服務(wù)推薦功能。以聚合為基礎(chǔ)為用戶進行服務(wù)推薦的方法解決了傳統(tǒng)推薦方法對用戶需求挖掘不充分、冷啟動以及數(shù)據(jù)稀疏等問題,實現(xiàn)了推薦結(jié)果與用戶個性化需求的高度匹配,并提高了推薦精度,進一步擴展了數(shù)字圖書館未來開展知識服務(wù)的新視野。
[Abstract]:Digital library resource aggregation is a kind of effective intelligent information filtering technology . Based on the D - S evidence theory , the paper constructs the basic probability distribution function based on the theory of complex network , the diversity of resource aggregation of digital library , the three - dimensional structure of resource aggregation dimension of digital library and the dynamic of the process of digital library resource aggregation . ( 5 ) By improving the ontology - based semantic similarity calculation method and the semantic similarity calculation method based on the semantic similarity degree of the synonym , the paper proposes a new method for recommending the resources of the digital library based on the principle of resource aggregation .
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2017
【分類號】:G250.76
,
本文編號:1694082
本文鏈接:http://sikaile.net/tushudanganlunwen/1694082.html
最近更新
教材專著