基于數(shù)據(jù)挖掘技術的復合圖書館流程優(yōu)化研究
發(fā)布時間:2020-09-18 09:01
早在3000多年前,圖書館已開始產生,數(shù)千年以來,圖書館的工作主要圍繞竹簡、紙質文獻等進行人工服務,效率比較低下。而近30年來,以PC和Internet為特征的信息技術快速發(fā)展,為新興的數(shù)字圖書館提供強大的技術支持。從上世紀90年代初美國的DL1開始,數(shù)字圖書館的發(fā)展非常迅速,從最初的圖書資源數(shù)字化,到Google雄心勃勃的虛擬圖書館計劃,短短十幾年時間,對圖書館這個有數(shù)千年歷史傳統(tǒng)的產物產生極大的沖擊。各個國家和地區(qū)投入巨資研發(fā)和建設數(shù)字圖書館,并把它上升到國家信息基礎設施的地位。我國從1996年開始啟動數(shù)字圖書館項目,一系列項目如中國實驗型數(shù)字式圖書館(CPDLP)項目、中國數(shù)字圖書館工程(CDLP)、國家科技圖書文獻中心(NSTL)、中國高等教育文獻保障系統(tǒng)(CALIS)等數(shù)字圖書館示范項目的實施,有力推動了數(shù)字圖書館在中國的發(fā)展。1996年,英國學者蘇頓(S.Sutton)最早提出了復合圖書館這一概念,將來很長一段時間的圖書館形態(tài)既不是純數(shù)字圖書館,也非純傳統(tǒng)圖書館,而是二者相互滲透的一種新型圖書館——復合圖書館。復合圖書館要同時承擔傳統(tǒng)圖書館和數(shù)字圖書館的社會職能。數(shù)字圖書館的實施,產生了海量的數(shù)據(jù)資料,幾乎與數(shù)字圖書館概念同時出現(xiàn)的數(shù)據(jù)挖掘技術,為我們分析海量的數(shù)據(jù)資料提供了手段。國內外也有大量學者對采用不同技術手段對相關的數(shù)據(jù)做了分析和應用,但缺少針對具體高校復合圖書館進行全面的分析和探討,而本文要解決的問題正是"如何利用數(shù)據(jù)挖掘的技術手段,通過對實際運行數(shù)據(jù)的分析,揭示復合圖書館運行內在的一些規(guī)律,優(yōu)化復合圖書館運行流程"。本文抓住資源的采購模型,編目自動化和基于用戶興趣的個性化服務等復合圖書館運行過程中的關鍵環(huán)節(jié)進行討論。(1)本文首先結合實際工作,根據(jù)復合圖書館的建設理念,通過對南京財經大學圖書館實際運行過程中的現(xiàn)狀進行分析,提出了基于數(shù)據(jù)挖掘技術的復合圖書館模型,并對復合圖書館模型中的業(yè)務流程優(yōu)化進行了分析,指出通過業(yè)務流程的優(yōu)化,可以優(yōu)化資源建設的力度,改善運行的環(huán)境,減少管理成本,提升圖書館的服務功能。(2)為了服務于圖書采購,本文通過對圖書館讀者借閱數(shù)據(jù)進行數(shù)據(jù)挖掘,揭示圖書館紙本圖書使用情況,建立優(yōu)化的圖書采購模型,在不降低讀者需求的情況下縮減復本,減少紙本圖書采購經費比例,節(jié)約經費向數(shù)字資源建設傾斜。對圖書二級館藏的可行性進行驗證,確立二級圖書館藏架構,減少館藏環(huán)節(jié),節(jié)約管理成本。(3)本文針對圖書編目的現(xiàn)狀,把信息自動化技術引入到圖書編目工作中。嘗試使用機器學習的方法對圖書進行自動分類,克服基于知識工程的圖書自動分類和數(shù)據(jù)挖掘的分類進行圖書分類的問題,并驗證了機器學習的方法在圖書自動分類中的準確性和合理性。本文還對基于條件隨機場的書目自動標引進行研究并進行實驗分析,得出條件隨機場(CRF)的書目自動標引可以只選用書名字段進行標引的結論。同時,為了分析學生讀者的借閱行為,本文還針對讀者十年來的借閱數(shù)據(jù),挖掘和發(fā)現(xiàn)讀者的讀書興趣,包括讀者的個人興趣和興趣群體,讀者課程成績與借閱習慣之間的關系,這將有助于針對性的構筑個性化服務體系,提高圖書館的服務能力?v觀全文,主要有以下創(chuàng)新點:(1)通過聚類分析和統(tǒng)計分析清晰的發(fā)現(xiàn)圖書的使用狀態(tài),優(yōu)化圖書采購模型,并實際應用到工作中:圖書館的核心用戶群體的發(fā)現(xiàn),讀者專業(yè)與借閱習慣關系、課程成績與借閱習慣的關系等信息的挖掘有助于提高圖書館服務的指向性,基于用戶興趣的個性化服務比傳統(tǒng)的個性化服務具有更強的針對性。(2)通過流程的優(yōu)化,可以改善資源建設,編目,流通等業(yè)務環(huán)節(jié),減少差錯,提升服務,提出基于用戶需求的復本補充模型;(3)機器學習方法應用于圖書自動分類的研究是有效的,基于條件隨機場的書目自動標引可以簡化。
【學位單位】:南京大學
【學位級別】:博士
【學位年份】:2011
【中圖分類】:G250.7
【部分圖文】:
國內一個示范性數(shù)字圖書館建設架構。它圖書館及互聯(lián)網上各類數(shù)字資源或非數(shù)字資源逡逑的加王處理為中必,W為讀者提供方便、快捷的知識服務機制為最終目的。圍繞資源加工、逡逑資源管理和面向用戶的應用服務等=個層面構建了數(shù)字圖書館技術架構W。如圖2-2所示。逡逑應;邐II邐II邐II邐II邐II邐II邐II邐二□逡逑用:個性化服務數(shù)字參考咨詢身巧從證信息推送OPAC邋文獻傳逸館際互惶VOD點捏光盤vB像逡逑服:邐II邐II邐II邐"邐"邐IL邐n邐邐逡逑t邋:邐圖書館邋n戶系統(tǒng)邋OAI-PMH、Z39.加、Z39名8、P3P、METS、1501016扣1逡逑層:邐1^=^邐逡逑邐邐邐邐I邐邐邐邐邐邐邐邐邐邐邐邐—邐—邐■邐-逡逑桯':數(shù)字版權管理數(shù)字資源發(fā)巧元數(shù)據(jù)管理異構巧源整舍I數(shù)字巧塞管理網級語添整魯與發(fā)布逡逑墨邋I邋I邐ex字烱源管理系繩OAIS、239.84、iSO邋10646逡逑層邋I逡逑邐^邐邐—邐邐^邐I邐一-邐*■逡逑v幔保鼻勺腫試椿ぃ保蔽南資只⒆試床杉稍殺暌味韻笫煞庾扒上蟾袷階誨義蟦
本文編號:2821445
【學位單位】:南京大學
【學位級別】:博士
【學位年份】:2011
【中圖分類】:G250.7
【部分圖文】:
國內一個示范性數(shù)字圖書館建設架構。它圖書館及互聯(lián)網上各類數(shù)字資源或非數(shù)字資源逡逑的加王處理為中必,W為讀者提供方便、快捷的知識服務機制為最終目的。圍繞資源加工、逡逑資源管理和面向用戶的應用服務等=個層面構建了數(shù)字圖書館技術架構W。如圖2-2所示。逡逑應;邐II邐II邐II邐II邐II邐II邐II邐二□逡逑用:個性化服務數(shù)字參考咨詢身巧從證信息推送OPAC邋文獻傳逸館際互惶VOD點捏光盤vB像逡逑服:邐II邐II邐II邐"邐"邐IL邐n邐邐逡逑t邋:邐圖書館邋n戶系統(tǒng)邋OAI-PMH、Z39.加、Z39名8、P3P、METS、1501016扣1逡逑層:邐1^=^邐逡逑邐邐邐邐I邐邐邐邐邐邐邐邐邐邐邐邐—邐—邐■邐-逡逑桯':數(shù)字版權管理數(shù)字資源發(fā)巧元數(shù)據(jù)管理異構巧源整舍I數(shù)字巧塞管理網級語添整魯與發(fā)布逡逑墨邋I邋I邐ex字烱源管理系繩OAIS、239.84、iSO邋10646逡逑層邋I逡逑邐^邐邐—邐邐^邐I邐一-邐*■逡逑v幔保鼻勺腫試椿ぃ保蔽南資只⒆試床杉稍殺暌味韻笫煞庾扒上蟾袷階誨義蟦
本文編號:2821445
本文鏈接:http://sikaile.net/tushudanganlunwen/2821445.html
教材專著