【摘要】:由于科學(xué)技術(shù)的快速發(fā)展、文獻(xiàn)出版周期的大大縮短,文獻(xiàn)成果目前呈現(xiàn)數(shù)量龐大、主題多樣的特點,在這樣情況下,如何快速獲取當(dāng)前領(lǐng)域的研究熱點、把握研究趨勢是擺在科研工作者及科研部門面前亟待解決的問題,也是數(shù)字圖書館需要解決的難題。數(shù)字圖書館作為知識經(jīng)濟(jì)實現(xiàn)的基礎(chǔ)設(shè)施,是國民經(jīng)濟(jì)運行不可缺少的必要條件;同時作為社會的公共信息存儲中心、信息中轉(zhuǎn)站,數(shù)字圖書館為社會公眾提供綜合的信息服務(wù),發(fā)揮著素質(zhì)教育、文化保護(hù)與傳播的作用。數(shù)字圖書館自上世紀(jì)90年代提出并付諸實施以來,經(jīng)歷了近20年的理論研究及其實踐發(fā)展,現(xiàn)已進(jìn)入相對成熟的階段,對其學(xué)術(shù)成果進(jìn)行主題分析,將有助于發(fā)現(xiàn)學(xué)術(shù)發(fā)展脈絡(luò)、學(xué)術(shù)熱點及學(xué)術(shù)發(fā)展趨勢,有利于學(xué)者尋找新的研究切入點,也有助于延續(xù)和提升數(shù)字圖書館生命力與活力。LDA(Latent Dirichlet Allocation)作為一種經(jīng)典有效的概率生成模型,包含文本-主題-詞項三層貝葉斯結(jié)構(gòu),能挖掘出文本中的潛在語義信息,已在文本分類、信息檢索、情感分析、話題挖掘等領(lǐng)域廣泛應(yīng)用,在科技文獻(xiàn)主題發(fā)現(xiàn)與演化研究中的作用也日益凸顯。同時,科技文獻(xiàn)中的題目、摘要、關(guān)鍵詞是一篇文獻(xiàn)的重要組成部分,通常代表了作者對文章內(nèi)容要點的濃縮和總結(jié),在進(jìn)行文獻(xiàn)主題分析時能發(fā)揮巨大作用。遺憾的是,現(xiàn)有數(shù)字圖書館相關(guān)主題研究未能重視和利用這些元素。本文利用LDA模型對2007-2016近十年的國內(nèi)數(shù)字圖書館研究論文進(jìn)行內(nèi)容挖掘,分析其主題結(jié)構(gòu),揭示熱點主題及主題演化過程,最后結(jié)合實際背景對演化結(jié)果進(jìn)行討論,以期為數(shù)字圖書館的相關(guān)研究及工作開展提供參考與支持,進(jìn)而促進(jìn)數(shù)字圖書館的健康發(fā)展。具體內(nèi)容如下:(1)總結(jié)現(xiàn)有的主題識別演化分析方法,從基本原理、研究現(xiàn)狀、優(yōu)缺點等方面對這些方法進(jìn)行詳細(xì)分析。對利用LDA進(jìn)行建模的完整過程進(jìn)行研究(其中包括:Gibbs參數(shù)估計方法、最優(yōu)主題數(shù)確定方法、基于信息熵的主題過濾技術(shù)、熱點主題選取方法、后離散主題演化方式以及主題演化度量方法等)。將其中關(guān)鍵問題進(jìn)行提煉研究,在此基礎(chǔ)上提出了一種基于主題強(qiáng)度聚類的主題趨勢的識別分析方法。(2)選取國內(nèi)數(shù)字圖書館2007-2016十年的期刊論文,引入時間因素,運用LDA對其進(jìn)行主題演化分析,識別出數(shù)字圖書館研究的主題結(jié)構(gòu)(用戶研究、建設(shè)對策、評價研究、信息服務(wù)、教育與培訓(xùn)、知識管理、資源組織、資源共享、版權(quán)研究、移動圖書館、資源存儲與安全、領(lǐng)域研究述評、應(yīng)用技術(shù)研究、云計算下的數(shù)字圖書館),可以作為數(shù)字圖書館研究人員以及數(shù)字圖書館管理人員、建設(shè)人員的決策實施參考方案。(3)利用上述同樣數(shù)據(jù),通過熱門主題選取方法發(fā)現(xiàn),信息服務(wù)、發(fā)展對策是研究者們穩(wěn)定且高度關(guān)注的研究主題,資源組織與建設(shè)、應(yīng)用技術(shù)、版權(quán)問題是數(shù)字圖書館領(lǐng)域的穩(wěn)定研究主題;引入時間因素,使用后離散主題演化方式進(jìn)行主題演化分析,繪制出14個主題10年來的強(qiáng)度演化趨勢曲線,利用基于強(qiáng)度聚類的主題趨勢分析方法將14個主題演化趨勢分為上升型、下降型、平穩(wěn)型、曲折型,判斷用戶研究、移動圖書館是數(shù)字圖書館的新興研究主題,其主題熱度將在未來攀升。
【學(xué)位授予單位】:南昌大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:G250.76;G353.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 宮小翠;安新穎;趙迎光;;基于UMLS的肺癌治療研究熱點分析[J];中華醫(yī)學(xué)圖書情報雜志;2017年01期
2 楊海霞;高寶俊;孫含林;;基于LDA挖掘計算機(jī)科學(xué)文獻(xiàn)的研究主題[J];現(xiàn)代圖書情報技術(shù);2016年11期
3 王曰芬;傅柱;陳必坤;;采用LDA主題模型的國內(nèi)知識流研究結(jié)構(gòu)探討:以學(xué)科分類主題抽取為視角[J];現(xiàn)代圖書情報技術(shù);2016年04期
4 關(guān)鵬;王曰芬;傅柱;;不同語料下基于LDA主題模型的科學(xué)文獻(xiàn)主題抽取效果分析[J];圖書情報工作;2016年02期
5 楊如意;劉東蘇;李慧;;一種融合外部特征的改進(jìn)主題模型[J];現(xiàn)代圖書情報技術(shù);2016年01期
6 秦琴琴;乜勇;;基于詞頻分析和可視化共詞網(wǎng)絡(luò)圖的國內(nèi)創(chuàng)客研究熱點分析[J];現(xiàn)代教育技術(shù);2016年01期
7 秦曉慧;樂小虬;;基于LDA主題關(guān)聯(lián)過濾的領(lǐng)域主題演化研究[J];現(xiàn)代圖書情報技術(shù);2015年03期
8 王平;;基于層次概率主題模型的科技文獻(xiàn)主題發(fā)現(xiàn)及演化[J];圖書情報工作;2014年22期
9 袁勝;;基于LDA模型的科技文獻(xiàn)話題演化分析[J];計算機(jī)光盤軟件與應(yīng)用;2014年21期
10 曾利;李自力;譚躍進(jìn);;基于動態(tài)LDA的科研文獻(xiàn)主題演化分析[J];軟件;2014年05期
相關(guān)碩士學(xué)位論文 前3條
1 馬秀敏;中國典型管理期刊文獻(xiàn)主題發(fā)現(xiàn)與演化分析[D];大連理工大學(xué);2011年
2 崔凱;基于LDA的主題演化研究與實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2010年
3 宋丹;基于語義和鏈接的話題跟蹤方法[D];大連理工大學(xué);2007年
,
本文編號:
2577389
本文鏈接:http://sikaile.net/tushudanganlunwen/2577389.html