面向?qū)n}情報(bào)服務(wù)的領(lǐng)域知識(shí)庫(kù)構(gòu)建平臺(tái)研究
本文關(guān)鍵詞:面向?qū)n}情報(bào)服務(wù)的領(lǐng)域知識(shí)庫(kù)構(gòu)建平臺(tái)研究,由筆耕文化傳播整理發(fā)布。
【摘要】:本文針對(duì)互聯(lián)網(wǎng)環(huán)境下文獻(xiàn)資源數(shù)據(jù)量巨大、更新變化迅速,完全依靠傳統(tǒng)的文獻(xiàn)加工、處理方式無(wú)法滿足新環(huán)境需求的問(wèn)題,提出了面向圖書情報(bào)機(jī)構(gòu)專題情報(bào)服務(wù)的領(lǐng)域知識(shí)庫(kù)構(gòu)建平臺(tái)研究課題。圍繞該平臺(tái)的服務(wù)模式、邏輯架構(gòu)、技術(shù)體系及應(yīng)用問(wèn)題等進(jìn)行了深入的探討和研究,從系統(tǒng)開(kāi)發(fā)與應(yīng)用的角度詳細(xì)分析并探討了系統(tǒng)平臺(tái)中涉及的關(guān)鍵技術(shù),在此基礎(chǔ)上設(shè)計(jì)并開(kāi)發(fā)了面向?qū)n}情報(bào)服務(wù)的領(lǐng)域知識(shí)庫(kù)構(gòu)建平臺(tái)。該平臺(tái)能夠輔助圖書情報(bào)工作者構(gòu)建領(lǐng)域知識(shí)庫(kù),從而進(jìn)一步提高科技文獻(xiàn)資源加工、處理和知識(shí)組織與利用的工作效率和服務(wù)能力。本文的主要工作和研究成果主要體現(xiàn)在以下四個(gè)方面:(1)針對(duì)專題情報(bào)服務(wù)工作中面臨的多種異構(gòu)文獻(xiàn)資源采集、組織、加工處理問(wèn)題,結(jié)合文獻(xiàn)資源的特點(diǎn)和專題情報(bào)服務(wù)的需求,實(shí)現(xiàn)了網(wǎng)頁(yè)文獻(xiàn)資源的自動(dòng)采集。在此基礎(chǔ)上,參考都柏林核心元數(shù)據(jù)模型,提出了面向?qū)n}情報(bào)服務(wù)的統(tǒng)一資源描述規(guī)范,支持對(duì)常見(jiàn)文獻(xiàn)資源的描述和存儲(chǔ),有利于對(duì)異構(gòu)資源進(jìn)行統(tǒng)一管理,為跨平臺(tái)的資源共享及進(jìn)一步加工和利用提供了便利。(2)基于現(xiàn)有算法和模型分別提出了改進(jìn)的關(guān)鍵詞提取、摘要提取和內(nèi)容分類算法;诮y(tǒng)計(jì)模型和N元語(yǔ)言模型,結(jié)合特征詞詞頻、詞長(zhǎng)、詞性、位置等信息,提出了適用于專題情報(bào)服務(wù)文獻(xiàn)資源的關(guān)鍵詞提取算法,且算法具有領(lǐng)域無(wú)關(guān)性,能夠有效地識(shí)別未登陸詞;采用基于統(tǒng)計(jì)的自動(dòng)摘要算法,結(jié)合句子的內(nèi)容和位置等信息,綜合評(píng)價(jià)候選摘要句的權(quán)重,實(shí)現(xiàn)了摘要自動(dòng)提取算法,該算法針對(duì)摘要中可能存在重復(fù)摘要句的問(wèn)題,利用摘要句之間的相似度計(jì)算過(guò)濾冗余摘要句;基于樸素貝葉斯分類算法,實(shí)現(xiàn)了文獻(xiàn)資源的自動(dòng)分類,本文在算法具體實(shí)現(xiàn)時(shí),對(duì)待分類項(xiàng)和訓(xùn)練樣本中的特征項(xiàng)賦予不同的權(quán)重,相比原樸素貝葉斯分類算法取得了更好的分類效果。(3)從文獻(xiàn)資源宏觀分析角度出發(fā),利用HDP主題模型,對(duì)數(shù)據(jù)集進(jìn)行了主題分析及外部/內(nèi)部特征統(tǒng)計(jì)分析,基于HDP主題模型,提出了面向資源檢索情境的文獻(xiàn)推薦模型,該模型能夠從語(yǔ)義分析角度將文獻(xiàn)特征相似度計(jì)算轉(zhuǎn)換為隱含文獻(xiàn)特征語(yǔ)義的主題相似度計(jì)算,提高了推薦文獻(xiàn)的準(zhǔn)確率。此外,文獻(xiàn)推薦模型中還引入了時(shí)間權(quán)重,在文獻(xiàn)檢索時(shí),能夠優(yōu)先推薦較新文獻(xiàn)或與當(dāng)前文獻(xiàn)發(fā)表時(shí)間較接近的文獻(xiàn)。(4)從實(shí)際需求出發(fā),基于.Net平臺(tái)設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)面向?qū)n}情報(bào)服務(wù)的領(lǐng)域知識(shí)庫(kù)構(gòu)建平臺(tái)。該平臺(tái)能夠?qū)崿F(xiàn)從資源采集、資源組織到資源加工、資源利用等多方面的功能,通過(guò)相關(guān)數(shù)據(jù)實(shí)驗(yàn),驗(yàn)證了本系統(tǒng)平臺(tái)的技術(shù)可行性,具有一定的實(shí)踐意義。
【關(guān)鍵詞】:專題服務(wù) 知識(shí)庫(kù) 知識(shí)庫(kù)構(gòu)建 主題分析 文獻(xiàn)推薦
【學(xué)位授予單位】:南京理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:G250.74
【目錄】:
- 摘要5-6
- Abstract6-13
- 1 緒論13-26
- 1.1 研究背景及研究意義13-14
- 1.2 相關(guān)理論及研究綜述14-20
- 1.2.1 專題情報(bào)服務(wù)14-16
- 1.2.2 知識(shí)服務(wù)16-17
- 1.2.3 數(shù)據(jù)庫(kù)與知識(shí)庫(kù)17-18
- 1.2.4 知識(shí)表示18-19
- 1.2.5 知識(shí)庫(kù)構(gòu)建19-20
- 1.3 本文的主要工作20-26
- 1.3.1 研究?jī)?nèi)容20-22
- 1.3.2 論文總體思路與章節(jié)安排22-24
- 1.3.3 論文創(chuàng)新點(diǎn)24-26
- 2 面向?qū)n}情報(bào)服務(wù)的領(lǐng)域知識(shí)庫(kù)構(gòu)建平臺(tái)框架26-34
- 2.1 系統(tǒng)目標(biāo)和服務(wù)模式26-27
- 2.1.1 系統(tǒng)目標(biāo)26-27
- 2.1.2 服務(wù)模式27
- 2.2 系統(tǒng)平臺(tái)邏輯架構(gòu)27-30
- 2.3 系統(tǒng)平臺(tái)技術(shù)體系30-33
- 2.3.1 系統(tǒng)開(kāi)發(fā)技術(shù)30-31
- 2.3.2 系統(tǒng)體系結(jié)構(gòu)31-32
- 2.3.3 系統(tǒng)功能模塊32-33
- 2.4 本章小結(jié)33-34
- 3 網(wǎng)絡(luò)資源組織與特征抽取34-54
- 3.1 網(wǎng)絡(luò)資源采集34-37
- 3.1.1 基于搜索引擎中介的網(wǎng)絡(luò)資源檢索34-36
- 3.1.2 網(wǎng)絡(luò)資源正文提取36-37
- 3.2 資源描述37-38
- 3.3 資源預(yù)處理38-39
- 3.4 關(guān)鍵詞提取39-44
- 3.4.1 關(guān)鍵詞提取算法概述39-40
- 3.4.2 基于ICTCLAS分詞和N-Gram的關(guān)鍵詞提取40-42
- 3.4.3 關(guān)鍵詞提取評(píng)價(jià)42-43
- 3.4.4 實(shí)驗(yàn)及結(jié)果分析43-44
- 3.5 自動(dòng)摘要44-48
- 3.5.1 自動(dòng)摘要算法概述44-45
- 3.5.2 基于統(tǒng)計(jì)的自動(dòng)摘要45-46
- 3.5.3 摘要句去重46-47
- 3.5.4 摘要質(zhì)量評(píng)價(jià)47
- 3.5.5 實(shí)驗(yàn)及結(jié)果分析47-48
- 3.6 內(nèi)容分類48-52
- 3.6.1 文本特征提取48-49
- 3.6.2 文本分類算法49-50
- 3.6.3 基于樸素貝葉斯的文本分類50-51
- 3.6.4 分類質(zhì)量評(píng)價(jià)51
- 3.6.5 實(shí)驗(yàn)及結(jié)果分析51-52
- 3.7 本章小結(jié)52-54
- 4 文獻(xiàn)資源主題特征分析54-69
- 4.1 主題及主題模型54-57
- 4.1.1 主題的定義54
- 4.1.2 主題表示54-55
- 4.1.3 典型主題模型概述55-57
- 4.2 基于HDP的主題分析57-64
- 4.2.1 基于HDP的主題分析步驟57-58
- 4.2.2 實(shí)驗(yàn)及結(jié)果分析58-64
- 4.3 基于主題模型的文獻(xiàn)資源推薦64-68
- 4.3.1 文獻(xiàn)資源推薦模型概述65-66
- 4.3.2 基于主題模型的文獻(xiàn)資源推薦66-67
- 4.3.3 實(shí)驗(yàn)及結(jié)果分析67-68
- 4.4 本章小結(jié)68-69
- 5 領(lǐng)域知識(shí)庫(kù)構(gòu)建平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)69-86
- 5.1 系統(tǒng)總體模塊設(shè)計(jì)69-70
- 5.2 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)70-76
- 5.2.1 系統(tǒng)開(kāi)發(fā)及運(yùn)行環(huán)境70-71
- 5.2.2 文獻(xiàn)資源組織形式71-74
- 5.2.3 數(shù)據(jù)庫(kù)表結(jié)構(gòu)設(shè)計(jì)74-76
- 5.3 系統(tǒng)功能界面76-85
- 5.3.1 文獻(xiàn)資源管理76-78
- 5.3.2 文獻(xiàn)加工處理78-80
- 5.3.3 文獻(xiàn)主題分析80-82
- 5.3.4 文獻(xiàn)檢索推薦82-84
- 5.3.5 系統(tǒng)管理84-85
- 5.4 本章小結(jié)85-86
- 6 研究總結(jié)與進(jìn)一步工作86-89
- 6.1 研究總結(jié)86-87
- 6.2 進(jìn)一步工作87-89
- 致謝89-90
- 參考文獻(xiàn)90-96
- 附錄96
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 宋白玉;趙桂云;;網(wǎng)格環(huán)境下基于本體的資源描述[J];電腦知識(shí)與技術(shù);2009年09期
2 董軍,肖少擁;知識(shí)庫(kù)系統(tǒng)的現(xiàn)狀與發(fā)展趨勢(shì)[J];計(jì)算技術(shù)與自動(dòng)化;1995年03期
3 余旭;劉繼紅;何苗;;基于領(lǐng)域本體的復(fù)雜產(chǎn)品設(shè)計(jì)知識(shí)檢索技術(shù)[J];計(jì)算機(jī)集成制造系統(tǒng);2011年02期
4 薛春香;夏祖奇;侯漢清;;基于語(yǔ)料和基于標(biāo)引經(jīng)驗(yàn)的自動(dòng)分類模式比較[J];南京農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2005年04期
5 李碧清;霍敏;薛濤;程志臻;楊懿菲;;面向重大課題的專題信息服務(wù)研究[J];科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì);2013年09期
6 張秀偉;何克清;王健;劉建曉;;Web服務(wù)個(gè)性化推薦研究綜述[J];計(jì)算機(jī)工程與科學(xué);2013年09期
7 劉端陽(yáng);王良芳;;結(jié)合語(yǔ)義擴(kuò)展度和詞匯鏈的關(guān)鍵詞提取算法[J];計(jì)算機(jī)科學(xué);2013年12期
8 丁雪;;基于數(shù)據(jù)挖掘的圖書智能推薦系統(tǒng)研究[J];情報(bào)理論與實(shí)踐;2010年05期
9 楊淇,
本文編號(hào):361138
本文鏈接:http://sikaile.net/tushudanganlunwen/361138.html