數(shù)字圖書館數(shù)字資源中事實(shí)知識(shí)元識(shí)別與標(biāo)引
發(fā)布時(shí)間:2024-04-14 16:44
數(shù)字圖書館作為一種以網(wǎng)絡(luò)技術(shù)為環(huán)境基礎(chǔ)的知識(shí)網(wǎng)絡(luò)系統(tǒng),是重要的知識(shí)來源。為了滿足用戶精細(xì)化信息需求,數(shù)字圖書館數(shù)字資源的知識(shí)管理單位進(jìn)一步細(xì)化到知識(shí)元。以事實(shí)知識(shí)元為研究對(duì)象,在對(duì)數(shù)字圖書館的數(shù)字資源管理現(xiàn)狀及知識(shí)元的研究現(xiàn)狀進(jìn)行綜述后,提出事實(shí)知識(shí)元的定義,針對(duì)事實(shí)知識(shí)元的特點(diǎn),建立起事實(shí)知識(shí)元描述模型及抽取規(guī)則,以該抽取規(guī)則為基礎(chǔ),對(duì)事實(shí)知識(shí)元的抽取流程進(jìn)行梳理,提出事實(shí)知識(shí)元描述框架。
【文章頁數(shù)】:5 頁
【部分圖文】:
本文編號(hào):3954984
【文章頁數(shù)】:5 頁
【部分圖文】:
圖1事實(shí)知識(shí)元描述規(guī)則構(gòu)建流程
依據(jù)CSSCI核心期刊排名情況,選取若干情報(bào)學(xué)核心期刊,并從萬方、維普、中國知網(wǎng)等數(shù)據(jù)庫下載題錄信息,對(duì)題錄信息進(jìn)行整合去重等處理后,整理出一份關(guān)鍵詞表,然后從該表中獲取事實(shí)描述術(shù)語,構(gòu)建其術(shù)語表。根據(jù)該描述術(shù)語表對(duì)情報(bào)學(xué)某核心雜志某年的全文進(jìn)行識(shí)別,得出所有關(guān)于事實(shí)描述的句子,....
圖2知識(shí)元抽取流程
知識(shí)元提取第一步,對(duì)實(shí)體資源進(jìn)行預(yù)處理,即刪減資源中與主題無關(guān)的信息,減少數(shù)據(jù)量,減輕后續(xù)數(shù)據(jù)組織處理的工作量,提高整體效率。在此過程中,應(yīng)考慮實(shí)體資源存在形式,若為非文本形式,如圖像、音頻、視頻等,應(yīng)轉(zhuǎn)化為文本形式再進(jìn)行文本信息讀取及后續(xù)處理;若實(shí)體資源本身為文本形式,即可直接....
本文編號(hào):3954984
本文鏈接:http://sikaile.net/tushudanganlunwen/3954984.html
最近更新
教材專著