面向?qū)W科的主題詞庫構(gòu)建及其應(yīng)用研究
發(fā)布時間:2017-09-17 07:31
本文關(guān)鍵詞:面向?qū)W科的主題詞庫構(gòu)建及其應(yīng)用研究
更多相關(guān)文章: 主題詞抽取 關(guān)系挖掘 主題詞庫 教育技術(shù)學(xué) 垂直搜索
【摘要】:主題詞庫就是經(jīng)過規(guī)范化處理了的主題詞及其之間的關(guān)系所構(gòu)成的詞典。主題詞庫包括兩個部分:詞庫和關(guān)系庫,詞庫用于存儲主題詞,關(guān)系庫則用于存儲主題詞間的各種關(guān)系。主題詞庫是信息組織與檢索的重要工具,其應(yīng)用非常廣泛:它可以解決方便、快速、科學(xué)的檢索大量文獻(xiàn)的問題;特定學(xué)科領(lǐng)域的主題詞庫可以用于構(gòu)建針對具體學(xué)科領(lǐng)域的垂直搜索引擎;主題詞庫中描述的主題詞之間的語義關(guān)系可以起到知識導(dǎo)航的作用;此外,主題詞庫也被應(yīng)用到人工智能、云計算等相關(guān)領(lǐng)域中。 目前國內(nèi)關(guān)于主題詞庫的研究也取得了一些成果,但是隨著研究工作的深入,主題詞庫構(gòu)建過程中出現(xiàn)了一些新的問題:現(xiàn)有的主題詞庫大都采用人工標(biāo)注完成,費(fèi)時費(fèi)力;而且目前面向具體學(xué)科領(lǐng)域的主題詞庫構(gòu)建的相關(guān)研究也很少;此外,現(xiàn)有主題詞庫中主題詞之間的關(guān)系都是兩兩主題詞間的直接關(guān)系,并沒有挖掘主題詞之間間接的隱性關(guān)系。因此,研究面向具體學(xué)科領(lǐng)域的主題詞庫構(gòu)建工作意義重大。 本論文的主要工作是以教育技術(shù)學(xué)為例,構(gòu)建面向特定學(xué)科領(lǐng)域的主題詞庫。論文的主要研究工作有: (1)介紹了國內(nèi)外關(guān)于主題詞庫的研究現(xiàn)狀以及與主題詞相關(guān)的理論基礎(chǔ)。 (2)改進(jìn)并實(shí)現(xiàn)了主題詞抽取的相關(guān)算法,提出了一種文檔結(jié)構(gòu)與統(tǒng)計相結(jié)合的主題詞提取方法,并通過實(shí)驗(yàn)證明此方法在準(zhǔn)確率、召回率等方面要優(yōu)于傳統(tǒng)的TFIDF方法。 (3)研究ISM算法將其運(yùn)用在主題詞隱性關(guān)系的挖掘上,實(shí)現(xiàn)了利用ISM算法挖掘主題詞間隱性關(guān)系、形成主題詞的層級關(guān)系圖。 (4)利用主題詞的抽取算法和隱性關(guān)系挖掘算法以教育技術(shù)學(xué)為例構(gòu)建面向特定學(xué)科領(lǐng)域的主題詞庫并對其做了應(yīng)用研究。 論文的特色之處在于改進(jìn)了主題詞抽取的相關(guān)算法,并且在主題詞及其簡單關(guān)系的基礎(chǔ)上實(shí)現(xiàn)了主題詞間隱性關(guān)系挖掘,形成主題詞的層級關(guān)系圖,這是以往任何主題詞庫構(gòu)建工作都沒有研究過的。最后,通過主題詞及其關(guān)系挖掘算法構(gòu)建了面向教育技術(shù)學(xué)的主題詞庫并對其做了應(yīng)用研究。
【關(guān)鍵詞】:主題詞抽取 關(guān)系挖掘 主題詞庫 教育技術(shù)學(xué) 垂直搜索
【學(xué)位授予單位】:華中師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2012
【分類號】:G40-057
【目錄】:
- 摘要5-6
- Abstract6-9
- 1 緒論9-15
- 1.1 研究背景及意義9
- 1.2 研究現(xiàn)狀9-12
- 1.2.1 國外研究現(xiàn)狀10-11
- 1.2.2 國內(nèi)研究現(xiàn)狀11-12
- 1.3 論文主要工作12-13
- 1.4 論文的組織結(jié)構(gòu)13-15
- 2 主題詞相關(guān)理論綜述15-22
- 2.1 主題詞概述15-18
- 2.1.1 相關(guān)概念的界定15-17
- 2.1.2 概念間的比較17-18
- 2.2 主題詞間關(guān)系概述18-20
- 2.3 主題詞抽取原則20-21
- 2.4 小結(jié)21-22
- 3 主題詞抽取及層級關(guān)系圖的生成22-33
- 3.1 文檔結(jié)構(gòu)與統(tǒng)計相結(jié)合的主題詞提取22-25
- 3.1.1 算法流程圖22-23
- 3.1.2 算法原理分析23-24
- 3.1.3 試驗(yàn)結(jié)果及分析24-25
- 3.2 主題詞層次關(guān)系的自動生成算法研究25-31
- 3.2.1 ISM法的三要素26-27
- 3.2.2 基于ISM的主題詞層級關(guān)系生成算法27-28
- 3.2.3 算法的關(guān)鍵步驟28-29
- 3.2.4 實(shí)驗(yàn)結(jié)果分析29-31
- 3.3 小結(jié)31-33
- 4 面向?qū)W科的主題詞庫的設(shè)計與實(shí)現(xiàn)33-48
- 4.1 主題詞庫的體系結(jié)構(gòu)設(shè)計33-35
- 4.1.1 主題詞庫系統(tǒng)設(shè)計33
- 4.1.2 主要工作流程33-35
- 4.2 主要功能模塊設(shè)計35
- 4.2.1 文檔預(yù)處理模塊35
- 4.2.2 主題詞提取模塊35
- 4.2.3 關(guān)系挖掘模塊35
- 4.3 數(shù)據(jù)結(jié)構(gòu)設(shè)計35-37
- 4.3.1 索引庫的設(shè)計35-36
- 4.3.2 主題詞庫的設(shè)計36-37
- 4.4 面向?qū)W科的主題詞庫構(gòu)建37-47
- 4.4.1 文檔預(yù)處理模塊的實(shí)現(xiàn)37-40
- 4.4.2 主題詞提取模塊的實(shí)現(xiàn)40-42
- 4.4.3 關(guān)系挖掘模塊的實(shí)現(xiàn)42-47
- 4.5 小結(jié)47-48
- 5 面向?qū)W科的主題詞庫應(yīng)用研究48-58
- 5.1 主題詞庫應(yīng)用研究48
- 5.2 垂直搜索引擎總體架構(gòu)48-50
- 5.3 基于主題詞庫的垂直搜索引擎50-57
- 5.3.1 體系結(jié)構(gòu)設(shè)計50-52
- 5.3.2 索引模塊的設(shè)計與實(shí)現(xiàn)52-55
- 5.3.3 結(jié)果分析55-57
- 5.4 小結(jié)57-58
- 6 總結(jié)與展望58-59
- 6.1 研究總結(jié)58
- 6.2 問題與展望58-59
- 參考文獻(xiàn)59-62
- 項目資助及發(fā)表論文情況62-63
- 致謝63
【引證文獻(xiàn)】
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 孫小欣;基于潛在語義分析的學(xué)科知識圖譜構(gòu)建[D];華中師范大學(xué);2013年
,本文編號:868081
本文鏈接:http://sikaile.net/jiaoyulunwen/jiaoyugaigechuangxinlunwen/868081.html
最近更新
教材專著