面向Web的領域知識演化關(guān)系抽取研究
發(fā)布時間:2017-06-14 21:04
本文關(guān)鍵詞:面向Web的領域知識演化關(guān)系抽取研究,由筆耕文化傳播整理發(fā)布。
【摘要】:互聯(lián)網(wǎng)的迅猛發(fā)展,帶來了大量非結(jié)構(gòu)化、異構(gòu)化的數(shù)據(jù),互聯(lián)網(wǎng)環(huán)境下相同領域中不同的知識概念間存在著多種關(guān)系,但是這些無序化的知識概念數(shù)據(jù)相互雜糅在一起,給學習者快速而又全面的了解與學習領域知識帶來了困難,同時也給構(gòu)造互聯(lián)網(wǎng)領域知識的應用帶來了挑戰(zhàn)。目前關(guān)于領域知識的研究大多集中于上下位關(guān)系、等同關(guān)系等關(guān)系的研究。然而領域知識間的演化關(guān)系對于學習者學習和理解領域知識,梳理領域知識的前序和后續(xù)邏輯關(guān)系具有重要意義。就目前的研究所閱讀的文獻而言,暫未發(fā)現(xiàn)針對這一方面的研究。因此,針對領域知識的演化關(guān)系抽取具有重要的研究意義與實用價值。本文對Web環(huán)境下的領域知識演化關(guān)系抽取開展了以下工作:第一,針對Web數(shù)據(jù)的特殊性,利用詞頻統(tǒng)計與人工挑選的方法構(gòu)建特征詞詞典,為Web數(shù)據(jù)進行文本分類提供前提;第二,在構(gòu)建特征詞詞典的基礎上,提出一種基于特征詞的Web領域知識文本分類方法。實驗表明該方法具有良好的準確率與召回率,能有效的從Web數(shù)據(jù)中分類出含有領域知識的數(shù)據(jù),為面向Web的領域知識演化關(guān)系抽取研究奠定基礎;第三,提出演化關(guān)系的定義,根據(jù)定義建立了領域知識演化關(guān)系推理模型,為不同結(jié)構(gòu)、不同語義的領域知識關(guān)系表達建立準確的句法分析機制,利用知識概念之間的語義角色關(guān)系設計領域知識演化關(guān)系模式;第四,在定義與推理模型的研究基礎上,提出了基于條件隨機場(Conditional Random Fields,CRF)模型的領域知識演化關(guān)系抽取方法,對于不同的演化關(guān)系模式,建立了統(tǒng)一的演化關(guān)系抽取理論模型。實驗表明,該方法較同類關(guān)系抽取模型具有更好的實驗性能,能有效地發(fā)現(xiàn)領域知識之間的演化關(guān)系;最后,在前面的研究基礎上,將演化關(guān)系抽取的結(jié)果應用在“機器學習”領域,設計并繪制了一個“機器學習”領域知識圖譜,該圖譜能夠有效挖掘領域?qū)W科下知識集合的演化體系,識別重難點知識,清晰明了的展示“機器學習”領域中具有演化關(guān)系的領域知識,給學習者學習與了解“機器學習”領域提供支撐,對學科建設以及相關(guān)課程教學可能具有一定的參考價值。
【關(guān)鍵詞】:領域知識 文本分類 演化關(guān)系 關(guān)系抽取 條件隨機場
【學位授予單位】:西南科技大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:G434
【目錄】:
- 摘要4-5
- Abstract5-9
- 1 緒論9-14
- 1.1 研究背景9-10
- 1.2 研究目標與意義10-11
- 1.3 研究內(nèi)容11-12
- 1.4 論文的章節(jié)安排12-14
- 2 國內(nèi)外研究現(xiàn)狀14-24
- 2.1 文本分類研究現(xiàn)狀14-19
- 2.1.1 文本分類國外研究現(xiàn)狀14-15
- 2.1.2 文本分類國內(nèi)研究現(xiàn)狀15-16
- 2.1.3 本研究中文本分類使用算法16-19
- 2.2 關(guān)系抽取研究現(xiàn)狀19-23
- 2.2.1 關(guān)系抽取國外研究現(xiàn)狀19-20
- 2.2.2 關(guān)系抽取國內(nèi)研究現(xiàn)狀20-21
- 2.2.3 本研究中關(guān)系抽取使用算法21-23
- 2.3 本章小結(jié)23-24
- 3 基于特征詞的WEB領域知識分類研究24-32
- 3.1 引言24
- 3.2 相關(guān)工作24-25
- 3.3 領域知識文本分類研究25-28
- 3.3.1 特征詞詞典構(gòu)建25-26
- 3.3.2 特征詞權(quán)重計算26
- 3.3.3 領域知識文本分類方法26-28
- 3.4 實驗28-31
- 3.4.1 實驗設置及評估標準28-29
- 3.4.2 實驗結(jié)果29-31
- 3.5 本章小結(jié)31-32
- 4 面向WEB的領域知識演化關(guān)系抽取32-46
- 4.1 引言32
- 4.2 相關(guān)工作32-34
- 4.3 演化關(guān)系推理模型34-36
- 4.3.1 演化關(guān)系模式34-35
- 4.3.2 演化關(guān)系推理35-36
- 4.4 演化關(guān)系抽取方法36-39
- 4.4.1 CRF句子層面關(guān)系抽取算法36
- 4.4.2 特征選擇36-38
- 4.4.3 標記策略38-39
- 4.5 實驗39-45
- 4.5.1 實驗設置及評估標準39
- 4.5.2 實驗結(jié)果39-45
- 4.6 本章小結(jié)45-46
- 5 領域知識演化關(guān)系抽取應用46-49
- 5.1 引言46
- 5.2 領域知識圖譜展示界面46-48
- 5.3 本章小結(jié)48-49
- 結(jié)論49-51
- 致謝51-52
- 參考文獻52-58
- 攻讀碩士學位期間發(fā)表的學術(shù)論文及研究成果58
本文關(guān)鍵詞:面向Web的領域知識演化關(guān)系抽取研究,,由筆耕文化傳播整理發(fā)布。
本文編號:450505
本文鏈接:http://sikaile.net/jiaoyulunwen/jiaoyutizhilunwen/450505.html
最近更新
教材專著