面向Web的領(lǐng)域知識(shí)演化關(guān)系抽取研究
發(fā)布時(shí)間:2017-06-14 21:04
本文關(guān)鍵詞:面向Web的領(lǐng)域知識(shí)演化關(guān)系抽取研究,由筆耕文化傳播整理發(fā)布。
【摘要】:互聯(lián)網(wǎng)的迅猛發(fā)展,帶來了大量非結(jié)構(gòu)化、異構(gòu)化的數(shù)據(jù),互聯(lián)網(wǎng)環(huán)境下相同領(lǐng)域中不同的知識(shí)概念間存在著多種關(guān)系,但是這些無序化的知識(shí)概念數(shù)據(jù)相互雜糅在一起,給學(xué)習(xí)者快速而又全面的了解與學(xué)習(xí)領(lǐng)域知識(shí)帶來了困難,同時(shí)也給構(gòu)造互聯(lián)網(wǎng)領(lǐng)域知識(shí)的應(yīng)用帶來了挑戰(zhàn)。目前關(guān)于領(lǐng)域知識(shí)的研究大多集中于上下位關(guān)系、等同關(guān)系等關(guān)系的研究。然而領(lǐng)域知識(shí)間的演化關(guān)系對于學(xué)習(xí)者學(xué)習(xí)和理解領(lǐng)域知識(shí),梳理領(lǐng)域知識(shí)的前序和后續(xù)邏輯關(guān)系具有重要意義。就目前的研究所閱讀的文獻(xiàn)而言,暫未發(fā)現(xiàn)針對這一方面的研究。因此,針對領(lǐng)域知識(shí)的演化關(guān)系抽取具有重要的研究意義與實(shí)用價(jià)值。本文對Web環(huán)境下的領(lǐng)域知識(shí)演化關(guān)系抽取開展了以下工作:第一,針對Web數(shù)據(jù)的特殊性,利用詞頻統(tǒng)計(jì)與人工挑選的方法構(gòu)建特征詞詞典,為Web數(shù)據(jù)進(jìn)行文本分類提供前提;第二,在構(gòu)建特征詞詞典的基礎(chǔ)上,提出一種基于特征詞的Web領(lǐng)域知識(shí)文本分類方法。實(shí)驗(yàn)表明該方法具有良好的準(zhǔn)確率與召回率,能有效的從Web數(shù)據(jù)中分類出含有領(lǐng)域知識(shí)的數(shù)據(jù),為面向Web的領(lǐng)域知識(shí)演化關(guān)系抽取研究奠定基礎(chǔ);第三,提出演化關(guān)系的定義,根據(jù)定義建立了領(lǐng)域知識(shí)演化關(guān)系推理模型,為不同結(jié)構(gòu)、不同語義的領(lǐng)域知識(shí)關(guān)系表達(dá)建立準(zhǔn)確的句法分析機(jī)制,利用知識(shí)概念之間的語義角色關(guān)系設(shè)計(jì)領(lǐng)域知識(shí)演化關(guān)系模式;第四,在定義與推理模型的研究基礎(chǔ)上,提出了基于條件隨機(jī)場(Conditional Random Fields,CRF)模型的領(lǐng)域知識(shí)演化關(guān)系抽取方法,對于不同的演化關(guān)系模式,建立了統(tǒng)一的演化關(guān)系抽取理論模型。實(shí)驗(yàn)表明,該方法較同類關(guān)系抽取模型具有更好的實(shí)驗(yàn)性能,能有效地發(fā)現(xiàn)領(lǐng)域知識(shí)之間的演化關(guān)系;最后,在前面的研究基礎(chǔ)上,將演化關(guān)系抽取的結(jié)果應(yīng)用在“機(jī)器學(xué)習(xí)”領(lǐng)域,設(shè)計(jì)并繪制了一個(gè)“機(jī)器學(xué)習(xí)”領(lǐng)域知識(shí)圖譜,該圖譜能夠有效挖掘領(lǐng)域?qū)W科下知識(shí)集合的演化體系,識(shí)別重難點(diǎn)知識(shí),清晰明了的展示“機(jī)器學(xué)習(xí)”領(lǐng)域中具有演化關(guān)系的領(lǐng)域知識(shí),給學(xué)習(xí)者學(xué)習(xí)與了解“機(jī)器學(xué)習(xí)”領(lǐng)域提供支撐,對學(xué)科建設(shè)以及相關(guān)課程教學(xué)可能具有一定的參考價(jià)值。
【關(guān)鍵詞】:領(lǐng)域知識(shí) 文本分類 演化關(guān)系 關(guān)系抽取 條件隨機(jī)場
【學(xué)位授予單位】:西南科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:G434
【目錄】:
- 摘要4-5
- Abstract5-9
- 1 緒論9-14
- 1.1 研究背景9-10
- 1.2 研究目標(biāo)與意義10-11
- 1.3 研究內(nèi)容11-12
- 1.4 論文的章節(jié)安排12-14
- 2 國內(nèi)外研究現(xiàn)狀14-24
- 2.1 文本分類研究現(xiàn)狀14-19
- 2.1.1 文本分類國外研究現(xiàn)狀14-15
- 2.1.2 文本分類國內(nèi)研究現(xiàn)狀15-16
- 2.1.3 本研究中文本分類使用算法16-19
- 2.2 關(guān)系抽取研究現(xiàn)狀19-23
- 2.2.1 關(guān)系抽取國外研究現(xiàn)狀19-20
- 2.2.2 關(guān)系抽取國內(nèi)研究現(xiàn)狀20-21
- 2.2.3 本研究中關(guān)系抽取使用算法21-23
- 2.3 本章小結(jié)23-24
- 3 基于特征詞的WEB領(lǐng)域知識(shí)分類研究24-32
- 3.1 引言24
- 3.2 相關(guān)工作24-25
- 3.3 領(lǐng)域知識(shí)文本分類研究25-28
- 3.3.1 特征詞詞典構(gòu)建25-26
- 3.3.2 特征詞權(quán)重計(jì)算26
- 3.3.3 領(lǐng)域知識(shí)文本分類方法26-28
- 3.4 實(shí)驗(yàn)28-31
- 3.4.1 實(shí)驗(yàn)設(shè)置及評估標(biāo)準(zhǔn)28-29
- 3.4.2 實(shí)驗(yàn)結(jié)果29-31
- 3.5 本章小結(jié)31-32
- 4 面向WEB的領(lǐng)域知識(shí)演化關(guān)系抽取32-46
- 4.1 引言32
- 4.2 相關(guān)工作32-34
- 4.3 演化關(guān)系推理模型34-36
- 4.3.1 演化關(guān)系模式34-35
- 4.3.2 演化關(guān)系推理35-36
- 4.4 演化關(guān)系抽取方法36-39
- 4.4.1 CRF句子層面關(guān)系抽取算法36
- 4.4.2 特征選擇36-38
- 4.4.3 標(biāo)記策略38-39
- 4.5 實(shí)驗(yàn)39-45
- 4.5.1 實(shí)驗(yàn)設(shè)置及評估標(biāo)準(zhǔn)39
- 4.5.2 實(shí)驗(yàn)結(jié)果39-45
- 4.6 本章小結(jié)45-46
- 5 領(lǐng)域知識(shí)演化關(guān)系抽取應(yīng)用46-49
- 5.1 引言46
- 5.2 領(lǐng)域知識(shí)圖譜展示界面46-48
- 5.3 本章小結(jié)48-49
- 結(jié)論49-51
- 致謝51-52
- 參考文獻(xiàn)52-58
- 攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文及研究成果58
本文關(guān)鍵詞:面向Web的領(lǐng)域知識(shí)演化關(guān)系抽取研究,,由筆耕文化傳播整理發(fā)布。
本文編號:450505
本文鏈接:http://sikaile.net/jiaoyulunwen/jiaoyutizhilunwen/450505.html
最近更新
教材專著