因果關(guān)系知識(shí)庫(kù)的研究與構(gòu)建
本文關(guān)鍵詞:因果關(guān)系知識(shí)庫(kù)的研究與構(gòu)建,,由筆耕文化傳播整理發(fā)布。
【摘要】:互聯(lián)網(wǎng)技術(shù)突飛猛進(jìn)的發(fā)展,不斷地推動(dòng)著人類思維方式的變革;數(shù)據(jù)的爆炸式增長(zhǎng),不斷地改變著二進(jìn)制世界的格局。現(xiàn)今數(shù)據(jù)信息的如此高速膨脹,已使我們進(jìn)入了大數(shù)據(jù)時(shí)代,數(shù)據(jù)信息已成為各行各業(yè)掌握行業(yè)命脈的要點(diǎn),因此由數(shù)據(jù)驅(qū)動(dòng)的信息技術(shù)革命正以前所未有的方式顛覆著人類的生活。數(shù)據(jù)和信息之間是相互聯(lián)系的,數(shù)據(jù)經(jīng)過(guò)挖掘、加工處理之后,就能成為人們所需要的信息。大數(shù)據(jù)時(shí)代,數(shù)據(jù)中蘊(yùn)藏著巨大的價(jià)值,從海量數(shù)據(jù)中提取有用信息,識(shí)別其中蘊(yùn)藏的模式、規(guī)律和相關(guān)關(guān)系,是人類認(rèn)識(shí)世界的新方式。社會(huì)化媒體上人們?nèi)粘P袨楹颓楦械年愂鲋刑N(yùn)藏著大量的生活經(jīng)驗(yàn)總結(jié),其中包括大量的常識(shí)性因果關(guān)系。大數(shù)據(jù)背景下,根據(jù)已有經(jīng)驗(yàn)知識(shí)從文本數(shù)據(jù)中識(shí)別事物間的因果聯(lián)系,歸納出事物間固有的因果關(guān)系,構(gòu)建成因果關(guān)系知識(shí)庫(kù)(因果關(guān)系網(wǎng))。將人們生活中依靠常識(shí)性思維判斷的知識(shí)被計(jì)算機(jī)系統(tǒng)的預(yù)測(cè)功能所取代,甚至推理出由人類思維所無(wú)法達(dá)到的深層因果關(guān)系,使人們進(jìn)一步明確事物間的引起與被引起作用,有利把控事物間的不利影響。本文提出了句內(nèi)因果關(guān)系的提取方法,在漢語(yǔ)言文學(xué)知識(shí)的基礎(chǔ)上,利用因果關(guān)系提示詞識(shí)別含有顯示因果關(guān)系的因果句;根據(jù)漢語(yǔ)語(yǔ)法結(jié)構(gòu)和句法依存關(guān)系歸納出相應(yīng)的句法模式匹配規(guī)則,進(jìn)行因果關(guān)系實(shí)體對(duì)的識(shí)別;同時(shí)根據(jù)句內(nèi)包含的程度副詞、情感詞、否定詞和句法模式規(guī)則確定實(shí)體間的因果強(qiáng)度;根據(jù)詞語(yǔ)語(yǔ)義相似性,對(duì)因果關(guān)系實(shí)體對(duì)進(jìn)行語(yǔ)義相似性融合,形成因果關(guān)系實(shí)體集合對(duì);同時(shí)計(jì)算因果實(shí)體對(duì)的共現(xiàn)頻率得到因果關(guān)系支持度;形成事物間因果關(guān)系的知識(shí)庫(kù)。針對(duì)文本中因果關(guān)系的提取,本論文提出如下創(chuàng)新:(1)提取句中的情感詞、級(jí)性詞、否定詞,分析何種程度的原因部分對(duì)結(jié)果部分造成多大的影響,即計(jì)算因果關(guān)系強(qiáng)度;(2)通過(guò)計(jì)算因果關(guān)系實(shí)體對(duì)在數(shù)據(jù)源中的共現(xiàn)頻率,計(jì)算因果關(guān)系支持度;(3)將因果關(guān)系實(shí)體對(duì)基于語(yǔ)義相似性進(jìn)行聚類操作,將因果關(guān)系數(shù)據(jù)轉(zhuǎn)化為因果知識(shí)。
【關(guān)鍵詞】:因果關(guān)系 因果強(qiáng)度 數(shù)據(jù)挖掘 樸素貝葉斯 知識(shí)庫(kù)
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.1
【目錄】:
- 摘要4-6
- Abstract6-11
- 第1章 緒論11-16
- 1.1 研究背景與意義11-12
- 1.2 相關(guān)研究現(xiàn)狀12-13
- 1.3 主要研究?jī)?nèi)容13-14
- 1.4 論文結(jié)構(gòu)14-15
- 1.5 本章小結(jié)15-16
- 第2章 相關(guān)技術(shù)概述16-25
- 2.1 關(guān)聯(lián)和相關(guān)性分析16-18
- 2.1.1 關(guān)聯(lián)規(guī)則16-17
- 2.1.2 挖掘頻繁項(xiàng)集17
- 2.1.3 關(guān)聯(lián)規(guī)則模式評(píng)估方法17-18
- 2.2 詞語(yǔ)相似度18-24
- 2.2.1 基于語(yǔ)義的詞語(yǔ)相似性計(jì)算19-21
- 2.2.2 基于統(tǒng)計(jì)的詞語(yǔ)相似性計(jì)算21-24
- 2.3 本章小結(jié)24-25
- 第3章 因果關(guān)系識(shí)別25-36
- 3.1 顯式因果關(guān)系25-28
- 3.1.1 因果關(guān)系表示形式25-26
- 3.1.2 漢語(yǔ)中的因果關(guān)系詞26-27
- 3.1.3 因果關(guān)系表達(dá)結(jié)構(gòu)分析27-28
- 3.2 文本中因果關(guān)系模式歸納28-34
- 3.2.1 連詞對(duì)應(yīng)的句法模式28-30
- 3.2.2 動(dòng)詞對(duì)應(yīng)的句法模式30-32
- 3.2.3 介詞對(duì)應(yīng)的句法模式32
- 3.2.4 副詞對(duì)應(yīng)的句法模式32-33
- 3.2.5 明確因果與模糊因果分類33-34
- 3.3 隱式因果關(guān)系34-35
- 3.4 本章小結(jié)35-36
- 第4章 因果關(guān)系知識(shí)庫(kù)的構(gòu)建36-50
- 4.1 因果關(guān)系分類36-37
- 4.2 顯式因果關(guān)系抽取37-46
- 4.2.1 因果關(guān)系抽取框架37
- 4.2.2 文本數(shù)據(jù)預(yù)處理37-40
- 4.2.3 因果關(guān)系實(shí)體對(duì)抽取40-44
- 4.2.4 因果關(guān)系支持度研究44-46
- 4.3 因果關(guān)系知識(shí)庫(kù)構(gòu)建46-49
- 4.4 本章小結(jié)49-50
- 第5章 實(shí)驗(yàn)與總結(jié)50-55
- 5.1 實(shí)驗(yàn)50-53
- 5.1.1 實(shí)驗(yàn)背景50-51
- 5.1.2 因果句法模式實(shí)驗(yàn)分析51
- 5.1.3 因果關(guān)系提取實(shí)驗(yàn)分析51-52
- 5.1.4 因果關(guān)系知識(shí)庫(kù)分析52-53
- 5.2 總結(jié)與展望53-55
- 5.2.1 深層因果關(guān)系的識(shí)別53
- 5.2.2 模糊因果關(guān)系的判定及隱式因果關(guān)系的識(shí)別53
- 5.2.3 因果關(guān)系實(shí)體對(duì)的識(shí)別53-54
- 5.2.4 因果關(guān)系評(píng)價(jià)策略54-55
- 參考文獻(xiàn)55-57
- 致謝57
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 趙森棟;劉挺;;因果關(guān)系及其在社會(huì)媒體上的應(yīng)用研究綜述[J];軟件學(xué)報(bào);2014年12期
2 詹志建;梁麗娜;楊小平;;基于百度百科的詞語(yǔ)相似度計(jì)算[J];計(jì)算機(jī)科學(xué);2013年06期
3 田久樂(lè);趙蔚;;基于同義詞詞林的詞語(yǔ)相似度計(jì)算方法[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2010年06期
4 崔陽(yáng);楊炳儒;;知識(shí)發(fā)現(xiàn)中的因果關(guān)聯(lián)規(guī)則挖掘研究[J];計(jì)算機(jī)工程與應(yīng)用;2009年31期
5 儲(chǔ)澤祥;陶伏平;;漢語(yǔ)因果復(fù)句的關(guān)聯(lián)標(biāo)記模式與“聯(lián)系項(xiàng)居中原則”[J];中國(guó)語(yǔ)文;2008年05期
6 許文勝;張柏然;;基于英漢名著語(yǔ)料庫(kù)的因果關(guān)系連詞對(duì)比研究[J];外語(yǔ)教學(xué)與研究;2006年04期
7 彭湃;現(xiàn)代漢語(yǔ)因果關(guān)系連接成分研究綜述[J];漢語(yǔ)學(xué)習(xí);2004年02期
8 王鏘,石純一;一種因果推理形式[J];軟件學(xué)報(bào);1997年04期
9 張學(xué)成;論復(fù)句語(yǔ)義的三種關(guān)系[J];杭州師范學(xué)院學(xué)報(bào);1992年04期
10 王維賢;;句法分析的三個(gè)平面與深層結(jié)構(gòu)[J];語(yǔ)文研究;1991年04期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 裘江南;漢語(yǔ)文本中突發(fā)事件因果關(guān)系抽取方法研究[D];大連理工大學(xué);2012年
本文關(guān)鍵詞:因果關(guān)系知識(shí)庫(kù)的研究與構(gòu)建,由筆耕文化傳播整理發(fā)布。
本文編號(hào):298545
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/298545.html