天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于圖結(jié)構(gòu)的實(shí)體關(guān)系抽取方法研究

發(fā)布時(shí)間:2024-04-12 06:19
  網(wǎng)絡(luò)的快速發(fā)展產(chǎn)生大量的非結(jié)構(gòu)化文本信息,成為巨大且不斷增長(zhǎng)的信息源,如何快速準(zhǔn)確地從這些網(wǎng)絡(luò)信息中得到人們想要的知識(shí),并將其規(guī)范為結(jié)構(gòu)化數(shù)據(jù),已受到廣泛的關(guān)注,給關(guān)系抽取研究也帶來了新的機(jī)遇和挑戰(zhàn),成為學(xué)術(shù)界的一個(gè)重要前進(jìn)方向。該方向的研究主要是結(jié)合機(jī)器學(xué)習(xí)算法與深度學(xué)習(xí)算法共同完成對(duì)實(shí)體對(duì)間的關(guān)系進(jìn)行抽取任務(wù);谀壳暗难芯楷F(xiàn)狀來看,大多數(shù)關(guān)系抽取方法存在關(guān)系分類粗糙、選取的特征較多等問題,同時(shí)抽取效果不盡理想,時(shí)間成本較高。本文在選取較少特征的基礎(chǔ)上,將關(guān)系抽取任務(wù)轉(zhuǎn)化為觸發(fā)詞提取和關(guān)系抽取兩個(gè)部分實(shí)現(xiàn),達(dá)到了良好的抽取效果。第一部分是關(guān)系觸發(fā)詞的提取。在槽填充算法的基礎(chǔ)上,提出基于圖的關(guān)系觸發(fā)詞提取方法。增加介詞過濾模塊,判斷實(shí)體對(duì)間一定距離內(nèi)的介詞是否為觸發(fā)詞,減少整體的運(yùn)行時(shí)間;利用依存句法分析器將句子實(shí)例連接成圖,利用Page Rank算法計(jì)算圖中每個(gè)節(jié)點(diǎn)相對(duì)于實(shí)體的重要性分?jǐn)?shù),通過對(duì)比實(shí)驗(yàn)選擇算法中的最優(yōu)參數(shù)值;關(guān)聯(lián)規(guī)則挖掘算法計(jì)算各節(jié)點(diǎn)與實(shí)體對(duì)間規(guī)則的置信度,用來影響綜合重要性分?jǐn)?shù);改進(jìn)槽填充方法中的綜合分?jǐn)?shù)計(jì)算,使用各節(jié)點(diǎn)相對(duì)于實(shí)體對(duì)的Page Rank重要性分?jǐn)?shù)與...

【文章頁數(shù)】:66 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
abstract
第1章 緒論
    1.1 研究背景和意義
    1.2 研究現(xiàn)狀
    1.3 研究?jī)?nèi)容
    1.4 本文組織結(jié)構(gòu)
第2章 關(guān)系抽取關(guān)鍵技術(shù)簡(jiǎn)介
    2.1 實(shí)體關(guān)系基礎(chǔ)知識(shí)
        2.1.1 實(shí)體
        2.1.2 實(shí)體關(guān)系
        2.1.3 數(shù)據(jù)集
    2.2 關(guān)系抽取算法介紹
        2.2.1 有監(jiān)督學(xué)習(xí)抽取方法
        2.2.2 半監(jiān)督學(xué)習(xí)抽取方法
        2.2.3 無監(jiān)督學(xué)習(xí)抽取方法
    2.3 算法評(píng)測(cè)標(biāo)準(zhǔn)
    2.4 本章小結(jié)
第3章 基于圖結(jié)構(gòu)的關(guān)系觸發(fā)詞提取
    3.1 觸發(fā)詞基本概念
    3.2 觸發(fā)詞提取基本方法
        3.2.1 基于詞典的觸發(fā)詞提取方法
        3.2.2 基于統(tǒng)計(jì)的觸發(fā)詞提取方法
    3.3 基于圖結(jié)構(gòu)的觸發(fā)詞提取方法
        3.3.1 依存句法分析
        3.3.2 PageRank
        3.3.3 AP聚類算法
        3.3.4 過濾模塊
        3.3.5 關(guān)聯(lián)規(guī)則挖掘
        3.3.6 綜合重要性分?jǐn)?shù)計(jì)算
        3.3.7 基于圖結(jié)構(gòu)的觸發(fā)詞提取方法
    3.4 實(shí)驗(yàn)介紹與分析
        3.4.1 實(shí)驗(yàn)數(shù)據(jù)集介紹
        3.4.2 觸發(fā)詞結(jié)果展示
        3.4.3 參數(shù)選取
    3.5 本章小結(jié)
第4章 實(shí)體關(guān)系抽取方法中分類器的選擇
    4.1 支持向量機(jī)
        4.1.1 SVM基本思想
        4.1.2 SVM多分類分類器
    4.2 前饋神經(jīng)網(wǎng)絡(luò)
        4.2.1 前饋神經(jīng)網(wǎng)絡(luò)基本概念
        4.2.2 激活函數(shù)
        4.2.3 多層前饋神經(jīng)網(wǎng)絡(luò)
    4.3 循環(huán)神經(jīng)網(wǎng)絡(luò)
        4.3.1 RNN
        4.3.2 LSTM
        4.3.3 GRU
    4.4 實(shí)驗(yàn)結(jié)果與分析
        4.4.1 實(shí)驗(yàn)一:窗口大小選擇實(shí)驗(yàn)
        4.4.2 實(shí)驗(yàn)二:關(guān)系抽取分類器對(duì)比實(shí)驗(yàn)
        4.4.3 實(shí)驗(yàn)三:不同數(shù)據(jù)集對(duì)比實(shí)驗(yàn)
        4.4.4 實(shí)驗(yàn)四:與其他算法對(duì)比實(shí)驗(yàn)
        4.4.5 實(shí)驗(yàn)五:人物知識(shí)圖譜系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
    4.5 本章小結(jié)
第5章 總結(jié)與展望
    5.1 工作總結(jié)
    5.2 未來展望
參考文獻(xiàn)
作者簡(jiǎn)介及在學(xué)期間所取得的科研成果
致謝



本文編號(hào):3951796

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3951796.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶67c9f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com