天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類博士論文 >

基于詞向量的開放關(guān)系抽取與分類技術(shù)研究

發(fā)布時(shí)間:2022-12-07 22:38
  關(guān)系抽取是一類重要的信息抽。↖nformation Extraction,IE)任務(wù),旨在從無結(jié)構(gòu)或半結(jié)構(gòu)的自然語言文本中抽取實(shí)體間的關(guān)系信息。傳統(tǒng)的關(guān)系抽取大部分是抽取預(yù)定義的關(guān)系,為抽取新的關(guān)系,需要編寫新的關(guān)系抽取規(guī)則或標(biāo)注新的數(shù)據(jù)集。而大規(guī)模真實(shí)文本中包含著非常豐富的實(shí)體關(guān)系,難以全部預(yù)先定義,為了有效獲取這些信息,Banko 等于 2007 年提出了開放關(guān)系抽。∣pen Relation Extraction,ORE)的任務(wù),旨在盡可能抽取大規(guī)模文本中存在的各類實(shí)體關(guān)系。近十年來,研究者們發(fā)布了許多開放關(guān)系抽取系統(tǒng)。然而,目前的ORE系統(tǒng)在抽取性能方面還存在問題,比如抽取出不符合事實(shí)的關(guān)系三元組,并且在抽取效率方面還不能滿足處理大規(guī)模Web文本的需求。另一方面,雖然ORE系統(tǒng)可以從文本中抽取出所有類別的關(guān)系,但一些下游任務(wù)只對(duì)少量特定的關(guān)系類別關(guān)系感興趣。所以,開放關(guān)系的分類對(duì)下游應(yīng)用具有重要價(jià)值,但目前還沒有對(duì)開放關(guān)系分類的相關(guān)研究。本文在前人研究的基礎(chǔ)上開展工作。主要內(nèi)容和貢獻(xiàn)包括:(1)提出了一種基于詞向量的開放關(guān)系抽取模型。近年來出現(xiàn)的絕大多數(shù)ORE系統(tǒng)都是建立在... 

【文章頁數(shù)】:116 頁

【學(xué)位級(jí)別】:博士

【文章目錄】:
摘要
ABSTRACT
第一章 引言
    1.1 研究的背景和意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀及分析
        1.2.1 開放關(guān)系抽取技術(shù)
        1.2.2 開放關(guān)系分類技術(shù)
        1.2.3 開放關(guān)系研究中存在的問題
    1.3 本論文的研究?jī)?nèi)容及結(jié)構(gòu)安排
第二章 基礎(chǔ)知識(shí)
    2.1 詞向量簡(jiǎn)介
    2.2 基于詞向量的關(guān)系分類技術(shù)
    2.3 半監(jiān)督聚類算法
    2.4 短語的向量表示
        2.4.1 短語向量模型
        2.4.2 短語向量編碼結(jié)構(gòu)
        2.4.3 短語向量模型的訓(xùn)練
        2.4.4 短語向量模型的比較
    2.5 本章小結(jié)
第三章 基于詞向量距離的開放關(guān)系抽取
    3.1 基于向量距離的抽取算法
        3.1.1 抽取算法描述
        3.1.2 可信度計(jì)算方式轉(zhuǎn)化的分析
    3.2 實(shí)驗(yàn)結(jié)果及分析
        3.2.1 數(shù)據(jù)集和評(píng)價(jià)指標(biāo)
        3.2.2 實(shí)驗(yàn)結(jié)果
    3.3 本章小結(jié)
第四章 基于半積極算法的開放關(guān)系分類
    4.1 開放關(guān)系分類算法
        4.1.1 SemiE算法
        4.1.2 關(guān)系短語的向量表示
    4.2 實(shí)驗(yàn)結(jié)果及分析
        4.2.1 數(shù)據(jù)集和評(píng)測(cè)指標(biāo)
        4.2.2 模型訓(xùn)練
        4.2.3 實(shí)驗(yàn)結(jié)果
        4.2.4 實(shí)驗(yàn)結(jié)果分析
    4.3 本章小結(jié)及討論
第五章 基于信息量的短語向量模型
    5.1 短語向量性能分析
        5.1.1 短語向量的淺層語言學(xué)性能分析
        5.1.2 短語向量的深層語言學(xué)性能分析
    5.2 BoV模型的改進(jìn)
        5.2.1 Info-BoV模型
        5.2.2 Info-BoV性育臣評(píng)價(jià)
    5.3 Info-BoV向量在開放關(guān)系研究中的應(yīng)用
        5.3.1 Info-BoV向量在開放關(guān)系抽取中的應(yīng)用
        5.3.2 Info-BoV向量在開放關(guān)系分類中的應(yīng)用
        5.3.3 實(shí)驗(yàn)結(jié)果分析
    5.4 本章小結(jié)
第六章 基于詞向量的開放關(guān)系抽取演示系統(tǒng)
    6.1 系統(tǒng)設(shè)計(jì)概要
    6.2 模塊設(shè)計(jì)與實(shí)現(xiàn)
    6.3 系統(tǒng)演示
    6.4 本章小結(jié)
第七章 總結(jié)與展望
    7.1 總結(jié)
    7.2 展望
參考文獻(xiàn)
致謝
攻讀博士學(xué)位期間發(fā)表的學(xué)術(shù)論文


【參考文獻(xiàn)】:
期刊論文
[1]密度敏感的距離測(cè)度在特定圖像聚類中的應(yīng)用[J]. 吳毓龍,袁平波.  計(jì)算機(jī)工程. 2009(06)
[2]半監(jiān)督聚類中基于密度的約束擴(kuò)展方法[J]. 張亮,李敏強(qiáng).  計(jì)算機(jī)工程. 2008(10)
[3]基于雙近鄰測(cè)度的半監(jiān)督聚類方法[J]. 羅曉清,王士同.  計(jì)算機(jī)應(yīng)用與軟件. 2008(04)



本文編號(hào):3712995

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3712995.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶144b1***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com