天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類博士論文 >

面向中文短文本的關(guān)系抽取算法設(shè)計(jì)

發(fā)布時(shí)間:2021-09-19 19:23
  海量互聯(lián)網(wǎng)數(shù)據(jù)的異構(gòu)、多源和異質(zhì)等問(wèn)題使得高效、精準(zhǔn)的知識(shí)獲取成為巨大的挑戰(zhàn)。關(guān)系抽取是自然語(yǔ)言處理中的一項(xiàng)基礎(chǔ)性任務(wù),從無(wú)結(jié)構(gòu)化的文本數(shù)據(jù)中自動(dòng)獲取結(jié)構(gòu)化的關(guān)系型事實(shí),為大規(guī)模知識(shí)圖譜的構(gòu)建和互聯(lián)網(wǎng)智能知識(shí)服務(wù)提供支持。隨著深度學(xué)習(xí)技術(shù)的廣泛應(yīng)用,神經(jīng)關(guān)系抽取模型的精度獲得了很大提升。然而,現(xiàn)有的主流研究一般關(guān)注英語(yǔ)語(yǔ)言的、句子級(jí)別的關(guān)系抽取。與英語(yǔ)不同,中文表述靈活多變,語(yǔ)法和構(gòu)詞規(guī)則相對(duì)不固定,大量語(yǔ)義知識(shí)蘊(yùn)含在中文短文本中,通常很難被現(xiàn)有算法有效抽取。本文主要研究面向中文短文本的關(guān)系抽取問(wèn)題。由于中文短文本獨(dú)特的語(yǔ)言學(xué)特征,其關(guān)系抽取任務(wù)與傳統(tǒng)工作相比具有諸多挑戰(zhàn)。短文本的語(yǔ)法結(jié)構(gòu)和語(yǔ)義一般不完整,部分短文本蘊(yùn)含的語(yǔ)義關(guān)系屬于常識(shí)性知識(shí),關(guān)系表述的上下文高度稀疏。與英語(yǔ)相比,中文基礎(chǔ)自然語(yǔ)言分析較低的準(zhǔn)確度,以及短文本關(guān)系抽取標(biāo)注數(shù)據(jù)集的缺乏也增大了這一問(wèn)題的難度。本文分別從基于詞嵌入的上下位關(guān)系抽取、知識(shí)增強(qiáng)的語(yǔ)義關(guān)系抽取、以及非上下位關(guān)系抽取與語(yǔ)義理解等三個(gè)方面進(jìn)行深入研究,設(shè)計(jì)了面向中文短文本的關(guān)系抽取框架,較好地解決了上述挑戰(zhàn)。本文的主要工作和貢獻(xiàn)概述如下:(1)基于詞... 

【文章來(lái)源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:201 頁(yè)

【學(xué)位級(jí)別】:博士

【文章目錄】:
摘要
abstract
第一章 緒論
    1.1 研究背景
        1.1.1 知識(shí)圖譜
        1.1.2 分類體系與上下位關(guān)系抽取
        1.1.3 通用語(yǔ)義關(guān)系抽取
    1.2 面臨的挑戰(zhàn)
    1.3 整體研究?jī)?nèi)容與研究思路
    1.4 研究意義
    1.5 主要貢獻(xiàn)
    1.6 章節(jié)安排
第二章 基于詞嵌入的上下位關(guān)系抽取
    2.1 引言
    2.2 相關(guān)工作
        2.2.1 基于模式匹配的上下位關(guān)系抽取
        2.2.2 分布式上下位關(guān)系預(yù)測(cè)
        2.2.3 討論
    2.3 半監(jiān)督式上下位關(guān)系擴(kuò)展模型
        2.3.1 算法模型
        2.3.2 實(shí)驗(yàn)分析
    2.4 基于轉(zhuǎn)導(dǎo)學(xué)習(xí)的上下位關(guān)系分類模型
        2.4.1 算法模型
        2.4.2 實(shí)驗(yàn)分析
    2.5 基于模糊正交投影的上下位關(guān)系分類模型
        2.5.1 算法模型
        2.5.2 實(shí)驗(yàn)分析
    2.6 小結(jié)
第三章 知識(shí)增強(qiáng)的語(yǔ)義關(guān)系抽取
    3.1 引言
    3.2 相關(guān)工作
        3.2.1 對(duì)抗學(xué)習(xí)在NLP的應(yīng)用
        3.2.2 跨語(yǔ)言遷移學(xué)習(xí)在NLP的應(yīng)用
        3.2.3 詞匯關(guān)系分類
    3.3 基于對(duì)抗學(xué)習(xí)的跨知識(shí)源上下位關(guān)系融合
        3.3.1 算法模型
        3.3.2 實(shí)驗(yàn)分析
    3.4 基于遷移學(xué)習(xí)的跨語(yǔ)言上下位關(guān)系抽取
        3.4.1 算法模型
        3.4.2 實(shí)驗(yàn)分析
    3.5 基于超球?qū)W習(xí)的詞匯關(guān)系分類
        3.5.1 算法模型
        3.5.2 實(shí)驗(yàn)分析
    3.6 小結(jié)
第四章 非上下位關(guān)系抽取與語(yǔ)義理解
    4.1 引言
    4.2 相關(guān)工作
        4.2.1 基于短文本的關(guān)系抽取
        4.2.2 常識(shí)性關(guān)系抽取
        4.2.3 名詞短語(yǔ)的習(xí)語(yǔ)性分析
    4.3 基于模式挖掘的非上下位關(guān)系抽取
        4.3.1 算法模型
        4.3.2 實(shí)驗(yàn)分析
    4.4 數(shù)據(jù)驅(qū)動(dòng)的非上下位關(guān)系抽取
        4.4.1 算法模型
        4.4.2 實(shí)驗(yàn)分析
    4.5 中文短文本的語(yǔ)義理解
        4.5.1 習(xí)語(yǔ)性分類問(wèn)題
        4.5.2 算法模型
        4.5.3 實(shí)驗(yàn)分析
        4.5.4 應(yīng)用研究
    4.6 小結(jié)
第五章 總結(jié)與展望
    5.1 總結(jié)
    5.2 未來(lái)工作展望
參考文獻(xiàn)
附錄
致謝
簡(jiǎn)歷
攻讀博士學(xué)位期間發(fā)表的學(xué)術(shù)論文和科研情況



本文編號(hào):3402193

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3402193.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3c520***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com