天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

非獨立同分布詞語相關度計算方法研究

發(fā)布時間:2022-12-10 06:58
  詞語相關度計算,即度量兩個詞語表達意義的近似程度。它是自然語言處理領域的一項基礎性研究,對文本分類、自動問答、詞義消歧、機器翻譯等上層任務有著重要的影響。詞語的表示學習是詞語相關度計算中一項基礎而核心的工作,獲取高質(zhì)量的詞語表示是提高詞語相關度計算結果的有效方式。本文試圖從提高詞語的表示學習質(zhì)量這一角度出發(fā)進行相關研究,在非獨立同分布學習理論(not independent and identically distributed learning,簡寫non-IID learning)的指導下,充分挖掘概念之間的耦合關系,生成高質(zhì)量的概念向量,再通過概念映射將詞語與概念關聯(lián)起來,利用概念向量計算詞語相關度,進而改善文本分類、自動問答等上層應用的效果。本文的主要工作和貢獻體現(xiàn)在下述三個方面:(1)針對傳統(tǒng)的詞語相關度計算方法混淆語義概念信息且忽視概念耦合關系的問題,本文提出了基于非獨立同分布學習的詞語概念表示方法和詞語相關度計算方法。本文充分挖掘概念描述和知識網(wǎng)絡蘊含的多種概念耦合關系,包含概念描述中的顯式概念共現(xiàn)耦合、知識網(wǎng)絡中的顯式概念超鏈接耦合以及兩者之間的隱式概念耦合;提出了基于... 

【文章頁數(shù)】:71 頁

【學位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 研究背景
    1.2 研究目的和意義
    1.3 主要研究內(nèi)容
    1.4 論文組織結構
第2章 詞語相關度計算技術
    2.1 引言
    2.2 基于語義詞典的方法
    2.3 基于語料庫的統(tǒng)計方法
    2.4 基于語料庫的深度學習方法
    2.5 本章小結
第3章 基于non-IID的詞語相關度計算方法
    3.1 引言
    3.2 non-IID相關度計算框架
    3.3 基于non-IID的概念表示方法
        3.3.1 維基百科概念
        3.3.2 顯式概念共現(xiàn)耦合表示學習
        3.3.3 顯式概念鏈接耦合表示學習
        3.3.4 隱式概念耦合表示學習
    3.4 實驗與分析
        3.4.1 數(shù)據(jù)預處理
        3.4.2 相關度計算
        3.4.3 基線模型
        3.4.4 評價指標
        3.4.5 參數(shù)設置
        3.4.6 結果分析
    3.5 本章小結
第4章 基于non-IID詞語表示的文本分類方法
    4.1 引言
    4.2 基于non-IID詞語表示的文本分類方法
        4.2.1 系統(tǒng)框架
        4.2.2 預處理
        4.2.3 文本特征構建
        4.2.4 文本分類
    4.3 實驗與分析
        4.3.1 數(shù)據(jù)集
        4.3.2 評價指標
        4.3.3 基線模型
        4.3.4 實驗參數(shù)
        4.3.5 結果分析
    4.4 本章小結
第5章 基于non-IID詞語表示的醫(yī)療問答方法
    5.1 引言
    5.2 基于non-IID詞語表示的醫(yī)療問答系統(tǒng)
        5.2.1 系統(tǒng)框架
        5.2.2 嵌入模塊
        5.2.3 問答編碼器模塊
        5.2.4 損失函數(shù)
    5.3 實驗與分析
        5.3.1 數(shù)據(jù)集
        5.3.2 評價指標
        5.3.3 基線模型
        5.3.4 實驗參數(shù)
        5.3.5 結果分析
    5.4 本章小結
第6章 結論與工作展望
    6.1 結論
    6.2 工作展望
參考文獻
致謝
在學期間主要科研成果
    一、發(fā)表學術論文
    二、發(fā)明專利情況
    三、獲獎情況
    四、參與科研項目


【參考文獻】:
期刊論文
[1]基于路徑與詞林編碼的詞語相似度計算方法[J]. 王松松,高偉勛,徐逸凡.  計算機工程. 2018(10)
[2]一種改進的基于知網(wǎng)的詞語語義相似度算法[J]. 張小川,于旭庭,張宜浩.  計算機應用研究. 2018(08)
[3]基于領域知識和詞向量的詞義消歧方法[J]. 楊安,李素建,李蕓.  北京大學學報(自然科學版). 2017(02)
[4]基于LDA的中文詞語相似度計算[J]. 呂亞偉,李芳,戴龍龍.  北京化工大學學報(自然科學版). 2016(05)
[5]基于知網(wǎng)與詞林的詞語語義相似度計算[J]. 朱新華,馬潤聰,孫柳,陳宏朝.  中文信息學報. 2016(04)
[6]中文短文本語法語義相似度算法[J]. 廖志芳,周國恩,李俊鋒,劉飛,蔡飛.  湖南大學學報(自然科學版). 2016(02)
[7]《同義詞詞林》在中文實體關系抽取中的作用[J]. 劉丹丹,彭成,錢龍華,周國棟.  中文信息學報. 2014(02)
[8]基于大規(guī)模語料庫的漢語詞義相似度計算方法[J]. 石靜,吳云芳,邱立坤,呂學強.  中文信息學報. 2013(01)
[9]基于詞林的詞語相似度的度量[J]. 呂立輝,梁維薇,冉蜀陽.  現(xiàn)代計算機(專業(yè)版). 2013(01)
[10]詞匯相似度研究進展綜述[J]. 劉萍,陳燁.  現(xiàn)代圖書情報技術. 2012(Z1)

碩士論文
[1]知識庫與語料庫相結合的語義相似度的研究與實現(xiàn)[D]. 施凱倫.北京交通大學 2016
[2]基于上下文的詞語相似度計算及其應用[D]. 郭麗.沈陽航空工業(yè)學院 2009



本文編號:3716299

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3716299.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶5fd7d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com