天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于遷移學(xué)習(xí)的緬甸語依存句法分析方法研究

發(fā)布時間:2021-05-14 10:38
  依存句法分析是自然語言處理的重要研究任務(wù),由于緬甸語為資源稀缺語言,人工標(biāo)注大規(guī)模的緬語依存句法分析數(shù)據(jù)存在較大困難。本文利用英語的依存標(biāo)注數(shù)據(jù),通過遷移學(xué)習(xí)方法解決緬甸語依存句法分析問題,研究具有一定的學(xué)術(shù)意義。本文分析了緬甸語、英語在句法方面的差異性,提出了基于共享網(wǎng)絡(luò)參數(shù)的緬甸語依存句法分析方法,提出了基于遷移學(xué)習(xí)的緬甸語依存句法分析方法。實驗證明提出的方法在標(biāo)注數(shù)據(jù)較少的情況下能夠有效提升緬甸語依存句法分析的性能。本文取得了以下幾方面的成果:(1)英緬句法差異性分析及語料庫構(gòu)建。分析了緬甸句法特點(diǎn),研究了英緬句法之間的差異并分析了英緬句法結(jié)構(gòu)的對應(yīng)關(guān)系。結(jié)合英緬句法差異性利用從亞洲語言樹庫獲取的20106對英-緬平行對齊語料,本文構(gòu)建出1766句符合依存句法分析規(guī)則的緬甸語依存句法分析語料,17688條不符合依存句法分析規(guī)則的緬甸語依存句法分析語料。(2)基于共享網(wǎng)絡(luò)參數(shù)的緬甸語依存句法分析方法。針對緬甸語依存句法分析語料不足的問題,本文提出共享網(wǎng)絡(luò)參數(shù)的緬甸語依存句法分析方法。首先利用雙語詞典將英緬雙語詞向量映射到相同的語義空間中,然后基于斯坦福依存句法分析器使用大量的英語標(biāo)... 

【文章來源】:昆明理工大學(xué)云南省

【文章頁數(shù)】:78 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
Abstract
第一章 緒論
    1.1 研究背景及意義
    1.2 國內(nèi)外研究現(xiàn)狀
    1.3 本文的主要研究內(nèi)容
    1.4 本文的組織結(jié)構(gòu)
第二章 英緬句法差異性分析及語料庫構(gòu)建
    2.1 引言
    2.2 緬甸語的句法特點(diǎn)
        2.2.1 緬甸語句法結(jié)構(gòu)
        2.2.2 緬甸語句法特征
    2.3 英語緬甸語句子對應(yīng)關(guān)系
        2.3.1 緬甸語的句法成分分析
        2.3.2 英緬句子成分對比
    2.4 基于詞映射構(gòu)建緬甸語依存句法分析
        2.4.1 生成英語依存句法分析標(biāo)記語料
        2.4.2 獲取英緬對齊的句子中的詞對應(yīng)關(guān)系
        2.4.3 獲取緬甸語標(biāo)記的依存關(guān)系語料
    2.5 總結(jié)
第三章 基于共享網(wǎng)絡(luò)參數(shù)的緬甸語依存句法分析方法
    3.1 引言
    3.2 相關(guān)研究
    3.3 共享網(wǎng)絡(luò)參數(shù)的緬甸語依存句法分析模型
    3.4 共享英緬詞向量空間
        3.4.1 利用正交性約束映射矩陣
        3.4.2 數(shù)值歸一化
        3.4.3 迭代更新雙語詞典
    3.5 共享網(wǎng)絡(luò)參數(shù)的模型訓(xùn)練
        3.5.1 實驗語料的準(zhǔn)備
        3.5.2 共享詞向量語義空間
        3.5.3 依存句法分析過程
        3.5.4 共享網(wǎng)絡(luò)參數(shù)的緬甸依存句法分析模型訓(xùn)練
    3.6 實驗
        3.6.1 依存句法分析的評價指標(biāo)
        3.6.2 實驗及結(jié)果分析
    3.7 本章小結(jié)
第四章 基于遷移學(xué)習(xí)的緬甸語依存句法分析方法
    4.1 引言
    4.2 相關(guān)研究
    4.3 基于遷移學(xué)習(xí)的緬甸語依存句法分析模型
    4.4 緬語詞分析
        4.4.1 融合緬語音節(jié)特征的緬甸語詞向量訓(xùn)練模型
        4.4.2 緬語詞匯的向量初始化
        4.4.3 卷積層提取緬語音節(jié)特征
        4.4.4 門結(jié)構(gòu)網(wǎng)絡(luò)進(jìn)一步提取特征
        4.4.5 遞歸神經(jīng)網(wǎng)絡(luò)構(gòu)建語言模型
    4.5 特征信息的遷移
        4.5.1 Skip-gram
        4.5.2 訓(xùn)練詞性標(biāo)簽的向量
        4.5.3 融合緬甸語語法的遷移訓(xùn)練方法
        4.5.4 依存弧、詞性、位置信息的遷移
    4.6 遷移學(xué)習(xí)的模型訓(xùn)練
        4.6.1 輸入層
        4.6.2 激活函數(shù)
        4.6.3 損失函數(shù)
    4.7 實驗及結(jié)果分析
        4.7.1 實驗數(shù)據(jù)
        4.7.2 實驗及結(jié)果分析
    4.8 本章小結(jié)
第五章 緬甸語依存句法分析原型系統(tǒng)的實現(xiàn)
    5.1 系統(tǒng)簡介
    5.2 實驗開發(fā)環(huán)境
        5.2.1 軟件環(huán)境
        5.2.2 硬件環(huán)境
    5.3 緬甸語依存句法分析模型
        5.3.1 數(shù)據(jù)的預(yù)處理
        5.3.2 訓(xùn)練所需的標(biāo)注語料
        5.3.3 獲得緬甸語依存句法分析模型
    5.4 原型系統(tǒng)
    5.5 本章小結(jié)
第六章 總結(jié)和展望
    6.1 總結(jié)
    6.2 展望
致謝
參考文獻(xiàn)
附錄


【參考文獻(xiàn)】:
期刊論文
[1]基于語言學(xué)的依存分析結(jié)果動賓關(guān)系補(bǔ)全研究[J]. 張丹,周俏麗,張桂平.  計算機(jī)應(yīng)用研究. 2018(04)
[2]語音識別技術(shù)研究進(jìn)展[J]. 詹新明,黃南山,楊燦.  現(xiàn)代計算機(jī)(專業(yè)版). 2008(09)
[3]自然語言處理在信息檢索中的應(yīng)用綜述[J]. 王燦輝,張敏,馬少平.  中文信息學(xué)報. 2007(02)
[4]機(jī)器翻譯研究現(xiàn)狀與展望[J]. 戴新宇,尹存燕,陳家駿,鄭國梁.  計算機(jī)科學(xué). 2004(11)

碩士論文
[1]基于神經(jīng)網(wǎng)絡(luò)的漢緬雙語句子級Embedding語義表征方法應(yīng)用研究[D]. 林頌凱.昆明理工大學(xué) 2018
[2]基于漢-緬雙語語料的雙語實體抽取方法研究[D]. AUNG HLA MOE(張家富).昆明理工大學(xué) 2018
[3]越南語句法分析與樹庫轉(zhuǎn)化方法研究[D]. 李英.昆明理工大學(xué) 2017
[4]融合多特征的漢緬雙語主題模型構(gòu)建方法研究[D]. 王雍凱.昆明理工大學(xué) 2017
[5]緬甸語詞法分析方法研究[D]. 韓曉東.昆明理工大學(xué) 2016
[6]基于序列標(biāo)注的中文依存句法分析研究[D]. 計峰.復(fù)旦大學(xué) 2008



本文編號:3185501

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3185501.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4e732***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com