基于深度學(xué)習(xí)的漢語復(fù)句層次結(jié)構(gòu)分析方法的應(yīng)用研究
發(fā)布時間:2023-01-25 19:07
自然語言處理的一個重要分支——中文信息處理,在語義理解、文本生成等眾多方面作用突出,而復(fù)句又作為漢語語法的重要實體單位,其在語義表達(dá)上復(fù)雜多樣,因此,具有很高的研究價值和意義。一方面,它由單句構(gòu)成能表達(dá)出非常豐富的語義信息;另一方面,也包含了單句間的邏輯語義層次結(jié)構(gòu)關(guān)系,對于段落篇章分析意義重大。復(fù)句研究目前主要包括分句劃分,關(guān)系詞識別,關(guān)系類別判斷,以及層次結(jié)構(gòu)分析等。鑒于關(guān)系詞對復(fù)句層次結(jié)構(gòu)識別存在直接影響,因此能夠有效準(zhǔn)確地識別出關(guān)系詞十分重要,但由于關(guān)系詞本身離析度不同,及存在大量缺標(biāo)或無標(biāo)復(fù)句,使得提取準(zhǔn)確率不超過76.3%[1]。因此,就需要從句法、語義、及交叉特征等多角度來綜合分析復(fù)句層次結(jié)構(gòu)關(guān)系。本文主要圍繞基于改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)方法并采用多維度特征融合的策略對復(fù)句層次結(jié)構(gòu)進(jìn)行分析識別。研究工作主要包括三部分,首先,對復(fù)句進(jìn)行準(zhǔn)確分句劃分,通過分析復(fù)句依存句法,提取出基于謂詞核心的句法特征,包括句內(nèi)謂核依存復(fù)現(xiàn)分布和句間依存關(guān)系分布;然后,鑒于分句間語義關(guān)聯(lián)程度是決定層次結(jié)構(gòu)劃分的重要因素,利用中文維基百科語料訓(xùn)練句向量Doc2Vec模型,提取基于句向量的語義特征,及句...
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文目標(biāo)與內(nèi)容
1.4 研究難點與創(chuàng)新
1.5 論文組織與結(jié)構(gòu)
第二章 漢語復(fù)句及神經(jīng)網(wǎng)絡(luò)的相關(guān)概述
2.1 依存句法與語義角色標(biāo)注
2.1.1 依存句法
2.1.2 語義角色標(biāo)注
2.2 復(fù)句內(nèi)分句劃分及層次結(jié)構(gòu)概述
2.3 神經(jīng)網(wǎng)絡(luò)模型與常用深度學(xué)習(xí)框架
2.3.1 神經(jīng)元
2.3.2 激活函數(shù)
2.4 常用深度學(xué)習(xí)框架
2.5 本章小結(jié)
第三章 基于依存句法的淺層特征提取
3.1 基于標(biāo)點符號和依存句法的復(fù)句內(nèi)分句的劃分
3.1.1 標(biāo)點符號對分句劃分的影響
3.1.2 句法依存關(guān)系對分句劃分的影響
3.1.3 基于規(guī)則的偽分句過濾
3.2 淺層句法特征提取
3.2.1 基于謂詞核心的關(guān)聯(lián)特征提取
3.2.2 關(guān)聯(lián)特征提取算法
3.3 本章小結(jié)
第四章 復(fù)句內(nèi)基于語義的深層特征挖掘
4.1 詞語及句子的分布式表示
4.1.1 離散獨熱編碼
4.1.2 關(guān)鍵詞提取與詞向量
4.1.3 文檔向量Doc2Vec
4.2 深層語義特征提取
4.2.1 基于句向量的語義特征提取
4.2.2 語義計算特征提取算法
4.3 交叉抽象特征提取
4.3.1 基于Word2Vec與TextRank的關(guān)鍵詞計算
4.3.2 交叉特征提取算法
4.4 本章小結(jié)
第五章 基于改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)的復(fù)句層次結(jié)構(gòu)分析
5.1 基于機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的復(fù)句層次結(jié)構(gòu)分析
5.1.1 機(jī)器學(xué)習(xí)算法介紹
5.1.2 卷積神經(jīng)網(wǎng)絡(luò)算法介紹
5.2 三句式復(fù)句層次結(jié)構(gòu)分析的自動化框架
5.3 實驗數(shù)據(jù)與結(jié)果分析
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
攻讀碩士期間參加的科研項目和發(fā)表的論文
致謝
【參考文獻(xiàn)】:
期刊論文
[1]漢語復(fù)句三分法與對外漢語教學(xué)淺談[J]. 趙舸. 邢臺學(xué)院學(xué)報. 2014(02)
[2]中文篇章級句間語義關(guān)系識別[J]. 張牧宇,宋原,秦兵,劉挺. 中文信息學(xué)報. 2013(06)
[3]現(xiàn)代漢語語義角色研究述評[J]. 段瀟雪. 文教資料. 2012(27)
[4]漢語句法分析研究綜述[J]. 鄭偉發(fā). 信息技術(shù). 2012(07)
[5]面向移進(jìn)—歸約句法分析器的單模型系統(tǒng)整合算法[J]. 馬驥,朱慕華,肖桐,朱靖波. 中文信息學(xué)報. 2012(03)
[6]關(guān)聯(lián)詞搭配的自動發(fā)現(xiàn)[J]. 姚雙云,胡金柱,肖升,沈威. 計算機(jī)應(yīng)用研究. 2011(12)
[7]基于主謂語知識挖掘的分句語義關(guān)聯(lián)研究[J]. 吳鋒文. 語言文字應(yīng)用. 2011(04)
[8]基于關(guān)系標(biāo)記的漢語復(fù)句分類研究[J]. 吳鋒文. 漢語學(xué)報. 2011(03)
[9]基于規(guī)則的漢語復(fù)句層次關(guān)系自動識別研究[J]. 吳鋒文,胡金柱,肖明,肖升,舒江波. 華文教學(xué)與研究. 2010(01)
[10]漢語復(fù)句關(guān)系詞庫的建設(shè)及其利用[J]. 胡金柱,吳鋒文,李瓊,舒江波. 語言科學(xué). 2010(02)
博士論文
[1]面向中文信息處理的復(fù)句關(guān)系詞自動標(biāo)識研究[D]. 舒江波.華中師范大學(xué) 2011
碩士論文
[1]面向中文信息處理的漢語復(fù)句中書讀短語的自動識別研究[D]. 俞小娟.華中師范大學(xué) 2008
本文編號:3731691
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文目標(biāo)與內(nèi)容
1.4 研究難點與創(chuàng)新
1.5 論文組織與結(jié)構(gòu)
第二章 漢語復(fù)句及神經(jīng)網(wǎng)絡(luò)的相關(guān)概述
2.1 依存句法與語義角色標(biāo)注
2.1.1 依存句法
2.1.2 語義角色標(biāo)注
2.2 復(fù)句內(nèi)分句劃分及層次結(jié)構(gòu)概述
2.3 神經(jīng)網(wǎng)絡(luò)模型與常用深度學(xué)習(xí)框架
2.3.1 神經(jīng)元
2.3.2 激活函數(shù)
2.4 常用深度學(xué)習(xí)框架
2.5 本章小結(jié)
第三章 基于依存句法的淺層特征提取
3.1 基于標(biāo)點符號和依存句法的復(fù)句內(nèi)分句的劃分
3.1.1 標(biāo)點符號對分句劃分的影響
3.1.2 句法依存關(guān)系對分句劃分的影響
3.1.3 基于規(guī)則的偽分句過濾
3.2 淺層句法特征提取
3.2.1 基于謂詞核心的關(guān)聯(lián)特征提取
3.2.2 關(guān)聯(lián)特征提取算法
3.3 本章小結(jié)
第四章 復(fù)句內(nèi)基于語義的深層特征挖掘
4.1 詞語及句子的分布式表示
4.1.1 離散獨熱編碼
4.1.2 關(guān)鍵詞提取與詞向量
4.1.3 文檔向量Doc2Vec
4.2 深層語義特征提取
4.2.1 基于句向量的語義特征提取
4.2.2 語義計算特征提取算法
4.3 交叉抽象特征提取
4.3.1 基于Word2Vec與TextRank的關(guān)鍵詞計算
4.3.2 交叉特征提取算法
4.4 本章小結(jié)
第五章 基于改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)的復(fù)句層次結(jié)構(gòu)分析
5.1 基于機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的復(fù)句層次結(jié)構(gòu)分析
5.1.1 機(jī)器學(xué)習(xí)算法介紹
5.1.2 卷積神經(jīng)網(wǎng)絡(luò)算法介紹
5.2 三句式復(fù)句層次結(jié)構(gòu)分析的自動化框架
5.3 實驗數(shù)據(jù)與結(jié)果分析
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
攻讀碩士期間參加的科研項目和發(fā)表的論文
致謝
【參考文獻(xiàn)】:
期刊論文
[1]漢語復(fù)句三分法與對外漢語教學(xué)淺談[J]. 趙舸. 邢臺學(xué)院學(xué)報. 2014(02)
[2]中文篇章級句間語義關(guān)系識別[J]. 張牧宇,宋原,秦兵,劉挺. 中文信息學(xué)報. 2013(06)
[3]現(xiàn)代漢語語義角色研究述評[J]. 段瀟雪. 文教資料. 2012(27)
[4]漢語句法分析研究綜述[J]. 鄭偉發(fā). 信息技術(shù). 2012(07)
[5]面向移進(jìn)—歸約句法分析器的單模型系統(tǒng)整合算法[J]. 馬驥,朱慕華,肖桐,朱靖波. 中文信息學(xué)報. 2012(03)
[6]關(guān)聯(lián)詞搭配的自動發(fā)現(xiàn)[J]. 姚雙云,胡金柱,肖升,沈威. 計算機(jī)應(yīng)用研究. 2011(12)
[7]基于主謂語知識挖掘的分句語義關(guān)聯(lián)研究[J]. 吳鋒文. 語言文字應(yīng)用. 2011(04)
[8]基于關(guān)系標(biāo)記的漢語復(fù)句分類研究[J]. 吳鋒文. 漢語學(xué)報. 2011(03)
[9]基于規(guī)則的漢語復(fù)句層次關(guān)系自動識別研究[J]. 吳鋒文,胡金柱,肖明,肖升,舒江波. 華文教學(xué)與研究. 2010(01)
[10]漢語復(fù)句關(guān)系詞庫的建設(shè)及其利用[J]. 胡金柱,吳鋒文,李瓊,舒江波. 語言科學(xué). 2010(02)
博士論文
[1]面向中文信息處理的復(fù)句關(guān)系詞自動標(biāo)識研究[D]. 舒江波.華中師范大學(xué) 2011
碩士論文
[1]面向中文信息處理的漢語復(fù)句中書讀短語的自動識別研究[D]. 俞小娟.華中師范大學(xué) 2008
本文編號:3731691
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3731691.html
最近更新
教材專著