基于框架語義的共指消解研究
發(fā)布時(shí)間:2021-07-06 04:15
漢語框架網(wǎng)(CFN)作為一種框架語義資源,廣泛應(yīng)用于閱讀理解、問答系統(tǒng)等自然語言處理研究領(lǐng)域中。構(gòu)建漢語篇章句子中框架元素之間的聯(lián)系是語義理解的一種有效手段,但框架元素內(nèi)部表述的共指阻礙了這種聯(lián)系的建立。本文以框架元素中的表述為研究對(duì)象,基于框架語義信息,研究表述間的共指關(guān)系。本文以社科基金項(xiàng)目“面向機(jī)器閱讀的漢語框架語義知識(shí)庫擴(kuò)建研究”課題為依托,針對(duì)構(gòu)建的漢語框架語義篇章語料中不同框架元素之間存在共指關(guān)系的問題,研究基于框架語義的共指消解方法,最后將共指消解方法運(yùn)用于漢語框架共指語料的標(biāo)注和檢驗(yàn)。本文通過融合漢語框架的語義信息,采用傳統(tǒng)的機(jī)器學(xué)習(xí)和目前流行的深度學(xué)習(xí)等不同方法,在標(biāo)注共指信息的漢語框架篇章句子語料上進(jìn)行實(shí)驗(yàn)。本文的主要工作及研究成果如下:針對(duì)構(gòu)建的框架語義篇章語料集,框架元素內(nèi)表述的消解任務(wù),提出并驗(yàn)證了兩種方法。(1)基于框架語義的傳統(tǒng)機(jī)器學(xué)習(xí)共指消解方法。本文分析了框架元素標(biāo)注信息及框架之間的關(guān)系,得到框架特征集作為框架語義信息,結(jié)合共指消解基礎(chǔ)特征集,訓(xùn)練共指消解分類模型,準(zhǔn)確率得到提升。(2)基于框架語義的深度學(xué)習(xí)共指消解方法。首先學(xué)習(xí)表述的上下文文本信息,...
【文章來源】:山西大學(xué)山西省
【文章頁數(shù)】:57 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
基于框架語義的共指消解框架圖
第四章基于框架語義的深度學(xué)習(xí)共指消解方法21第四章基于框架語義的深度學(xué)習(xí)共指消解方法本章在LSTM模型的基礎(chǔ)上,加入框架語義信息,提出基于LSTM共指消解方法。漢語框架標(biāo)注資源作為知識(shí)能更好的應(yīng)用深度學(xué)習(xí)解決共指問題,但標(biāo)注的框架資源無法直接參與計(jì)算,要想通過深度學(xué)習(xí)的算法處理,首先需要用合適的方法將標(biāo)注的信息經(jīng)過自然語言符號(hào)的數(shù)學(xué)化表示之后,再完成深度學(xué)習(xí)模型的訓(xùn)練。4.1用三元組表示漢語框架知識(shí)為了方便框架語義的處理和計(jì)算機(jī)理解,本文采用結(jié)構(gòu)化、形式化的方式表示框架語義信息,使用類似三元組的方式。三元組是知識(shí)表示中最常見的格式,漢語框架網(wǎng)作為知識(shí)庫的一種,在資源中有實(shí)體和關(guān)系標(biāo)注,可以簡(jiǎn)單的把框架關(guān)系理解為(實(shí)體,關(guān)系,實(shí)體)三元組。如果把框架中的實(shí)體表述看作是結(jié)點(diǎn),把表述在框架中的關(guān)系看作是一條邊,那么包含了大量三元組的框架知識(shí)庫就成為了一個(gè)龐大的框架知識(shí)圖。下面介紹漢語框架網(wǎng)中兩種關(guān)系類型。截取表2.2的部分語料,構(gòu)建漢語框架核心元素關(guān)系圖(圖4.1)和偏好選擇關(guān)系圖(圖4.2)。圖4.1漢語框架核心元素關(guān)系圖圖4.1中表示的是漢語框架網(wǎng)中框架與框架內(nèi)的核心框架元素。本文認(rèn)為,框架元素表示一段文本或者一句話中最重要的語義成分,其內(nèi)容更容易與其他成分存在共指關(guān)系,特別是在段落或者篇章中,這種關(guān)系更加明顯。如上所示的框架核心元素表示成三元組(春生子,狀態(tài),長(zhǎng)白山溪流中的小魚),(它們,死亡,NULL),(人們,命名,它們),(人們,命名,魚食)等。圖4.2選擇偏好關(guān)系圖
第四章基于框架語義的深度學(xué)習(xí)共指消解方法21第四章基于框架語義的深度學(xué)習(xí)共指消解方法本章在LSTM模型的基礎(chǔ)上,加入框架語義信息,提出基于LSTM共指消解方法。漢語框架標(biāo)注資源作為知識(shí)能更好的應(yīng)用深度學(xué)習(xí)解決共指問題,但標(biāo)注的框架資源無法直接參與計(jì)算,要想通過深度學(xué)習(xí)的算法處理,首先需要用合適的方法將標(biāo)注的信息經(jīng)過自然語言符號(hào)的數(shù)學(xué)化表示之后,再完成深度學(xué)習(xí)模型的訓(xùn)練。4.1用三元組表示漢語框架知識(shí)為了方便框架語義的處理和計(jì)算機(jī)理解,本文采用結(jié)構(gòu)化、形式化的方式表示框架語義信息,使用類似三元組的方式。三元組是知識(shí)表示中最常見的格式,漢語框架網(wǎng)作為知識(shí)庫的一種,在資源中有實(shí)體和關(guān)系標(biāo)注,可以簡(jiǎn)單的把框架關(guān)系理解為(實(shí)體,關(guān)系,實(shí)體)三元組。如果把框架中的實(shí)體表述看作是結(jié)點(diǎn),把表述在框架中的關(guān)系看作是一條邊,那么包含了大量三元組的框架知識(shí)庫就成為了一個(gè)龐大的框架知識(shí)圖。下面介紹漢語框架網(wǎng)中兩種關(guān)系類型。截取表2.2的部分語料,構(gòu)建漢語框架核心元素關(guān)系圖(圖4.1)和偏好選擇關(guān)系圖(圖4.2)。圖4.1漢語框架核心元素關(guān)系圖圖4.1中表示的是漢語框架網(wǎng)中框架與框架內(nèi)的核心框架元素。本文認(rèn)為,框架元素表示一段文本或者一句話中最重要的語義成分,其內(nèi)容更容易與其他成分存在共指關(guān)系,特別是在段落或者篇章中,這種關(guān)系更加明顯。如上所示的框架核心元素表示成三元組(春生子,狀態(tài),長(zhǎng)白山溪流中的小魚),(它們,死亡,NULL),(人們,命名,它們),(人們,命名,魚食)等。圖4.2選擇偏好關(guān)系圖
本文編號(hào):3267502
【文章來源】:山西大學(xué)山西省
【文章頁數(shù)】:57 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
基于框架語義的共指消解框架圖
第四章基于框架語義的深度學(xué)習(xí)共指消解方法21第四章基于框架語義的深度學(xué)習(xí)共指消解方法本章在LSTM模型的基礎(chǔ)上,加入框架語義信息,提出基于LSTM共指消解方法。漢語框架標(biāo)注資源作為知識(shí)能更好的應(yīng)用深度學(xué)習(xí)解決共指問題,但標(biāo)注的框架資源無法直接參與計(jì)算,要想通過深度學(xué)習(xí)的算法處理,首先需要用合適的方法將標(biāo)注的信息經(jīng)過自然語言符號(hào)的數(shù)學(xué)化表示之后,再完成深度學(xué)習(xí)模型的訓(xùn)練。4.1用三元組表示漢語框架知識(shí)為了方便框架語義的處理和計(jì)算機(jī)理解,本文采用結(jié)構(gòu)化、形式化的方式表示框架語義信息,使用類似三元組的方式。三元組是知識(shí)表示中最常見的格式,漢語框架網(wǎng)作為知識(shí)庫的一種,在資源中有實(shí)體和關(guān)系標(biāo)注,可以簡(jiǎn)單的把框架關(guān)系理解為(實(shí)體,關(guān)系,實(shí)體)三元組。如果把框架中的實(shí)體表述看作是結(jié)點(diǎn),把表述在框架中的關(guān)系看作是一條邊,那么包含了大量三元組的框架知識(shí)庫就成為了一個(gè)龐大的框架知識(shí)圖。下面介紹漢語框架網(wǎng)中兩種關(guān)系類型。截取表2.2的部分語料,構(gòu)建漢語框架核心元素關(guān)系圖(圖4.1)和偏好選擇關(guān)系圖(圖4.2)。圖4.1漢語框架核心元素關(guān)系圖圖4.1中表示的是漢語框架網(wǎng)中框架與框架內(nèi)的核心框架元素。本文認(rèn)為,框架元素表示一段文本或者一句話中最重要的語義成分,其內(nèi)容更容易與其他成分存在共指關(guān)系,特別是在段落或者篇章中,這種關(guān)系更加明顯。如上所示的框架核心元素表示成三元組(春生子,狀態(tài),長(zhǎng)白山溪流中的小魚),(它們,死亡,NULL),(人們,命名,它們),(人們,命名,魚食)等。圖4.2選擇偏好關(guān)系圖
第四章基于框架語義的深度學(xué)習(xí)共指消解方法21第四章基于框架語義的深度學(xué)習(xí)共指消解方法本章在LSTM模型的基礎(chǔ)上,加入框架語義信息,提出基于LSTM共指消解方法。漢語框架標(biāo)注資源作為知識(shí)能更好的應(yīng)用深度學(xué)習(xí)解決共指問題,但標(biāo)注的框架資源無法直接參與計(jì)算,要想通過深度學(xué)習(xí)的算法處理,首先需要用合適的方法將標(biāo)注的信息經(jīng)過自然語言符號(hào)的數(shù)學(xué)化表示之后,再完成深度學(xué)習(xí)模型的訓(xùn)練。4.1用三元組表示漢語框架知識(shí)為了方便框架語義的處理和計(jì)算機(jī)理解,本文采用結(jié)構(gòu)化、形式化的方式表示框架語義信息,使用類似三元組的方式。三元組是知識(shí)表示中最常見的格式,漢語框架網(wǎng)作為知識(shí)庫的一種,在資源中有實(shí)體和關(guān)系標(biāo)注,可以簡(jiǎn)單的把框架關(guān)系理解為(實(shí)體,關(guān)系,實(shí)體)三元組。如果把框架中的實(shí)體表述看作是結(jié)點(diǎn),把表述在框架中的關(guān)系看作是一條邊,那么包含了大量三元組的框架知識(shí)庫就成為了一個(gè)龐大的框架知識(shí)圖。下面介紹漢語框架網(wǎng)中兩種關(guān)系類型。截取表2.2的部分語料,構(gòu)建漢語框架核心元素關(guān)系圖(圖4.1)和偏好選擇關(guān)系圖(圖4.2)。圖4.1漢語框架核心元素關(guān)系圖圖4.1中表示的是漢語框架網(wǎng)中框架與框架內(nèi)的核心框架元素。本文認(rèn)為,框架元素表示一段文本或者一句話中最重要的語義成分,其內(nèi)容更容易與其他成分存在共指關(guān)系,特別是在段落或者篇章中,這種關(guān)系更加明顯。如上所示的框架核心元素表示成三元組(春生子,狀態(tài),長(zhǎng)白山溪流中的小魚),(它們,死亡,NULL),(人們,命名,它們),(人們,命名,魚食)等。圖4.2選擇偏好關(guān)系圖
本文編號(hào):3267502
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3267502.html
最近更新
教材專著