基于深度學(xué)習(xí)的二句式非充盈態(tài)漢語(yǔ)復(fù)句的關(guān)系識(shí)別
發(fā)布時(shí)間:2021-09-28 02:51
漢語(yǔ)復(fù)句的關(guān)系識(shí)別是對(duì)分句間語(yǔ)義關(guān)系的甄別,是復(fù)句語(yǔ)義分析的關(guān)鍵,旨在從文本中識(shí)別句間的關(guān)系類(lèi)型。對(duì)于復(fù)句關(guān)系類(lèi)型識(shí)別的研究有助于推動(dòng)機(jī)器翻譯、智能問(wèn)答、自動(dòng)生成文摘等領(lǐng)域的發(fā)展,進(jìn)而提高其整體性能。由于漢語(yǔ)復(fù)句中非充盈態(tài)有標(biāo)復(fù)句的關(guān)系標(biāo)記不能夠顯性的表明復(fù)句所含的關(guān)系類(lèi)型,所以,給此類(lèi)復(fù)句的語(yǔ)義關(guān)系識(shí)別任務(wù)造成了困難。而本文將展開(kāi)對(duì)非充盈態(tài)復(fù)句關(guān)系類(lèi)別識(shí)別的研究,F(xiàn)有的較為主流的復(fù)句關(guān)系識(shí)別方法主要有兩種,一種是基于語(yǔ)言學(xué)規(guī)則的,該方法主要是由語(yǔ)言學(xué)家針對(duì)大量的語(yǔ)料文本歸納總結(jié)的約束條件,并且建立的相應(yīng)規(guī)則庫(kù)。而另一種則是利用統(tǒng)計(jì)學(xué)方法,在大規(guī)模語(yǔ)料庫(kù)中提取出復(fù)句的詞面、字面上的特征,從而構(gòu)建基于語(yǔ)料文本的特征工程。然而,這些方法所得到的特征集泛化性能較差,以至于識(shí)別的正確率不高。另外,特征的工程量較大,需耗費(fèi)大量的人工和時(shí)間。為了能夠深度地挖掘復(fù)句的特征集和復(fù)句蘊(yùn)含的語(yǔ)義信息特征以及捕獲到復(fù)句內(nèi)分句間相互作用的語(yǔ)義關(guān)聯(lián)信息,本文首次將深度學(xué)習(xí)方法應(yīng)用到漢語(yǔ)復(fù)句語(yǔ)義關(guān)系處理中,并引入詞嵌入模型對(duì)復(fù)句進(jìn)行單詞建模。本文所做的工作有:首先,本文采用從《長(zhǎng)江日?qǐng)?bào)》和《人民日?qǐng)?bào)》以及部分當(dāng)代...
【文章來(lái)源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.4基于深度學(xué)習(xí)的復(fù)句關(guān)系識(shí)別方法的模型流程圖??如上圖所示,利用深度學(xué)習(xí)的方法對(duì)句子建模,首先將輸入的句子進(jìn)行分詞,??,
關(guān)系標(biāo)記庫(kù)主要是由關(guān)系標(biāo)記以及關(guān)系標(biāo)記之間所存在的搭配關(guān)系所構(gòu)成??的語(yǔ)料數(shù)據(jù)庫(kù)。關(guān)系標(biāo)記即為關(guān)系詞,關(guān)系詞在整個(gè)復(fù)句中扮演著重要的角色,??其起著連接復(fù)句分句的作用,對(duì)復(fù)句的語(yǔ)義關(guān)系有著顯性和隱性的標(biāo)識(shí)作用。因??此,關(guān)系詞在復(fù)句關(guān)系類(lèi)別識(shí)別任務(wù)中是不可忽視的重要特征。復(fù)句的關(guān)系標(biāo)記??和關(guān)系類(lèi)別往往不是一對(duì)一的關(guān)系,其存在著“一對(duì)多”和“多對(duì)一”的關(guān)系映??射,一種關(guān)系標(biāo)記可以標(biāo)識(shí)多種關(guān)系類(lèi)別,即在不同語(yǔ)境下呈現(xiàn)不同的關(guān)系類(lèi)別。??同樣,一種關(guān)系類(lèi)別可以由多個(gè)關(guān)系標(biāo)記進(jìn)行標(biāo)識(shí)。如圖2.1所示,針對(duì)大規(guī)模??語(yǔ)料的篩選和統(tǒng)計(jì),得到關(guān)系標(biāo)記以及所屬關(guān)系類(lèi)別的范疇,并且包含關(guān)系標(biāo)記、??詞類(lèi)、單用或是搭配組合等屬性特征,構(gòu)建了所有關(guān)系標(biāo)記包含的屬性字段特征,??具體如圖2.1所示。??□?id?wordl?word2?juli?kind?num??□?224?可衛(wèi)?3二哽=?0?舌杲??□?225?瑢受?B之萣與?0?、11??□?226?@乎?5今立使馬?〇?區(qū)杲?11??□^227?不籜?樁立使司?〇?轉(zhuǎn)折?12??□?228?有鑒子迸?錢(qián)立度月?〇?區(qū)哭?11??□?229?是?孩立萣甲?u?12??□?230?淮知運(yùn)?獨(dú)立使弔?0?轉(zhuǎn)折?12??□?231?唯猝?獨(dú)立使葙?〇?轉(zhuǎn)折?12??□?232?惟狨?狨之使與?〇?轉(zhuǎn)折?12??□?233?無(wú)奈?獨(dú)立便司?〇?轉(zhuǎn)折?12??□?234?怎奈?v=-lS=?〇?耔?。?12??□?235?可笮?獨(dú)之便.司?〇?轉(zhuǎn)折?12??□?236?只可節(jié)?
士學(xué)位論文??MASTKR'S?THESIS??90.000??_。|?-…?-??70.000? ̄????60.000?????50.000?????40.000? ̄????30.000?-??■?■???20.000?-??■?■?■???:thd—JLln]??并?遞?目?因?連?轉(zhuǎn)假讓?假條推?a??列?進(jìn)?的?果?貨?折轉(zhuǎn)步?設(shè)件斷?》??圖2.4?12類(lèi)關(guān)系標(biāo)記出現(xiàn)頻次??根據(jù)上圖顯示,并列關(guān)系、轉(zhuǎn)折關(guān)系出現(xiàn)的頻率最多,之后便是遞進(jìn)和因果??關(guān)系,由于遞進(jìn)關(guān)系隸屬于并列關(guān)系,因此可得出現(xiàn)頻次最多的關(guān)系類(lèi)別為并列、??因果、轉(zhuǎn)折關(guān)系類(lèi)型。這也恰恰印證了由邢福義先生所提出復(fù)句的三分系統(tǒng)即復(fù)??句關(guān)系類(lèi)別的三分法:并列類(lèi)別、轉(zhuǎn)折類(lèi)別、因果類(lèi)別。因此,這也是本文使用??該三大類(lèi)作為分類(lèi)結(jié)果的原因所在。本文中MNCST語(yǔ)料庫(kù)幾種關(guān)系類(lèi)別的分布??情況如表2.2所示:??表2.2三大關(guān)系類(lèi)別分布??關(guān)系類(lèi)型?|總計(jì)? ̄ ̄比例??因果大類(lèi)?3224?24.40%??并列大類(lèi)?7960?60.24%??轉(zhuǎn)折大類(lèi)?2031?15.37%??2.4相關(guān)研究方法和實(shí)現(xiàn)技術(shù)??2.?4.?1?CNN?和?BI-LSTM??卷積神經(jīng)網(wǎng)絡(luò)(Convolutional?Neura丨?Network,CNN)最早由?Hubei?和?Wiesel1"]??在20世紀(jì)60年代提出,經(jīng)過(guò)幾十年的發(fā)展目前CNN已經(jīng)被廣泛應(yīng)用于多個(gè)領(lǐng)??域中,其最初被應(yīng)用于圖像處理145],目標(biāo)檢測(cè)甚至醫(yī)藥發(fā)現(xiàn)等相關(guān)領(lǐng)域。??近年來(lái),在自然語(yǔ)言處理領(lǐng)域中己得到了部分應(yīng)用,并且取得了較
【參考文獻(xiàn)】:
期刊論文
[1]基于多任務(wù)雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的隱式句間關(guān)系分析[J]. 田文洪,高印權(quán),黃厚文,黎在萬(wàn),張朝陽(yáng). 中文信息學(xué)報(bào). 2019(05)
[2]二句式非充盈態(tài)有標(biāo)復(fù)句關(guān)系類(lèi)別的自動(dòng)標(biāo)志[J]. 楊進(jìn)才,陳忠忠,沈顯君,胡金柱. 計(jì)算機(jī)應(yīng)用研究. 2017(10)
[3]漢語(yǔ)復(fù)句信息處理研究二十年[J]. 吳鋒文. 中文信息學(xué)報(bào). 2015(01)
[4]《語(yǔ)法修辭講話》[J]. 呂叔湘,朱德熙. 中國(guó)科技術(shù)語(yǔ). 2014(05)
[5]基于清華漢語(yǔ)樹(shù)庫(kù)的復(fù)句關(guān)系詞識(shí)別與分類(lèi)研究[J]. 李艷翠,孫靜,周?chē)?guó)棟,馮文賀. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(01)
[6]基于規(guī)則的連用關(guān)系標(biāo)記的自動(dòng)標(biāo)識(shí)研究[J]. 胡金柱,陳江曼,楊進(jìn)才,舒江波,雷利利. 計(jì)算機(jī)科學(xué). 2012(07)
[7]基于關(guān)系標(biāo)記的漢語(yǔ)復(fù)句分類(lèi)研究[J]. 吳鋒文. 漢語(yǔ)學(xué)報(bào). 2011(03)
[8]基于詞性信息自動(dòng)識(shí)別和標(biāo)注非分句[J]. 李瓊,李志. 長(zhǎng)春工程學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版). 2011(01)
[9]漢語(yǔ)復(fù)句關(guān)系詞庫(kù)的建設(shè)及其利用[J]. 胡金柱,吳鋒文,李瓊,舒江波. 語(yǔ)言科學(xué). 2010(02)
[10]面向中文信息處理的復(fù)句關(guān)系詞提取算法研究[J]. 胡金柱,舒江波,姚雙云,周星,吳鋒文,肖升. 計(jì)算機(jī)工程與科學(xué). 2009(10)
碩士論文
[1]漢語(yǔ)復(fù)句關(guān)系自動(dòng)判定研究[D]. 洪鹿平.南京師范大學(xué) 2008
本文編號(hào):3411101
【文章來(lái)源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.4基于深度學(xué)習(xí)的復(fù)句關(guān)系識(shí)別方法的模型流程圖??如上圖所示,利用深度學(xué)習(xí)的方法對(duì)句子建模,首先將輸入的句子進(jìn)行分詞,??,
關(guān)系標(biāo)記庫(kù)主要是由關(guān)系標(biāo)記以及關(guān)系標(biāo)記之間所存在的搭配關(guān)系所構(gòu)成??的語(yǔ)料數(shù)據(jù)庫(kù)。關(guān)系標(biāo)記即為關(guān)系詞,關(guān)系詞在整個(gè)復(fù)句中扮演著重要的角色,??其起著連接復(fù)句分句的作用,對(duì)復(fù)句的語(yǔ)義關(guān)系有著顯性和隱性的標(biāo)識(shí)作用。因??此,關(guān)系詞在復(fù)句關(guān)系類(lèi)別識(shí)別任務(wù)中是不可忽視的重要特征。復(fù)句的關(guān)系標(biāo)記??和關(guān)系類(lèi)別往往不是一對(duì)一的關(guān)系,其存在著“一對(duì)多”和“多對(duì)一”的關(guān)系映??射,一種關(guān)系標(biāo)記可以標(biāo)識(shí)多種關(guān)系類(lèi)別,即在不同語(yǔ)境下呈現(xiàn)不同的關(guān)系類(lèi)別。??同樣,一種關(guān)系類(lèi)別可以由多個(gè)關(guān)系標(biāo)記進(jìn)行標(biāo)識(shí)。如圖2.1所示,針對(duì)大規(guī)模??語(yǔ)料的篩選和統(tǒng)計(jì),得到關(guān)系標(biāo)記以及所屬關(guān)系類(lèi)別的范疇,并且包含關(guān)系標(biāo)記、??詞類(lèi)、單用或是搭配組合等屬性特征,構(gòu)建了所有關(guān)系標(biāo)記包含的屬性字段特征,??具體如圖2.1所示。??□?id?wordl?word2?juli?kind?num??□?224?可衛(wèi)?3二哽=?0?舌杲??□?225?瑢受?B之萣與?0?、11??□?226?@乎?5今立使馬?〇?區(qū)杲?11??□^227?不籜?樁立使司?〇?轉(zhuǎn)折?12??□?228?有鑒子迸?錢(qián)立度月?〇?區(qū)哭?11??□?229?是?孩立萣甲?u?12??□?230?淮知運(yùn)?獨(dú)立使弔?0?轉(zhuǎn)折?12??□?231?唯猝?獨(dú)立使葙?〇?轉(zhuǎn)折?12??□?232?惟狨?狨之使與?〇?轉(zhuǎn)折?12??□?233?無(wú)奈?獨(dú)立便司?〇?轉(zhuǎn)折?12??□?234?怎奈?v=-lS=?〇?耔?。?12??□?235?可笮?獨(dú)之便.司?〇?轉(zhuǎn)折?12??□?236?只可節(jié)?
士學(xué)位論文??MASTKR'S?THESIS??90.000??_。|?-…?-??70.000? ̄????60.000?????50.000?????40.000? ̄????30.000?-??■?■???20.000?-??■?■?■???:thd—JLln]??并?遞?目?因?連?轉(zhuǎn)假讓?假條推?a??列?進(jìn)?的?果?貨?折轉(zhuǎn)步?設(shè)件斷?》??圖2.4?12類(lèi)關(guān)系標(biāo)記出現(xiàn)頻次??根據(jù)上圖顯示,并列關(guān)系、轉(zhuǎn)折關(guān)系出現(xiàn)的頻率最多,之后便是遞進(jìn)和因果??關(guān)系,由于遞進(jìn)關(guān)系隸屬于并列關(guān)系,因此可得出現(xiàn)頻次最多的關(guān)系類(lèi)別為并列、??因果、轉(zhuǎn)折關(guān)系類(lèi)型。這也恰恰印證了由邢福義先生所提出復(fù)句的三分系統(tǒng)即復(fù)??句關(guān)系類(lèi)別的三分法:并列類(lèi)別、轉(zhuǎn)折類(lèi)別、因果類(lèi)別。因此,這也是本文使用??該三大類(lèi)作為分類(lèi)結(jié)果的原因所在。本文中MNCST語(yǔ)料庫(kù)幾種關(guān)系類(lèi)別的分布??情況如表2.2所示:??表2.2三大關(guān)系類(lèi)別分布??關(guān)系類(lèi)型?|總計(jì)? ̄ ̄比例??因果大類(lèi)?3224?24.40%??并列大類(lèi)?7960?60.24%??轉(zhuǎn)折大類(lèi)?2031?15.37%??2.4相關(guān)研究方法和實(shí)現(xiàn)技術(shù)??2.?4.?1?CNN?和?BI-LSTM??卷積神經(jīng)網(wǎng)絡(luò)(Convolutional?Neura丨?Network,CNN)最早由?Hubei?和?Wiesel1"]??在20世紀(jì)60年代提出,經(jīng)過(guò)幾十年的發(fā)展目前CNN已經(jīng)被廣泛應(yīng)用于多個(gè)領(lǐng)??域中,其最初被應(yīng)用于圖像處理145],目標(biāo)檢測(cè)甚至醫(yī)藥發(fā)現(xiàn)等相關(guān)領(lǐng)域。??近年來(lái),在自然語(yǔ)言處理領(lǐng)域中己得到了部分應(yīng)用,并且取得了較
【參考文獻(xiàn)】:
期刊論文
[1]基于多任務(wù)雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的隱式句間關(guān)系分析[J]. 田文洪,高印權(quán),黃厚文,黎在萬(wàn),張朝陽(yáng). 中文信息學(xué)報(bào). 2019(05)
[2]二句式非充盈態(tài)有標(biāo)復(fù)句關(guān)系類(lèi)別的自動(dòng)標(biāo)志[J]. 楊進(jìn)才,陳忠忠,沈顯君,胡金柱. 計(jì)算機(jī)應(yīng)用研究. 2017(10)
[3]漢語(yǔ)復(fù)句信息處理研究二十年[J]. 吳鋒文. 中文信息學(xué)報(bào). 2015(01)
[4]《語(yǔ)法修辭講話》[J]. 呂叔湘,朱德熙. 中國(guó)科技術(shù)語(yǔ). 2014(05)
[5]基于清華漢語(yǔ)樹(shù)庫(kù)的復(fù)句關(guān)系詞識(shí)別與分類(lèi)研究[J]. 李艷翠,孫靜,周?chē)?guó)棟,馮文賀. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(01)
[6]基于規(guī)則的連用關(guān)系標(biāo)記的自動(dòng)標(biāo)識(shí)研究[J]. 胡金柱,陳江曼,楊進(jìn)才,舒江波,雷利利. 計(jì)算機(jī)科學(xué). 2012(07)
[7]基于關(guān)系標(biāo)記的漢語(yǔ)復(fù)句分類(lèi)研究[J]. 吳鋒文. 漢語(yǔ)學(xué)報(bào). 2011(03)
[8]基于詞性信息自動(dòng)識(shí)別和標(biāo)注非分句[J]. 李瓊,李志. 長(zhǎng)春工程學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版). 2011(01)
[9]漢語(yǔ)復(fù)句關(guān)系詞庫(kù)的建設(shè)及其利用[J]. 胡金柱,吳鋒文,李瓊,舒江波. 語(yǔ)言科學(xué). 2010(02)
[10]面向中文信息處理的復(fù)句關(guān)系詞提取算法研究[J]. 胡金柱,舒江波,姚雙云,周星,吳鋒文,肖升. 計(jì)算機(jī)工程與科學(xué). 2009(10)
碩士論文
[1]漢語(yǔ)復(fù)句關(guān)系自動(dòng)判定研究[D]. 洪鹿平.南京師范大學(xué) 2008
本文編號(hào):3411101
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3411101.html
最近更新
教材專(zhuān)著