天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

漢語表述識(shí)別與指代消解

發(fā)布時(shí)間:2021-01-15 08:15
  使用傳統(tǒng)的機(jī)器學(xué)習(xí)方法構(gòu)建漢語指代消解基準(zhǔn)平臺(tái),當(dāng)引入表述識(shí)別二次分類器后,基準(zhǔn)平臺(tái)的性能并沒有獲得提升。針對(duì)該問題,提出一種改進(jìn)的表述識(shí)別方法。改進(jìn)的表述識(shí)別方法只針對(duì)代詞、專有名詞進(jìn)行分類過濾,而對(duì)所有的普通名詞短語予以保留。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)基于規(guī)則的表述識(shí)別方法相比,改進(jìn)方法可以有效提升全自動(dòng)的漢語指代消解性能。 

【文章來源】:計(jì)算機(jī)工程. 2016,42(09)北大核心

【文章頁數(shù)】:6 頁

【部分圖文】:

漢語表述識(shí)別與指代消解


基于機(jī)器學(xué)習(xí)方法的漢語指代消解平臺(tái)預(yù)處理系統(tǒng)主要包括分句、分詞、詞性標(biāo)注、句所包含

指代,詞性標(biāo)注,機(jī)器學(xué)習(xí),預(yù)處理系統(tǒng)


計(jì)算機(jī)工程2016年9月15日4基于機(jī)器學(xué)習(xí)的漢語指代消解基準(zhǔn)平臺(tái)本節(jié)在瀏覽了基準(zhǔn)平臺(tái)的構(gòu)成后,給出了其在CoNLL-2012SharedTask[21]漢語語料上使用官方評(píng)測(cè)工具得到的結(jié)果,并對(duì)結(jié)果進(jìn)行了分析。4.1基準(zhǔn)平臺(tái)的基本構(gòu)成與目前大多數(shù)指代消解研究類似,本文使用Soon等提出的基于機(jī)器學(xué)習(xí)的指代消解平臺(tái)作為實(shí)驗(yàn)的基準(zhǔn)系統(tǒng),它的基本構(gòu)成如圖1所示。圖1基于機(jī)器學(xué)習(xí)方法的漢語指代消解平臺(tái)預(yù)處理系統(tǒng)主要包括分句、分詞、詞性標(biāo)注、句法分析、表述提娶命名實(shí)體識(shí)別和語義信息獲取等。為了后續(xù)公平地與其他系統(tǒng)進(jìn)行比較,本文使用CoNLL-2012SharedTask提供的自動(dòng)分句、分詞、詞性標(biāo)注、句法分析、命名實(shí)體識(shí)別和語義類別等預(yù)處理信息。至于表述的提取,這是本文研究的重點(diǎn)。在基準(zhǔn)系統(tǒng)中,借助規(guī)則生成了一個(gè)表述提取器。首先在自動(dòng)句法樹上提取所有的NP,QP和POS為PN和NR的終端結(jié)點(diǎn),形成一個(gè)表述候選集。接著從候選集中去除量詞,去除類別為PERCENT,MONEY,QUANTITY和CARDINAL的命名實(shí)體;最后從候選集中去除諸如“什么”,“哪兒”之類的疑問代詞。這樣就得到了一個(gè)高召回率、低準(zhǔn)確率的自動(dòng)表述集合。在機(jī)器學(xué)習(xí)方法中,特征選擇是影響系統(tǒng)最終性能的關(guān)鍵要素之一。本文在選擇使用特征時(shí),遵循以下的標(biāo)準(zhǔn):特征的屬性具有非常普遍的代表性,并且它們之間沒有任何的重疊或者矛盾,每一個(gè)屬性概念都很明確清晰,不存在二義性。本文系統(tǒng)在特征向量的選擇上使用了Soon等使用的特征。限于篇幅,特征集請(qǐng)參見相關(guān)論文。在基準(zhǔn)系統(tǒng)的構(gòu)建過程中,另一個(gè)核心環(huán)節(jié)就是樣例的生成。在訓(xùn)練時(shí),對(duì)于每一個(gè)表述,先確定該表述是否存在于訓(xùn)練語料的某個(gè)指代鏈中。如果該表述沒有被某個(gè)指代鏈所包含,那么被認(rèn)為非待消解項(xiàng),

【參考文獻(xiàn)】:
期刊論文
[1]篇章中指代消解研究綜述[J]. 周炫余,劉娟,盧笑.  武漢大學(xué)學(xué)報(bào)(理學(xué)版). 2014(01)
[2]中英文指代消解中待消解項(xiàng)識(shí)別的研究[J]. 孔芳,朱巧明,周國棟.  計(jì)算機(jī)研究與發(fā)展. 2012(05)
[3]基于樹核函數(shù)的中英文代詞消解[J]. 孔芳,周國棟.  軟件學(xué)報(bào). 2012(05)
[4]指代消解綜述[J]. 孔芳,周國棟,朱巧明,錢培德.  計(jì)算機(jī)工程. 2010(08)
[5]基于中心理論的指代消解研究[J]. 孔芳,朱巧明,周國棟,錢培德.  計(jì)算機(jī)科學(xué). 2009(06)
[6]句法與詞義相結(jié)合的中文代詞消解[J]. 宋巍,秦兵,郎君,劉挺.  中文信息學(xué)報(bào). 2008(06)

博士論文
[1]指代消解關(guān)鍵問題研究[D]. 孔芳.蘇州大學(xué) 2009



本文編號(hào):2978566

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2978566.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶852c6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com