天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

基于卷積神經(jīng)網(wǎng)絡(luò)的中文實體消歧研究

發(fā)布時間:2017-12-16 20:21

  本文關(guān)鍵詞:基于卷積神經(jīng)網(wǎng)絡(luò)的中文實體消歧研究


  更多相關(guān)文章: 實體消歧 卷積神經(jīng)網(wǎng)絡(luò) 詞向量 語義表示


【摘要】:隨著移動互聯(lián)網(wǎng)的普及,微博、博客、貼吧、論壇、各大新聞網(wǎng)站和政府工作網(wǎng)站等極大的方便了人民的生活。這些平臺上每時每刻都在產(chǎn)生著大量的數(shù)據(jù),而這些數(shù)據(jù)蘊含著巨大的價值,但它們絕大部分都是以非結(jié)構(gòu)化或半結(jié)構(gòu)化的形式存在,導(dǎo)致這些數(shù)據(jù)中存在著大量的歧義現(xiàn)象,如何利用這些數(shù)據(jù)就對自然語言處理技術(shù)提出了更多的挑戰(zhàn)。中文詞義消歧和實體消歧,正是在這種環(huán)境下逐漸發(fā)展起來。目前主流的實體消歧算法底層模型多是基于詞袋模型,而詞袋模型固有的局限性,導(dǎo)致這些算法都不能夠充分利用上下文的語義信息。本文針對詞袋模型難以捕捉上下文語義信息的缺點,提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的中文實體消歧方法。本文的主要工作包括以下幾個部分:(1)針對詞袋模型難以對實體上下文信息進(jìn)行語義描述的問題,設(shè)計了一種基于卷積神經(jīng)網(wǎng)絡(luò)的方法來獲得實體上下文的語義信息,該方法將實體上下文中名詞的詞向量矩陣作為神經(jīng)網(wǎng)絡(luò)的輸入,繼而通過卷積運算,生成實體上下文的語義特征向量;(2)基于語義特征向量,在模型訓(xùn)練時,以最大化待消歧實體與真正目標(biāo)實體的相似度和待消歧實體與任一隨機(jī)選擇的候選實體的相似度之差作為訓(xùn)練目標(biāo),調(diào)整模型的參數(shù),在模型預(yù)測時,取相似度最大的知識庫候選實體作為最終目標(biāo)實體;(3)本文對第二屆CIPS-SIGHAN中文處理國際會議(CLP-2012)第二個評測任務(wù)"中文人名消歧任務(wù)"提供的數(shù)據(jù)集進(jìn)行了預(yù)處理,得到本文所用數(shù)據(jù)集并進(jìn)行了實驗。實驗結(jié)果顯示,本文提出的基于卷積神經(jīng)網(wǎng)絡(luò)的方法對中文實體消歧是可行的、有效的。
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.1;TP183

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前7條

1 陽怡林;周杰;李弼程;席耀一;;基于分步聚類的人名消歧算法[J];數(shù)據(jù)采集與處理;2016年01期

2 楊光;劉秉權(quán);劉銘;;基于圖方法的命名實體消歧[J];智能計算機(jī)與應(yīng)用;2015年05期

3 譚詠梅;楊雪;;結(jié)合實體鏈接與實體聚類的命名實體消歧[J];北京郵電大學(xué)學(xué)報;2014年05期

4 杜婧君;陸蓓;諶志群;;基于中文維基百科的命名實體消歧方法[J];杭州電子科技大學(xué)學(xué)報;2012年06期

5 王英帥;李培峰;朱巧明;;一種基于LDA和上下文摘要的Web人名消歧方法[J];計算機(jī)應(yīng)用與軟件;2011年07期

6 楊欣欣;李培峰;朱巧明;王英帥;;一種基于改進(jìn)的K-means算法的人名消歧系統(tǒng)的設(shè)計與實現(xiàn)[J];計算機(jī)與數(shù)字工程;2010年08期

7 趙軍;;命名實體識別、排歧和跨語言關(guān)聯(lián)[J];中文信息學(xué)報;2009年02期

,

本文編號:1297340

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1297340.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶bfd1a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com