基于深度學(xué)習(xí)的中文機(jī)構(gòu)名識別研究——一種漢字級別的循環(huán)神經(jīng)網(wǎng)絡(luò)方法
本文關(guān)鍵詞:基于深度學(xué)習(xí)的中文機(jī)構(gòu)名識別研究——一種漢字級別的循環(huán)神經(jīng)網(wǎng)絡(luò)方法
更多相關(guān)文章: 機(jī)構(gòu)名識別 循環(huán)神經(jīng)網(wǎng)絡(luò) 深度學(xué)習(xí)
【摘要】:【目的】中文機(jī)構(gòu)名結(jié)構(gòu)復(fù)雜、罕見詞多,識別難度大,對其進(jìn)行正確識別對于信息抽取、信息檢索、知識挖掘和機(jī)構(gòu)科研評價(jià)等情報(bào)學(xué)中的后續(xù)任務(wù)意義重大!痉椒ā炕谏疃葘W(xué)習(xí)的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)方法,面向中文漢字和詞的特點(diǎn),重新定義了機(jī)構(gòu)名標(biāo)注的輸入和輸出,提出漢字級別的循環(huán)網(wǎng)絡(luò)標(biāo)注模型!窘Y(jié)果】以詞級別的循環(huán)神經(jīng)網(wǎng)絡(luò)方法為基準(zhǔn),本文提出的字級別模型在中文機(jī)構(gòu)名識別的準(zhǔn)確率、召回率和F值均有明顯提高,其中F值提高了1.54%。在包含罕見詞時(shí)提高更為明顯,F值提高了11.05%!揪窒蕖吭诮獯a時(shí)直接使用了貪心策略,易于陷入局部最優(yōu),如果使用條件隨機(jī)場算法進(jìn)行建?赡塬@取全局最優(yōu)結(jié)果!窘Y(jié)論】本文方法構(gòu)架簡單,能利用到漢字級別的特征來進(jìn)行建模,比只使用詞特征取得了更好的結(jié)果。
【作者單位】: 江蘇警官學(xué)院圖書館;南京大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系;南京交通技師學(xué)院中(高)職教育處;南京農(nóng)業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院;
【基金】:江蘇省高校哲學(xué)社會科學(xué)項(xiàng)目“高校危機(jī)管理案例知識庫構(gòu)建及知識挖掘研究”(項(xiàng)目編號:2014SJB246) 江蘇省警官學(xué)院“公安學(xué)術(shù)語自動(dòng)抽取技術(shù)研究”(項(xiàng)目編號:2015SJYZQ01) 國家自然科學(xué)基金項(xiàng)目“基于CSSCI的句法級漢英平行語料庫構(gòu)建及知識挖掘研究”(項(xiàng)目編號:71303120)的研究成果之一
【分類號】:TP391.1;TP183
【正文快照】: 1引言機(jī)構(gòu)泛指機(jī)關(guān)、團(tuán)體或其他企事業(yè)單位,包括院校、公私企業(yè)、政府部門、宗教組織、科研部門、國際組織、體育團(tuán)隊(duì)、音樂團(tuán)體、軍隊(duì)等[1]。機(jī)構(gòu)名的識別效果對信息抽取、信息檢索、知識挖掘和機(jī)構(gòu)科研評價(jià)等后續(xù)任務(wù)起著重要的影響。然而,中文機(jī)構(gòu)名中罕見詞多、結(jié)構(gòu)復(fù)雜,
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王文軒;;基于構(gòu)成模式的部隊(duì)機(jī)構(gòu)名識別[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2013年34期
2 劉杰;;基于統(tǒng)計(jì)的中文機(jī)構(gòu)名實(shí)體識別的研究[J];佳木斯大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年03期
3 馮麗萍;;基于統(tǒng)計(jì)的中文組織機(jī)構(gòu)名識別[J];福建電腦;2006年01期
4 夏峗;李志蜀;;基于統(tǒng)計(jì)的中文機(jī)構(gòu)名自動(dòng)識別[J];四川大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年03期
5 鐘良伍;鄭方;;基于中文機(jī)構(gòu)名簡稱的檢索方法研究[J];中文信息學(xué)報(bào);2007年01期
6 韋向峰;張全;吳晨;袁毅;;中文問答系統(tǒng)中機(jī)構(gòu)名的處理[J];計(jì)算機(jī)工程與應(yīng)用;2008年07期
7 麥合甫熱提;米日姑·肉孜;麥熱哈巴·艾力;吐爾根·依布拉音;;基于語法語義知識的維吾爾文機(jī)構(gòu)名識別[J];計(jì)算機(jī)工程與設(shè)計(jì);2014年08期
8 馮麗萍;焦莉娟;;結(jié)合多特征的支持向量機(jī)中文組織機(jī)構(gòu)名識別模型[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2010年07期
9 胡萬亭;楊燕;尹紅風(fēng);賈真;劉利;;一種基于詞頻統(tǒng)計(jì)的組織機(jī)構(gòu)名識別方法[J];計(jì)算機(jī)應(yīng)用研究;2013年07期
10 陳慧;;中文組織機(jī)構(gòu)名命名規(guī)范化問題芻議[J];人文叢刊;2011年00期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 金朝;蔣宗禮;;中文機(jī)構(gòu)名的識別討論[A];2011高等職業(yè)教育電子信息類專業(yè)學(xué)術(shù)暨教學(xué)研討會論文集[C];2011年
2 雷靜;;漢語機(jī)構(gòu)名的構(gòu)成模式[A];語言計(jì)算與基于內(nèi)容的文本處理——全國第七屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2003年
3 雷靜;張舵;馮霞;;基于構(gòu)成模式的漢語機(jī)構(gòu)名識別[A];第四屆全國學(xué)生計(jì)算語言學(xué)研討會會議論文集[C];2008年
4 計(jì)峰;高沫;邱錫鵬;黃萱菁;;中文機(jī)構(gòu)名簡稱的自動(dòng)生成研究[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
5 吳雪軍;朱靖波;王會珍;葉娜;張宇新;;Co-Training的機(jī)器學(xué)習(xí)方法在中文機(jī)構(gòu)名識別中的應(yīng)用[A];語言計(jì)算與基于內(nèi)容的文本處理——全國第七屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2003年
中國重要報(bào)紙全文數(shù)據(jù)庫 前5條
1 ;《全國文化機(jī)構(gòu)名址錄》面世[N];中國文化報(bào);2003年
2 馬文;《全國文化機(jī)構(gòu)名址錄》出版[N];中國文化報(bào);2001年
3 記者 王俐君 通訊員 歐志紅;湖南名址信息庫建設(shè)強(qiáng)力啟動(dòng)[N];中國郵政報(bào);2003年
4 記者 劉蘇;2000多件證書展示證書文化[N];徐州日報(bào);2010年
5 記者 劉朝君;組織機(jī)構(gòu)名址庫年內(nèi)建成[N];中國郵政報(bào);2003年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 陳丹雙;POI(Point of Interest)名稱識別及其在對話導(dǎo)航系統(tǒng)中的應(yīng)用[D];復(fù)旦大學(xué);2013年
2 王樹偉;面向金融文本的實(shí)體識別與關(guān)系抽取研究[D];哈爾濱工業(yè)大學(xué);2014年
3 連譽(yù)舜;中文組織機(jī)構(gòu)名檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];上海交通大學(xué);2013年
4 萬如;中文機(jī)構(gòu)名識別的研究[D];大連理工大學(xué);2008年
5 烏蘭敖日格樂;中文軍事組織機(jī)構(gòu)名的識別[D];大連理工大學(xué);2010年
6 凌雅娟;新聞文本中的中文機(jī)構(gòu)名識別和機(jī)構(gòu)關(guān)系抽取研究[D];華東師范大學(xué);2013年
7 紅霞;基于層疊條件隨機(jī)場的中文機(jī)構(gòu)名識別的研究[D];大連理工大學(xué);2010年
8 陳霄;基于支持向量機(jī)的中文組織機(jī)構(gòu)名識別[D];上海交通大學(xué);2007年
9 米日姑·肉孜;維吾爾文機(jī)構(gòu)名識別研究[D];新疆大學(xué);2013年
10 楊德來;SVM和最大熵相結(jié)合的中文機(jī)構(gòu)名自動(dòng)識別[D];大連理工大學(xué);2006年
,本文編號:1304775
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1304775.html