基于深度學(xué)習(xí)的維吾爾語名詞短語指代消解
本文選題:深度學(xué)習(xí) 切入點(diǎn):棧式自編碼神經(jīng)網(wǎng)絡(luò) 出處:《自動化學(xué)報(bào)》2017年11期
【摘要】:針對維吾爾語名詞短語指代現(xiàn)象,提出了一種利用棧式自編碼深度學(xué)習(xí)算法進(jìn)行基于語義特征的指代消解方法.通過對維吾爾語名詞短語指稱性的研究,提取出利于消解任務(wù)的13項(xiàng)特征.為提高特征對文本語義的表達(dá),在特征集中引入富含詞匯語義及上下文位置關(guān)系的Word embedding.利用深度學(xué)習(xí)機(jī)制無監(jiān)督的提取隱含的深層語義特征,訓(xùn)練Softmax分類器進(jìn)而完成指代消解任務(wù).該方法在維吾爾語指代消解任務(wù)中的準(zhǔn)確率為74.5%,召回率為70.6%,F值為72.4%.實(shí)驗(yàn)結(jié)果證明,深度學(xué)習(xí)模型較淺層的支持向量機(jī)更合適于本文的指代消解任務(wù),對Word embedding特征項(xiàng)的引入,有效地提高了指代消解模型的性能.
[Abstract]:Aiming at the phenomenon of noun phrase anaphora in Uygur language, this paper proposes a method of anaphoric resolution based on semantic features using stack self-coding depth learning algorithm. In order to improve the expression of text semantics, Word embedding, which is rich in lexical semantics and contextual location, is introduced into the feature set. Softmax classifier was trained to accomplish the task of anaphoric digestion. The accuracy of this method in Uygur anaphora resolution task was 74.55.The recall rate was 70.6F and 72.4%. The depth learning model is more suitable for the task of anaphoric resolution than the shallow support vector machine. The introduction of Word embedding feature term can effectively improve the performance of the model.
【作者單位】: 新疆大學(xué)軟件學(xué)院;新疆大學(xué)網(wǎng)絡(luò)中心;新疆大學(xué)信息科學(xué)與工程學(xué)院;新疆大學(xué)人文學(xué)院;
【基金】:國家自然科學(xué)基金(61563051,61262064,61662074,61331011) 自治區(qū)科技人才培養(yǎng)項(xiàng)目(QN2016YX0051)資助~~
【分類號】:TP181;TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 羅亞偉;田生偉;禹龍;吐爾根·依布拉音;艾斯卡爾·艾木都拉;;意見挖掘中維吾爾語文本隱式情感分析[J];計(jì)算機(jī)工程與設(shè)計(jì);2014年09期
2 段祥超;禹龍;田生偉;吐爾根·依布拉音;艾斯卡爾·艾木都拉;;維吾爾語意見挖掘關(guān)系抽取研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2013年09期
3 程新方;吾守爾·斯拉木;;維吾爾語手機(jī)智能輸入法的研究與實(shí)現(xiàn)[J];新疆大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年01期
4 阿里甫·庫爾班;吾買爾江·庫爾班;吐爾根·伊布拉音;;面向信息處理的維吾爾語詞語分類體系及標(biāo)記研究(Ⅱ)[J];新疆大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年01期
5 玉素甫·艾白都拉;齊向偉;艾孜爾古麗;;維吾爾語方言資源整理及語言地圖的設(shè)計(jì)[J];數(shù)字技術(shù)與應(yīng)用;2012年07期
6 熱依曼·吐爾遜;吾守爾·斯拉木;;一種維吾爾語聯(lián)機(jī)手寫識別系統(tǒng)[J];中文信息學(xué)報(bào);2014年03期
7 王健飛;郭志川;葉曉舟;劉春梅;;一種嵌入式系統(tǒng)漢語與維吾爾語雙語顯示的方法[J];網(wǎng)絡(luò)新媒體技術(shù);2013年02期
8 米吉提·阿布力米提,庫爾班·吾布力;在多文種環(huán)境下的維吾爾語文字校對系統(tǒng)的開發(fā)研究[J];系統(tǒng)工程理論與實(shí)踐;2003年05期
9 麥熱哈巴·艾力;王志洋;吐爾根·依布拉音;;一種提高維吾爾語-漢語詞語對齊的方法研究[J];小型微型計(jì)算機(jī)系統(tǒng);2012年11期
10 麥熱哈巴·艾力;姜文斌;吐爾根·依布拉音;;維吾爾語詞法中音變現(xiàn)象的自動還原模型[J];中文信息學(xué)報(bào);2012年01期
相關(guān)會議論文 前3條
1 艾山·吾買爾;吐爾根·依不拉音;早克熱·卡德爾;;維吾爾語名詞詞干提取算法的研究[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
2 艾斯卡爾·肉孜;宗成慶;姑麗加瑪麗·麥麥提艾力;熱合木·馬合木提;艾斯卡爾·艾木都拉;;基于條件隨機(jī)場的維吾爾人名識別方法[A];第十二屆全國人機(jī)語音通訊學(xué)術(shù)會議(NCMMSC'2013)論文集[C];2013年
3 江海燕;劉巖;盧莉;;維吾爾語疑問語調(diào)的實(shí)驗(yàn)分析[A];第九屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2007年
相關(guān)博士學(xué)位論文 前1條
1 麥熱哈巴·艾力;基于實(shí)例的維漢機(jī)器翻譯若干關(guān)鍵問題研究[D];新疆大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 羅亞偉;細(xì)顆粒度維吾爾語文本情感分析研究[D];新疆大學(xué);2015年
2 沙吾提江·亞森;基于本體的維吾爾語語義搜索引擎的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2015年
3 塔什甫拉提·尼扎木丁;維吾爾語文本信息中人名實(shí)體識別研究[D];新疆大學(xué);2016年
4 賽迪亞古麗·艾尼瓦爾;融合多策略的維吾爾語詞干提取方法[D];新疆大學(xué);2016年
5 宋洋;基于圖像處理的維吾爾語音素語音學(xué)特征提取與應(yīng)用[D];新疆大學(xué);2016年
6 阿依古麗·哈力克;漢—維時(shí)間數(shù)字和量詞的識別與翻譯研究[D];新疆大學(xué);2017年
7 艾里尼熱·玉素甫;Gzip-U:針對維吾爾語文本的壓縮算法研究[D];新疆大學(xué);2017年
8 李敏;基于深度學(xué)習(xí)的維吾爾語文本情感分析[D];新疆大學(xué);2017年
9 李冬白;基于深度學(xué)習(xí)的維吾爾語代詞指代消解研究[D];新疆大學(xué);2017年
10 王樹恒;基于深度學(xué)習(xí)的維吾爾語文本情感分析[D];新疆大學(xué);2017年
,本文編號:1672479
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1672479.html