基于SVM的離合詞詞義消歧
本文關(guān)鍵詞:基于SVM的離合詞詞義消歧
更多相關(guān)文章: 離合詞 SVM 詞義消歧 分類器
【摘要】:離合詞詞義消歧要解決如何讓計(jì)算機(jī)理解離合詞中的歧義詞在具體上下文中的含義。針對(duì)離合詞中歧義詞在機(jī)器翻譯中造成的對(duì)照翻譯不準(zhǔn)確以及在信息檢索中無法匹配有效信息等問題,將詞義消歧的方法應(yīng)用于離合詞中的歧義詞,采用SVM模型建立分類器。為了提高離合詞詞義消歧的正確率,在提取特征時(shí),結(jié)合離合詞的特點(diǎn),不僅提取了歧義詞上下文中的局部詞、局部詞性、局部詞及詞性3類特征,還提取了"離"形式的歧義詞的中間插入部分的特征;將文本特征轉(zhuǎn)換為特征向量時(shí),對(duì)布爾權(quán)重法進(jìn)行了改進(jìn),依次固定某種類型特征權(quán)重,分別改變另外兩種類型特征權(quán)重的消歧正確率來驗(yàn)證3類特征的消歧效果。實(shí)驗(yàn)結(jié)果表明,局部詞特征、局部詞及詞性特征對(duì)消歧效果的影響高于局部詞性特征,且采用不同類型的特征權(quán)重與采用相同的權(quán)重相比,消歧正確率提高了1.03%~5.69%。
【作者單位】: 河北大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;河北省機(jī)器學(xué)習(xí)與計(jì)算智能重點(diǎn)實(shí)驗(yàn)室;
【基金】:國家自然科學(xué)基金項(xiàng)目(61375075) 河北省自然科學(xué)基金項(xiàng)目(F2013201134,F2012201020) 保定市科學(xué)技術(shù)研究與發(fā)展指導(dǎo)計(jì)劃項(xiàng)目(15ZR063)資助
【分類號(hào)】:TP391.1
【正文快照】: 1引言離合詞是現(xiàn)代漢語中一種常見的特殊語言現(xiàn)象,其“可離可合”的特殊類型雖然保持了詞義的整體性,卻破壞了詞結(jié)構(gòu)的定型性[1]。隨著信息檢索、機(jī)器翻譯等方面的需求迅猛增加,離合詞詞義研究成為離合詞研究的熱點(diǎn)。然而,離合詞中歧義詞又給這一熱點(diǎn)問題的解決帶來了許多困難
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 楊陟卓;黃河燕;;基于異構(gòu)關(guān)系網(wǎng)絡(luò)圖的詞義消歧研究[J];計(jì)算機(jī)研究與發(fā)展;2013年02期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前3條
1 楊威;楊陟卓;;大學(xué)云架構(gòu)與大數(shù)據(jù)處理建模研究[J];中國教育信息化;2015年01期
2 楊陟卓;;基于上下文語境的詞義消歧方法[J];計(jì)算機(jī)應(yīng)用;2015年04期
3 閆蓉;高光來;;上下文邊界可變的詞義消歧[J];計(jì)算機(jī)工程與設(shè)計(jì);2015年10期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 張瑞玲;教學(xué)資源自動(dòng)文摘系統(tǒng)的研究與設(shè)計(jì)[D];北京交通大學(xué);2014年
2 欒博;基于句法樹的中文詞義消歧方法研究[D];哈爾濱理工大學(xué);2014年
【二級(jí)參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 劉鵬遠(yuǎn);趙鐵軍;;基于雙語詞匯Web間接關(guān)聯(lián)的無指導(dǎo)譯文消歧[J];軟件學(xué)報(bào);2010年04期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 吳云芳;;詞義消歧相關(guān)術(shù)語簡(jiǎn)介[J];術(shù)語標(biāo)準(zhǔn)化與信息技術(shù);2010年03期
2 金澎;;詞義消歧和詞義消歧評(píng)測(cè)簡(jiǎn)介[J];術(shù)語標(biāo)準(zhǔn)化與信息技術(shù);2010年03期
3 于林林;魏琦;宋麗芳;;基于多種方法相融合的詞義消歧的研究[J];電腦知識(shí)與技術(shù);2010年33期
4 李生;張晶;趙鐵軍;姚建民;;詞義消歧研究的現(xiàn)狀與發(fā)展方向[J];計(jì)算機(jī)科學(xué);2001年09期
5 郭池 ,陳家駿 ,王啟祥;一種基于語料庫的詞義消歧策略[J];計(jì)算機(jī)工程與應(yīng)用;2003年35期
6 全昌勤,何婷婷,姬東鴻,劉輝;基于指示詞的詞義消歧方法[J];計(jì)算機(jī)工程;2005年16期
7 全昌勤,何婷婷,姬東鴻,劉輝;從搭配知識(shí)獲取最優(yōu)種子的詞義消歧方法[J];中文信息學(xué)報(bào);2005年01期
8 全昌勤,何婷婷,姬東鴻,劉輝;基于義類的無導(dǎo)詞義消歧方法的研究[J];計(jì)算機(jī)應(yīng)用研究;2005年04期
9 胡蓉;詞義消歧方法初探[J];洛陽工業(yè)高等專科學(xué)校學(xué)報(bào);2005年01期
10 盧志茂;劉挺;李生;;統(tǒng)計(jì)詞義消歧的研究進(jìn)展[J];電子學(xué)報(bào);2006年02期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 曲維光;董宇;陳鐘;陳小荷;;基于語境計(jì)算模型的詞義消歧[A];全國第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年
2 郭宇航;車萬翔;劉挺;;基于語言模型驗(yàn)證的詞義消歧語料獲取[A];第四屆全國學(xué)生計(jì)算語言學(xué)研討會(huì)會(huì)議論文集[C];2008年
3 于麗麗;丁德鑫;曲維光;陳小荷;石民;;基于多分類器集成的古代漢語詞義消歧[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
4 張?jiān)茲?龔玲;王永成;;基于語料庫的樸素貝葉斯方法的詞義消歧[A];2005年中國智能自動(dòng)化會(huì)議論文集[C];2005年
5 秦穎;王小捷;;組合中文詞義消歧[A];全國第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年
6 王菁華;劉建毅;王樅;;語義網(wǎng)絡(luò)結(jié)構(gòu)下的詞義消歧[A];2006年首屆ICT大會(huì)信息、知識(shí)、智能及其轉(zhuǎn)換理論第一次高峰論壇會(huì)議論文集[C];2006年
7 張仰森;黃改娟;蘇文杰;;基于隱最大熵原理的漢語詞義消歧方法[A];中國計(jì)算語言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
8 丁江偉;劉挺;盧志茂;李生;;隱馬爾可夫模型和貝葉斯模型詞義消歧對(duì)比研究[A];語言計(jì)算與基于內(nèi)容的文本處理——全國第七屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2003年
9 赫蘭光;王軒;李露;范士喜;;基于最大熵分類器的謂詞識(shí)別與詞義消歧[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
10 吳崇斌;張全;;上下文邊界可變的貝葉斯分類器詞義消歧方法[A];第五屆全國青年計(jì)算語言學(xué)研討會(huì)論文集[C];2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 車超;知識(shí)自動(dòng)獲取的詞義消歧方法[D];大連理工大學(xué);2010年
2 陳俊鵬;詞義消歧中若干關(guān)鍵技術(shù)研究[D];武漢大學(xué);2012年
3 鹿文鵬;基于依存和領(lǐng)域知識(shí)的詞義消歧方法研究[D];北京理工大學(xué);2014年
4 王瑞琴;基于語義處理技術(shù)的信息檢索模型研究[D];浙江大學(xué);2009年
5 王菁華;文本中知識(shí)的獲取[D];北京郵電大學(xué);2008年
6 段建勇;多詞表達(dá)抽取及其應(yīng)用[D];上海交通大學(xué);2007年
7 李輝;移動(dòng)商務(wù)導(dǎo)購系統(tǒng)的研究[D];大連理工大學(xué);2008年
8 涂錕;基于自然語言與記憶再重構(gòu)的常識(shí)推理模型[D];華南理工大學(xué);2010年
9 任飛亮;高適應(yīng)性基于實(shí)例的機(jī)器翻譯中關(guān)鍵技術(shù)研究[D];東北大學(xué);2008年
10 劉宇鵬;機(jī)器翻譯中系統(tǒng)融合技術(shù)的研究[D];哈爾濱工業(yè)大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 孫繼明;基于知網(wǎng)的漢語詞義消歧研究[D];國防科學(xué)技術(shù)大學(xué);2007年
2 但漢輝;一種漢語詞義消歧方法的研究[D];重慶大學(xué);2009年
3 孫廣慶;基于語義范疇擴(kuò)展的詞義消歧的研究[D];哈爾濱工程大學(xué);2008年
4 潘兆志;有監(jiān)督方法在詞義消歧中的應(yīng)用[D];蘇州大學(xué);2009年
5 于林林;基于知網(wǎng)的漢語詞義消歧方法的研究[D];沈陽航空工業(yè)學(xué)院;2008年
6 陳浩;基于二階上下文的無導(dǎo)詞義消歧研究[D];華中師范大學(xué);2005年
7 全昌勤;基于語料庫的漢語詞義消歧方法研究[D];華中師范大學(xué);2005年
8 閆蓉;基于語義的漢語詞義消歧方法研究[D];西北大學(xué);2006年
9 楊宇娜;基于統(tǒng)計(jì)的中文詞義消歧技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2006年
10 商敏;漢語詞義消歧研究[D];大連理工大學(xué);2007年
,本文編號(hào):1211634
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1211634.html