對(duì)中文分詞歧義消除算法的研究
本文關(guān)鍵詞:對(duì)中文分詞歧義消除算法的研究
更多相關(guān)文章: 中文分詞 歧義消除 歧義處理 歧義字段
【摘要】:介紹中文分詞算法的理論知識(shí),通過(guò)介紹歧義存在的種類(lèi),分析分詞結(jié)果出現(xiàn)歧義的必然性.提出改進(jìn)"退一字組合法",實(shí)現(xiàn)歧義消除.在保持切分速度的前提下,提高切分的精度.為搜索引擎建立索引奠定良好的基礎(chǔ).
【作者單位】: 蘇州工業(yè)園區(qū)服務(wù)外包職業(yè)學(xué)院移動(dòng)互聯(lián)網(wǎng)技術(shù)系;
【關(guān)鍵詞】: 中文分詞 歧義消除 歧義處理 歧義字段
【分類(lèi)號(hào)】:TP391.1
【正文快照】: 中文分詞是指將中文文本拆分成詞的技術(shù).目前,中文分詞技術(shù)已經(jīng)廣泛應(yīng)用于信息檢索、搜索引擎、信息抽取、機(jī)器翻譯、漢字的智能化輸入、中外文對(duì)譯、中文校對(duì)、自動(dòng)摘要、自動(dòng)分類(lèi)、文本的語(yǔ)音輸入等很多方面和領(lǐng)域,中文分詞技術(shù)是中文信息處理中的關(guān)鍵技術(shù)之一,分詞的速度和
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 孫茂松,左正平,黃昌寧;漢語(yǔ)自動(dòng)分詞詞典機(jī)制的實(shí)驗(yàn)研究[J];中文信息學(xué)報(bào);2000年01期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 高艷萍;于紅;尹祥貴;綦孝姬;王春永;趙志強(qiáng);;基于雙數(shù)組Trie樹(shù)的漁業(yè)領(lǐng)域分詞研究[J];安徽農(nóng)業(yè)科學(xué);2008年11期
2 胡錫衡;;正向最大匹配法在中文分詞技術(shù)中的應(yīng)用[J];鞍山師范學(xué)院學(xué)報(bào);2008年02期
3 胡順義;趙曉凡;;基于PB的漢語(yǔ)電子詞典管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J];安陽(yáng)師范學(xué)院學(xué)報(bào);2010年05期
4 馬志強(qiáng);周長(zhǎng)勝;丁維;楊娜;;校園網(wǎng)搜索引擎的研究與實(shí)現(xiàn)[J];北京機(jī)械工業(yè)學(xué)院學(xué)報(bào);2007年01期
5 張霄軍;陳小荷;;面向世博語(yǔ)言信息處理的漢英機(jī)器詞典[J];辭書(shū)研究;2007年04期
6 趙春紅;高希龍;王檸;趙威;劉國(guó)華;;一種應(yīng)用分治策略的中文分詞方法[J];燕山大學(xué)學(xué)報(bào);2009年05期
7 顧海峰;;基于中文TTS技術(shù)研究[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年09期
8 郭屹;;對(duì)中文自動(dòng)分詞機(jī)制的研究和改進(jìn)[J];電腦知識(shí)與技術(shù);2008年07期
9 楊宇;林錦國(guó);巫振新;;自動(dòng)化專(zhuān)業(yè)多引擎機(jī)器翻譯研究[J];電腦知識(shí)與技術(shù);2008年25期
10 方春平;管建和;;基于多重?cái)?shù)組的詞典技術(shù)研究與實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2009年09期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前8條
1 吳晶晶;荊繼武;王平建;;一種基于詞典的新型中文分詞機(jī)制[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(上冊(cè))[C];2007年
2 李江波;周強(qiáng);陳祖舜;;漢語(yǔ)詞典快速查詢(xún)算法研究[A];第二屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2004年
3 楊超;李仁發(fā);蔣斌;;一種高效的漢語(yǔ)自動(dòng)分詞詞典機(jī)制[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
4 李江波;周強(qiáng);陳祖舜;;漢語(yǔ)詞典的快速查詢(xún)算法研究[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年
5 朱鑒;張建;李淼;強(qiáng)靜;楊攀;;面向民族語(yǔ)言信息處理的漢語(yǔ)分詞方法[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
6 孫宏綱;陸余良;;基于二元切分的互聯(lián)網(wǎng)新聞主題詞自動(dòng)提取研究[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
7 孫雄勇;羅霄;;中圖分類(lèi)法體系下的自動(dòng)分類(lèi)研究[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
8 柏文陽(yáng);何瑗;馬耀華;肖建華;徐潔磐;;基于消息的匯率趨勢(shì)預(yù)測(cè)方法[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前9條
1 李慶虎;基于P2P架構(gòu)的網(wǎng)格文件系統(tǒng)研究[D];清華大學(xué);2004年
2 李曉光;XML非完全結(jié)構(gòu)查詢(xún)處理中若干關(guān)鍵技術(shù)的研究[D];東北大學(xué);2006年
3 張春霞;領(lǐng)域文本知識(shí)獲取方法研究及其在考古領(lǐng)域中的應(yīng)用[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年
4 陳博;WEB文本情感分類(lèi)中關(guān)鍵問(wèn)題的研究[D];北京郵電大學(xué);2008年
5 姜欣;古茶詩(shī)的跨語(yǔ)際符號(hào)轉(zhuǎn)換與機(jī)輔翻譯研究[D];大連理工大學(xué);2010年
6 王龍;教育資源推薦服務(wù)中若干關(guān)鍵技術(shù)的研究[D];吉林大學(xué);2013年
7 黃建年;農(nóng)業(yè)古籍的計(jì)算機(jī)斷句標(biāo)點(diǎn)與分詞標(biāo)引研究[D];南京農(nóng)業(yè)大學(xué);2009年
8 汲業(yè);面向圖像的垂直搜索引擎關(guān)鍵技術(shù)研究[D];大連海事大學(xué);2013年
9 陸前;英、漢跨語(yǔ)言話題檢測(cè)與跟蹤技術(shù)研究[D];中央民族大學(xué);2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 甄濤;基于社團(tuán)發(fā)現(xiàn)的Blog信息收集原型系統(tǒng)的研究[D];解放軍信息工程大學(xué);2009年
2 蔡蕊;一種新的搜索引擎分詞詞典的研究[D];山東大學(xué);2010年
3 陳可欽;基于垂直搜索引擎的主題爬蟲(chóng)算法的研究[D];中南林業(yè)科技大學(xué);2009年
4 曹亞輝;非結(jié)構(gòu)文本最佳近似匹配系統(tǒng)的研究與實(shí)現(xiàn)[D];東華大學(xué);2011年
5 陳磊;用例圖到順序圖轉(zhuǎn)換的研究[D];西安電子科技大學(xué);2009年
6 蘭沖;基于統(tǒng)計(jì)規(guī)則的中文分詞研究[D];西安電子科技大學(xué);2011年
7 王荔;統(tǒng)計(jì)全切分中文分詞系統(tǒng)的研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2009年
8 曹仲偉;FTP搜索引擎的關(guān)鍵技術(shù)研究[D];湖北工業(yè)大學(xué);2011年
9 蔣才智;中文自動(dòng)分詞及人名識(shí)別技術(shù)研究[D];合肥工業(yè)大學(xué);2011年
10 王\~;基于Lucene的同義詞擴(kuò)展檢索的研究與實(shí)現(xiàn)[D];天津財(cái)經(jīng)大學(xué);2011年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 梁南元;書(shū)面漢語(yǔ)自動(dòng)分詞系統(tǒng)—CDWS[J];中文信息學(xué)報(bào);1987年02期
2 孫茂松,鄒嘉彥;漢語(yǔ)自動(dòng)分詞研究中的苦干理論問(wèn)題[J];語(yǔ)言文字應(yīng)用;1995年04期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 張博;姜建國(guó);萬(wàn)平國(guó);;對(duì)互聯(lián)網(wǎng)環(huán)境下中文分詞系統(tǒng)的一種架構(gòu)改進(jìn)[J];計(jì)算機(jī)應(yīng)用研究;2006年11期
2 夏新松;肖建國(guó);;一種新的錯(cuò)誤驅(qū)動(dòng)學(xué)習(xí)方法在中文分詞中的應(yīng)用[J];計(jì)算機(jī)科學(xué);2006年03期
3 周軍;王艷紅;;一種基于詞典的中文分詞法的設(shè)計(jì)與實(shí)現(xiàn)[J];黑龍江科技信息;2008年25期
4 許高建;胡學(xué)鋼;路遙;王慶人;;一種改進(jìn)的中文分詞歧義消除算法研究[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年10期
5 張培穎;;運(yùn)用有向圖進(jìn)行中文分詞研究[J];計(jì)算機(jī)工程與應(yīng)用;2009年22期
6 吳晶晶;荊繼武;聶曉峰;王平建;;一種快速中文分詞詞典機(jī)制[J];中國(guó)科學(xué)院研究生院學(xué)報(bào);2009年05期
7 許華;;中文分詞系統(tǒng)設(shè)計(jì)之詞典構(gòu)造[J];科技創(chuàng)新導(dǎo)報(bào);2010年20期
8 韓月陽(yáng);鄧世昆;賈時(shí)銀;李遠(yuǎn)方;;基于字分類(lèi)的中文分詞的研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年07期
9 莫建文;鄭陽(yáng);首照宇;張順嵐;;改進(jìn)的基于詞典的中文分詞方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2013年05期
10 李慶虎,陳玉健,孫家廣;一種中文分詞詞典新機(jī)制——雙字哈希機(jī)制[J];中文信息學(xué)報(bào);2003年04期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 王敏;葉寬余;薛峰;;一種面向網(wǎng)店商品搜索的中文分詞系統(tǒng)設(shè)計(jì)[A];全國(guó)第22屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2011)暨全國(guó)第3屆安全關(guān)鍵技術(shù)與應(yīng)用(SCA·2011)學(xué)術(shù)會(huì)議論文摘要集[C];2011年
2 黃昌寧;趙海;;由字構(gòu)詞——中文分詞新方法[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
3 任飛亮;石磊;姚天順;;應(yīng)用支持向量機(jī)進(jìn)行中文分詞[A];全國(guó)第八屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年
4 吳晶晶;荊繼武;王平建;;一種基于詞典的新型中文分詞機(jī)制[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(上冊(cè))[C];2007年
5 李玉梅;靳光瑾;黃昌寧;;中文分詞規(guī)范中的歧義字段消解細(xì)則[A];第五屆全國(guó)語(yǔ)言文字應(yīng)用學(xué)術(shù)研討會(huì)論文集[C];2007年
6 修馳;宋柔;;基于“大詞”實(shí)例的中文分詞研究[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
7 黃居仁;;瓶頸,挑戰(zhàn),與轉(zhuǎn)機(jī):中文分詞研究的新思維[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
8 李壽山;黃居仁;;基于詞邊界分類(lèi)的中文分詞方法[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
9 張梅山;鄧知龍;車(chē)萬(wàn)翔;劉挺;;統(tǒng)計(jì)與詞典相結(jié)合的領(lǐng)域自適應(yīng)中文分詞[A];中國(guó)計(jì)算語(yǔ)言學(xué)研究前沿進(jìn)展(2009-2011)[C];2011年
10 王屹林;朱慕華;朱靖波;;針對(duì)SVM中文分詞特性的個(gè)性化后處理設(shè)計(jì)[A];第三屆學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2006年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 王荔;統(tǒng)計(jì)全切分中文分詞系統(tǒng)的研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2009年
2 黃翼彪;開(kāi)源中文分詞器的比較研究[D];鄭州大學(xué);2013年
3 許華婷;基于Active Learning的中文分詞領(lǐng)域自適應(yīng)方法的研究[D];北京交通大學(xué);2015年
4 曹衛(wèi)峰;中文分詞關(guān)鍵技術(shù)研究[D];南京理工大學(xué);2009年
5 許順;中文分詞規(guī)范可計(jì)算化的研究與實(shí)現(xiàn)[D];蘇州大學(xué);2006年
6 魏博誠(chéng);中文分詞交集型歧義處理研究[D];安徽大學(xué);2011年
7 代聰;基于英漢平行語(yǔ)料的中文分詞研究與應(yīng)用[D];大連理工大學(xué);2012年
8 顧輝;基于中文分詞的購(gòu)物中心微信平臺(tái)購(gòu)物導(dǎo)航的設(shè)計(jì)與實(shí)現(xiàn)[D];華中師范大學(xué);2015年
9 王為磊;基于多目標(biāo)優(yōu)化的中文分詞模型的研究[D];蘇州大學(xué);2008年
10 佟德琴;基于字詞聯(lián)合解碼的中文分詞研究[D];大連理工大學(xué);2011年
,本文編號(hào):777939
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/777939.html