中文新詞識別研究概述
本文關鍵詞:中文新詞識別研究概述
【摘要】:新詞識別是中文信息處理的重要課題,但因新詞產生的速度快,語法、語用靈活,詞典難以及時收錄等問題使新詞識別成為了中文信息處理領域的難點和熱點問題。新詞識別研究的方法主要有規(guī)則方法、統計方法以及規(guī)則與統計相結合的方法。新詞識別的規(guī)則主要有新詞詞性規(guī)則和新詞構詞模式規(guī)則。統計方法主要通過計算詞的TF/IDF值、詞內部概率、詞的頻次對比、詞的臨接類別等進行新詞識別。最后該文總結了中文新詞識別研究中存在的問題,指出未來研究的方向。
【作者單位】: 中央民族大學少數民族語言文學系;內蒙古民族大學文學院;
【分類號】:TP391.1
【正文快照】: 新詞識別研究是中文信息處理中的一個基礎性問題,它直接關系到中文分詞的效果,繼而影響到后續(xù)各級的信息處理問題。在應用領域中新詞識別對于信息檢索、數據挖掘、輿情監(jiān)測、機器翻譯等各個方面都將產生影響。因此,新詞識別是中文信息處理的一個重要課題,但因新詞產生的速度快
【相似文獻】
中國期刊全文數據庫 前10條
1 ;中文信息處理基礎性國家標準出臺[J];軍民兩用技術與產品;2000年05期
2 郭弘;信息—中國造——孫茂松教授談中文信息處理領域面臨的機遇和挑戰(zhàn)[J];微電腦世界;2000年16期
3 ;民族軟件的基礎——中文信息處理技術[J];數字與縮微影像;2003年03期
4 ;中文信息處理戰(zhàn)略研討會在南寧召開[J];中文信息學報;2007年04期
5 苗奪謙;衛(wèi)志華;王睿智;張志飛;;“中文信息處理”實踐教學探索[J];計算機教育;2010年17期
6 石天;中文信息處理──中國企業(yè)面臨嚴峻挑戰(zhàn)[J];電腦技術;1997年05期
7 ;中文信息處理新秀──四通利方軟件在'97廣交會上[J];信息經濟與技術;1997年06期
8 陳力為,袁琦;跨世紀的中文信息處理基礎研究和產品開發(fā)[J];信息系統工程;1998年12期
9 王佳存;中文信息處理產業(yè)的發(fā)展方向探討[J];科學與管理;1998年01期
10 陳小荷;中文信息處理概述[J];南京師范大學文學院學報;2002年01期
中國重要會議論文全文數據庫 前10條
1 李竹;;中文信息處理與現代漢語詞類研究[A];世紀之交的中國應用語言學研究——第二屆全國語言文字應用學術研討會論文集[C];1998年
2 孫玉芳;;中文信息處理與國家信息化建設[A];面向21世紀的科技進步與社會經濟發(fā)展(上冊)[C];1999年
3 ;我國中文信息處理技術的發(fā)展與展望[A];科技進步與學科發(fā)展——“科學技術面向新世紀”學術年會論文集[C];1998年
4 ;前言[A];中文信息處理前沿進展——中國中文信息學會二十五周年學術會議論文集[C];2006年
5 ;中科院計算所中文信息處理技術簡介[A];中國中文信息學會第六次全國會員代表大會暨成立二十五周年學術會議中文信息處理重大成果匯報展資料匯編[C];2006年
6 ;中文信息處理重大成果匯報展方正集團展示內容介紹[A];中國中文信息學會第六次全國會員代表大會暨成立二十五周年學術會議中文信息處理重大成果匯報展資料匯編[C];2006年
7 ;中國中文信息學會交流材料[A];2011年網絡學術交流研討會交流材料[C];2011年
8 劉群;張浩;白碩;;中文信息處理開放平臺的設計[A];第一屆學生計算語言學研討會論文集[C];2002年
9 ;863計劃中文信息處理與智能人機接口基礎數據庫內容及其共享模式簡介[A];中國中文信息學會第六次全國會員代表大會暨成立二十五周年學術會議中文信息處理重大成果匯報展資料匯編[C];2006年
10 陸儉明;王黎;;句處理中排歧問題補議[A];語言計算與基于內容的文本處理——全國第七屆計算語言學聯合學術會議論文集[C];2003年
中國重要報紙全文數據庫 前8條
1 記者 韓曉玲邋通訊員 張波 龍雨;海內外專家聚焦中文信息處理[N];湖北日報;2007年
2 張波 龍雨;中文信息處理國際學術會議在武漢大學召開[N];中國社會科學院院報;2007年
3 記者 梁捷;我國中文信息處理技術從實驗室走向全面應用[N];光明日報;2009年
4 姚雙云 華中師范大學語言與語言教育研究中心;虛詞知識庫:中文信息處理的基石[N];中國社會科學報;2011年
5 劉萍;我國中文信息處理技術達到新水平[N];中國電子報;2001年
6 張海峰;我國軟件產業(yè)發(fā)展的機遇和威脅[N];就業(yè)時報;2007年
7 胡唯元;文字編碼新標準:不再為“名”所累[N];科技日報;2006年
8 ;浙江天宇信息技術有限公司[N];中國計算機報;2009年
中國博士學位論文全文數據庫 前1條
1 王建會;中文信息處理中若干關鍵技術的研究[D];復旦大學;2004年
中國碩士學位論文全文數據庫 前10條
1 羅麗俊;中文信息處理中若干技術的研究與實現[D];遼寧科技大學;2008年
2 任紅梅;分詞連寫的中文信息處理[D];中國石油大學;2007年
3 朱沖;中文信息處理關鍵問題的研究[D];桂林電子科技大學;2009年
4 許婷;面向中文信息處理的復句特征分析器的研究與實現[D];華中師范大學;2011年
5 梁文娟;漢字語法語義智能輸入法搭配庫設計與實現[D];河南大學;2006年
6 劉劍鋒;基于搭配關系的有標復句層次關系分析[D];華中師范大學;2015年
7 謝芳;特定領域術語的自動獲取[D];華中師范大學;2006年
8 杜瑩;漢字語法語義智能輸入法核心算法及實現技術[D];河南大學;2006年
9 黨蘭學;漢字語法語義智能輸入法總體設計與部分實現[D];河南大學;2006年
10 王振宇;基于Bootstrapping的交通工具名識別[D];山西大學;2009年
,本文編號:1287244
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1287244.html