天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 文藝論文 > 漢語言論文 >

基于朝鮮語語料庫的人名自動識別方法研究

發(fā)布時間:2020-12-19 22:18
  中,英文信息處理經(jīng)歷了半個世紀(jì)的發(fā)展,在基礎(chǔ)資源的建設(shè),詞性標(biāo)注,信息檢索,文體分類,機(jī)器翻譯,語言識別與合成,人機(jī)對話等領(lǐng)域都取得非常大的發(fā)展,中,英文信息處理的現(xiàn)代化發(fā)展,對國內(nèi)少數(shù)民族語言信息處理的理論與技術(shù)發(fā)展也起到了深刻的促進(jìn)作用。與中,英文信息處理相比,朝鮮語信息處理雖然起步稍晚,但也取得了一定成果。朝鮮語信息處理已初步完成了字,詞處理階段,現(xiàn)已進(jìn)入句處理階段,朝鮮語信息處理已完成短語結(jié)構(gòu)關(guān)系識別,短語邊界界定等淺層句法分析任務(wù),正向深層句法分析邁進(jìn),朝鮮語信息檢索,自動文摘,文體分類,機(jī)器翻譯的研究也方興未艾。本文首先分析了人名識別的困難,并對現(xiàn)有的人名識別方法進(jìn)行了簡單介紹和比較;其次,以2016年5月~2017年5月間《延邊日報》中出現(xiàn)的人名作為主要樣本;最后建立了人名樣本庫,姓氏庫,人名語料庫等在人名識別前所需要語料資源,并對這些資源進(jìn)行統(tǒng)計分析的基礎(chǔ)上,建立了各種人名用字表,姓氏概率表,人名上下文信息表,姓氏用作普通單字時的上下文信息表,人名前綴,后綴表等人名識別過程中所需的數(shù)據(jù)資源。本文基于人名驅(qū)動和上下文信息,利用從真實姓名樣本庫和文本語料庫中得到的大量統(tǒng)計數(shù)... 

【文章來源】:延邊大學(xué)吉林省 211工程院校

【文章頁數(shù)】:45 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
Abstract
目錄
正文
參考文獻(xiàn)
附件


【參考文獻(xiàn)】:
期刊論文
[1]面向人名消歧任務(wù)的人名識別系統(tǒng)[J]. 時迎超,王會珍,肖桐,胡明涵.  中文信息學(xué)報. 2011(03)
[2]基于可信度模型的中文人名識別研究[J]. 倪吉,孔芳,朱巧明,李培峰.  中文信息學(xué)報. 2011(03)
[3]一種基于本體論和規(guī)則匹配的中文人名識別方法[J]. 周昆,胡學(xué)鋼.  微計算機(jī)信息. 2010(31)
[4]基于混合模型的中國人名自動識別[J]. 毛婷婷,李麗雙,黃德根.  中文信息學(xué)報. 2007(02)
[5]邊界模板和局部統(tǒng)計相結(jié)合的中國人名識別[J]. 李中國,劉穎.  中文信息學(xué)報. 2006(05)
[6]一種基于可信度的人名識別方法[J]. 羅智勇,宋柔.  中文信息學(xué)報. 2005(03)
[7]基于角色標(biāo)注的中國人名自動識別研究[J]. 張華平,劉群.  計算機(jī)學(xué)報. 2004(01)

博士論文
[1]基于蒙古文語料庫的人名自動識別[D]. 通拉嘎.中央民族大學(xué) 2013

碩士論文
[1]中文姓名自動識別系統(tǒng)的設(shè)計與實現(xiàn)[D]. 余祖波.大連理工大學(xué) 2008
[2]基于類比學(xué)習(xí)的人名識別方法研究[D]. 朱麗麗.山西大學(xué) 2007



本文編號:2926669

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/hanyulw/2926669.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶50a08***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com