蒙古語謂語信息數(shù)據(jù)庫的構(gòu)建
發(fā)布時間:2021-06-13 05:11
論文運用短語結(jié)構(gòu)語法、格語法等現(xiàn)代語言學理論,對蒙古語句子的結(jié)構(gòu)語義信息進行了標注加工。在此基礎(chǔ)上構(gòu)建了蒙古語謂語信息數(shù)據(jù)庫并完成初步的相關(guān)統(tǒng)計研究。首先,對《100萬詞級現(xiàn)代蒙古語語料庫》句子長度做了統(tǒng)計分析。其次,出于蒙古文信息處理的具體需求,選取長度在3到20詞之間的5000條簡單句,標注了固定短語、詞法、短語、語義分類、句子成分、語義角色等6種信息標記。通過5000條句子的標注,構(gòu)建了《蒙古語謂語信息數(shù)據(jù)庫》。最后運用謂語信息數(shù)據(jù)庫,統(tǒng)計分析了蒙古語謂語的詞類特征、詞法變化形式特征、短語分類及其關(guān)系特征、詞數(shù)特征和語義類特征,完成了對蒙古語謂語信息的初步統(tǒng)計研究。論文結(jié)構(gòu)和主要內(nèi)容如下:導論部分,主要介紹了本項研究的意義、研究現(xiàn)狀、研究理論與方法、語料來源和標記說明。第一張介紹了選取句子來源、句子統(tǒng)計規(guī)則、句子選取標準和句子標注規(guī)則。第二章介紹了謂語信息數(shù)據(jù)庫構(gòu)建過程和相關(guān)字段屬性。第三章對實際語料做了詞性、詞法、短語分類及其關(guān)系、詞數(shù)、語義類等謂語相關(guān)信息做了5項統(tǒng)計分析。結(jié)論部分總結(jié)了全文并提出了下一步研究任務。
【文章來源】:內(nèi)蒙古大學內(nèi)蒙古自治區(qū) 211工程院校
【文章頁數(shù)】:340 頁
【學位級別】:碩士
【文章目錄】:
內(nèi)容摘要
ABSTRACT
目錄
正文
參考文獻
附錄
本文編號:3227065
【文章來源】:內(nèi)蒙古大學內(nèi)蒙古自治區(qū) 211工程院校
【文章頁數(shù)】:340 頁
【學位級別】:碩士
【文章目錄】:
內(nèi)容摘要
ABSTRACT
目錄
正文
參考文獻
附錄
本文編號:3227065
本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/3227065.html