蒙古語語料庫標(biāo)注及相關(guān)對策研究
本文關(guān)鍵詞:蒙古語語料庫標(biāo)注及相關(guān)對策研究,由筆耕文化傳播整理發(fā)布。
【摘要】: 目前語料庫建設(shè)已經(jīng)成為自然語言處理不可缺少的組成部分。語料庫的發(fā)展趨勢是作為重要的語言知識資源,為自然語言處理系統(tǒng)提供知識支持。蒙古語語料庫建設(shè)從20世紀(jì)80年代開始,至今已經(jīng)取得了一定的成績,建立了若干個不同時期、不同文種、不同用途的語料庫。但以往的語料庫主要側(cè)重于語言本體研究,而當(dāng)今,用于自然語言深層處理時卻遇到了很多問題,正面臨擴(kuò)大規(guī)模、深化加工等新的挑戰(zhàn)。 為了使蒙古語語料庫及其加工技術(shù)盡快達(dá)到或接近國內(nèi)外較有影響的語料庫標(biāo)注深度,本文通過蒙古語語料庫同國內(nèi)外著名語料庫進(jìn)行了多層面上的比較,分析和探討了目前在蒙古語語料庫各級加工中存在的問題。并對26萬詞蒙古語語料庫進(jìn)行自動詞法標(biāo)注和手工后處理,詳細(xì)分析了所遇到的問題,針對其中某些問題提出了解決方案。
【關(guān)鍵詞】:語料庫 蒙古語語料庫 標(biāo)注
【學(xué)位授予單位】:內(nèi)蒙古大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2008
【分類號】:H212
【目錄】:
- 摘要6-7
- ABSTRACT7-10
- 第1章 序言10-24
- 1.1 課題的提出10-11
- 1.2 語料庫的定義及其應(yīng)用11-12
- 1.2.1 語料庫的定義11
- 1.2.2 語料庫在自然語言處理中的應(yīng)用11-12
- 1.2.3 語料庫在語言學(xué)研究領(lǐng)域的應(yīng)用12
- 1.3 語料庫的分類12-13
- 1.4 語料庫的發(fā)展歷史13-16
- 1.4.1 早期的語料庫語言學(xué)14-15
- 1.4.2 喬姆斯基轉(zhuǎn)換語法時期的語料庫語言學(xué)15
- 1.4.3 語料庫語言學(xué)的復(fù)蘇時期15-16
- 1.5 國外幾個典型語料庫簡介16-19
- 1.6 漢語語料庫簡介19-23
- 1.7 其他少數(shù)民族語料庫簡介23-24
- 第2章 蒙古語語料庫的標(biāo)注現(xiàn)狀24-47
- 2.1 蒙古語語料庫簡介24-27
- 2.1.1 蒙古語單語語料庫25-26
- 2.1.2 蒙古語雙語語料庫26-27
- 2.2 蒙古語語料庫標(biāo)注27-47
- 2.2.1 蒙古語詞語識別27-31
- 2.2.2 蒙古語的詞法標(biāo)注31-35
- 2.2.3 蒙古語的詞性標(biāo)注35-40
- 2.2.4 蒙古語的句法標(biāo)注40-44
- 2.2.4.2 蒙古語的句法標(biāo)注41-44
- 2.2.5 蒙古語的詞義標(biāo)注44-47
- 2.2.5.1 詞義標(biāo)注概況44-47
- 2.2.5.2 蒙古語的詞義標(biāo)注47
- 第3章 對26萬詞級語料庫進(jìn)行詞法標(biāo)注時遇到的問題與解決的策略47-63
- 3.1 標(biāo)注目的47-48
- 3.2 原語料庫來源48-49
- 3.3 使用工具簡介49-50
- 3.4 工作流程50-63
- 第4章 結(jié)束語63-64
- 參考文獻(xiàn)64-67
- 附錄167-71
- 附錄271-72
- 附錄372-73
- 致謝73
- 攻讀碩士學(xué)位期間發(fā)表過的學(xué)術(shù)論文目錄73
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 朱玉柱;;《仡佬語布央語語法標(biāo)注話語材料集》出版[J];民族語文;2011年04期
2 張如梅;周錦國;;略談嘆詞“喂”的讀音[J];紅河學(xué)院學(xué)報;2011年04期
3 ;刊稿格式[J];齊魯文化研究;2010年00期
4 陳士平;;“納延城”質(zhì)疑[J];黑龍江史志;2011年16期
5 ;刊稿格式[J];齊魯文化研究;2009年00期
6 ;《史學(xué)月刊》中文文獻(xiàn)注釋規(guī)范說明[J];史學(xué)月刊;2011年08期
7 Benjamin Carson;馬蓮;;為人父母之重[J];英語沙龍(時尚版);2010年05期
8 ;《馬克思主義美學(xué)研究》投稿格式[J];馬克思主義美學(xué)研究;2011年01期
9 徐濤;;《梅堯臣集編年校注》補(bǔ)正[J];圖書館雜志;2011年06期
10 李小山;;高校文學(xué)史教材中地名標(biāo)注的訂誤——兼談地名標(biāo)注的規(guī)范化問題[J];教育教學(xué)論壇;2011年26期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 張惠均;宋偉凱;呂瑋;;MicroStation“檢查標(biāo)注”工具的制作[A];江蘇省測繪學(xué)會2009年學(xué)術(shù)年會論文集[C];2009年
2 安娜;侯敏;;語料庫中的插入語標(biāo)注研究[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
3 安娜;侯敏;;基于傳媒語言語料庫的話語標(biāo)記自動識別與消歧研究[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
4 于水;;關(guān)于俄漢機(jī)器翻譯的幾點個人看法[A];中國首屆“海峽兩岸俄語教學(xué)與研究學(xué)術(shù)討論會”論文集[C];2005年
5 王彬;王依然;文采菊;周鑫;;基于標(biāo)注語料庫的《新聞聯(lián)播》語言特征統(tǒng)計分析[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
6 卜愛萍;曾東京;;《新牛津英漢雙解大詞典》Usage對我們的啟示[A];中國辭書學(xué)會雙語詞典專業(yè)委員會第七屆年會論文集[C];2007年
7 黃松芳;吳昊;高勤;吳璽宏;遲惠生;;漢語廣播新聞?wù)Z音的自動識別和標(biāo)注[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
8 李妮;;從典型理論看詞典中文體意義的標(biāo)注方式[A];中國辭書學(xué)會雙語詞典專業(yè)委員會第七屆年會論文集[C];2007年
9 邢紅兵;張旺熹;;現(xiàn)代漢語語法項目的標(biāo)注及統(tǒng)計研究[A];對外漢語教學(xué)的全方位探索——對外漢語研究學(xué)術(shù)討論會論文集[C];2004年
10 繆有棟;邱錫鵬;黃萱菁;;基于主動學(xué)習(xí)的中文問題類別標(biāo)注研究[A];第六屆全國信息檢索學(xué)術(shù)會議論文集[C];2010年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 本報記者 游婕;商品“瘦身”后應(yīng)顯著標(biāo)注凈含量[N];中國消費者報;2011年
2 李占才;關(guān)于“周年”和“享年”的年份標(biāo)注[N];中國集郵報;2009年
3 紫薇 海鷗 記者 吳采平;標(biāo)注“100%全棉”實則含棉不足三成[N];中國消費者報;2011年
4 記者馬永剛;濟(jì)南市場飲料標(biāo)注令人費解[N];中國食品報;2009年
5 洪忠基;誕辰紀(jì)念郵票上年份標(biāo)注的位置值得推敲[N];中國集郵報;2010年
6 周菊;“可能含有”不全面包裝標(biāo)注必須清楚[N];中國質(zhì)量報;2011年
7 記者 歐志葵 實習(xí)生 劉斯綺;聯(lián)合利華食品標(biāo)注驚現(xiàn)“莫須有”[N];南方日報;2011年
8 見習(xí)記者 郭釔杉;所有添加劑必須明顯標(biāo)注[N];中華工商時報;2011年
9 張建華;韓國擬對兒童食品實施特別標(biāo)注[N];中國食品報;2010年
10 哈爾濱工業(yè)大學(xué) 趙麗瑩;論文基金標(biāo)注莫玩“一石三鳥”[N];科技日報;2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 湯步洲;序列標(biāo)注問題的監(jiān)督學(xué)習(xí)方法及應(yīng)用[D];哈爾濱工業(yè)大學(xué);2011年
2 宣云干;基于潛在語義分析的社會化標(biāo)注系統(tǒng)標(biāo)簽語義檢索研究[D];南京大學(xué);2011年
3 賈根蓮;工程CAD中設(shè)計與分析計算統(tǒng)一模型的研究與實現(xiàn)[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2001年
4 李彥鵬;特征耦合泛化及其在文體挖掘中的應(yīng)用[D];大連理工大學(xué);2011年
5 趙娜;基于知識地圖的多領(lǐng)域本體語義互聯(lián)研究[D];吉林大學(xué);2011年
6 孫登第;基于隨機(jī)點積圖理論的模式識別方法研究[D];安徽大學(xué);2012年
7 段曼妮;圖像挖掘在圖像檢索中的應(yīng)用[D];中國科學(xué)技術(shù)大學(xué);2009年
8 陳偉;語音識別聲學(xué)建模中的主動學(xué)習(xí)研究[D];北京郵電大學(xué);2011年
9 陳偉;語音識別聲學(xué)建模中的主動學(xué)習(xí)研究[D];北京郵電大學(xué);2011年
10 淑琴;蒙古文同形詞知識庫的構(gòu)建[D];內(nèi)蒙古大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 牧仁高娃;蒙古語語料庫標(biāo)注及相關(guān)對策研究[D];內(nèi)蒙古大學(xué);2008年
2 王嵩;基于貝葉斯理論的社會化標(biāo)注主題聚類模型研究[D];江蘇科技大學(xué);2011年
3 張輔紅;袋裝食品標(biāo)簽中日期標(biāo)注方式的工效學(xué)研究[D];浙江理工大學(xué);2012年
4 常勇;Deep Web數(shù)據(jù)集成系統(tǒng)中數(shù)據(jù)標(biāo)注研究[D];河北大學(xué);2009年
5 于輝;社會標(biāo)注行為動力機(jī)制及其應(yīng)用研究[D];大連理工大學(xué);2012年
6 范自立;選擇標(biāo)注分層流形學(xué)習(xí)算法研究[D];蘇州大學(xué);2011年
7 呂紅周;俄漢雙語語料庫語義范疇自動標(biāo)注[D];黑龍江大學(xué);2007年
8 李巖;基于大眾標(biāo)注的個性化推薦系統(tǒng)研究[D];東北師范大學(xué);2011年
9 郭鳳芹;慣用語與語文詞典編纂[D];河北大學(xué);2005年
10 紅光;蒙古語語料庫中漢語人名地名的拉丁轉(zhuǎn)寫[D];內(nèi)蒙古師范大學(xué);2009年
本文關(guān)鍵詞:蒙古語語料庫標(biāo)注及相關(guān)對策研究,由筆耕文化傳播整理發(fā)布。
,本文編號:361335
本文鏈接:http://sikaile.net/wenyilunwen/hanyulw/361335.html