蒙古文信息檢索系統(tǒng)的設(shè)計(jì)與研究
本文關(guān)鍵詞:蒙古文信息檢索系統(tǒng)的設(shè)計(jì)與研究
更多相關(guān)文章: 信息檢索 蒙古文信息檢索 蒙古文Stemming 平滑算法 檢索評(píng)價(jià)
【摘要】:文章結(jié)合蒙古文的獨(dú)特性,研究蒙古文信息檢索系統(tǒng)。首先搭建一個(gè)用于評(píng)價(jià)檢索性能的蒙古文文檔測(cè)試集,建立一套蒙古文信息檢索系統(tǒng)。實(shí)驗(yàn)對(duì)比分析檢索模型、平滑算法、蒙古文停用詞表、詞干還原和偽相關(guān)反饋等技術(shù)對(duì)蒙古文信息檢索系統(tǒng)關(guān)鍵技術(shù)對(duì)檢索性能的影響。實(shí)驗(yàn)結(jié)果表明,蒙古文信息檢索系統(tǒng)選擇結(jié)構(gòu)化語(yǔ)言模型、Dirichlet平滑方法、停用詞表、以詞根做檢索單元和偽相關(guān)反饋可以更好地提升檢索性能。
【作者單位】: 內(nèi)蒙古大學(xué)圖書館;內(nèi)蒙古大學(xué)計(jì)算機(jī)學(xué)院;
【關(guān)鍵詞】: 信息檢索 蒙古文信息檢索 蒙古文Stemming 平滑算法 檢索評(píng)價(jià)
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目“基于領(lǐng)域本體的蒙古文數(shù)字資源整合機(jī)制研究”(項(xiàng)目編號(hào):71163029)資助成果
【分類號(hào)】:H212;G252.7
【正文快照】: 0引言蒙古文信息檢索的研究遵循蒙古文語(yǔ)言的獨(dú)特性,按照信息檢索技術(shù)的成熟研究思路,設(shè)計(jì)合理的研究方法。其中,在停用詞選取方面,早期方法采用的停用詞一般是通過(guò)將英語(yǔ)和漢語(yǔ)中的停用詞直接用詞典轉(zhuǎn)換為對(duì)應(yīng)的蒙古語(yǔ)單詞得到的。鞏政、關(guān)高娃[1]利用聯(lián)合熵算法在蒙古語(yǔ)語(yǔ)料
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 鞏政;關(guān)高娃;;蒙古文停用詞和英文停用詞比較研究[J];中文信息學(xué)報(bào);2011年04期
2 塔娜;林民;李小慶;;面向跨語(yǔ)言信息檢索的蒙漢語(yǔ)義詞典構(gòu)建初探[J];計(jì)算機(jī)與數(shù)字工程;2010年08期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前6條
1 鮑玉來(lái);白淑霞;李廣華;;蒙古文信息檢索系統(tǒng)的設(shè)計(jì)與研究[J];圖書館學(xué)研究;2017年05期
2 鮑玉來(lái);畢強(qiáng);;蒙古文音樂(lè)領(lǐng)域的語(yǔ)義檢索初探[J];現(xiàn)代圖書情報(bào)技術(shù);2016年11期
3 饒高琦;李宇明;;基于70年報(bào)刊語(yǔ)料的現(xiàn)代漢語(yǔ)歷時(shí)穩(wěn)態(tài)詞抽取與考察[J];中文信息學(xué)報(bào);2016年06期
4 珠杰;李天瑞;;藏文停用詞選取與自動(dòng)處理方法研究[J];中文信息學(xué)報(bào);2015年02期
5 柔特;;基于WordNet的藏文語(yǔ)義詞典半自動(dòng)構(gòu)建方法研究[J];西藏大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期
6 塔娜;;蒙漢跨語(yǔ)言信息檢索在數(shù)字圖書館中的應(yīng)用研究[J];呼倫貝爾學(xué)院學(xué)報(bào);2012年05期
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前6條
1 楊麗;;國(guó)外跨語(yǔ)言信息檢索的技術(shù)研究綜述[J];情報(bào)雜志;2008年07期
2 麥?zhǔn)缙?;跨語(yǔ)言信息檢索技術(shù)探析[J];中華醫(yī)學(xué)圖書情報(bào)雜志;2008年04期
3 化柏林;;知識(shí)抽取中的停用詞處理技術(shù)[J];現(xiàn)代圖書情報(bào)技術(shù);2007年08期
4 吳丹;王惠臨;;本體在跨語(yǔ)言信息檢索中的應(yīng)用機(jī)制研究[J];圖書情報(bào)工作;2006年09期
5 顧益軍,樊孝忠,王建華,汪濤,黃維金;中文停用詞表的自動(dòng)選取[J];北京理工大學(xué)學(xué)報(bào);2005年04期
6 于江生 ,俞士汶;中文概念詞典的結(jié)構(gòu)[J];中文信息學(xué)報(bào);2002年04期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 華沙寶;蒙古文網(wǎng)絡(luò)信息技術(shù)處理的對(duì)策[J];民族語(yǔ)文;2002年06期
2 白云莉;;蒙古文整詞輸入法的設(shè)計(jì)與實(shí)現(xiàn)[J];內(nèi)蒙古農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年03期
3 哈森其木格;;《蒙古文論發(fā)展概論》評(píng)析[J];內(nèi)蒙古民族大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2011年03期
4 烏日娜;;清代蒙古文歷史文獻(xiàn)及其整理研究概況[J];蘭臺(tái)世界;2011年19期
5 包力高;;蒙古文[J];民族語(yǔ)文;1980年02期
6 黃時(shí)鑒;;羅依果著《孝經(jīng)的古蒙古文譯本》簡(jiǎn)介[J];蒙古學(xué)資料與情報(bào);1984年02期
7 斯欽朝克圖;;蒙古文信息處理已進(jìn)入標(biāo)準(zhǔn)化[J];民族語(yǔ)文;1986年05期
8 吳肅民;關(guān)照宏;;蒙古文古籍種種[J];中國(guó)民族;1987年05期
9 昂如布;包力高;;關(guān)于改進(jìn)蒙古文的探討[J];蒙古學(xué)資料與情報(bào);1987年01期
10 雙福;;我國(guó)回鶻式蒙古文研究評(píng)述[J];蒙古學(xué)資料與情報(bào);1991年02期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 包艷花;圖格木勒;;多字體印刷蒙古文識(shí)別后處理研究[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
2 吉仁尼格;;蒙古文同形詞的統(tǒng)計(jì)法[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
3 呼斯勒;六月;斯日古楞;;淺談蒙古文通用編輯器幾點(diǎn)基本規(guī)范[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
4 道布;;回鶻式蒙古文[A];中國(guó)民族古文字[C];1982年
5 道布;;回鶻式蒙古文研究概況[A];中國(guó)民族古文字研究[C];1980年
6 白雙成;胡其圖;木仁;;蒙古文音節(jié)切分算法實(shí)現(xiàn)及其應(yīng)用[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
7 孟和吉雅;白音門德;敖其爾;田會(huì)利;;蒙古文語(yǔ)音合成技術(shù)研究[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
8 孟和吉雅;敖其爾;鞏政;;蒙古文網(wǎng)頁(yè)制作技術(shù)分析[A];第十屆全國(guó)少數(shù)民族語(yǔ)言文字信息處理學(xué)術(shù)研討會(huì)論文集[C];2005年
9 確精扎布;;蒙古文編碼國(guó)際標(biāo)準(zhǔn)通過(guò)以后研制的幾種蒙古文錄入系統(tǒng)比較[A];第十屆全國(guó)少數(shù)民族語(yǔ)言文字信息處理學(xué)術(shù)研討會(huì)論文集[C];2005年
10 寶金良;;蒙古文文本標(biāo)點(diǎn)符號(hào)及其屬性字段設(shè)置[A];第十屆全國(guó)少數(shù)民族語(yǔ)言文字信息處理學(xué)術(shù)研討會(huì)論文集[C];2005年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 記者 吉儒木圖;手機(jī)可以使用蒙古文了[N];內(nèi)蒙古日?qǐng)?bào)(漢);2007年
2 記者 解太榮;《蒙古秘史》回鶻體蒙古文復(fù)原項(xiàng)目完成[N];錫林郭勒日?qǐng)?bào);2009年
3 孟克;如何打破蒙古文圖書產(chǎn)銷兩難的困境[N];中國(guó)民族報(bào);2010年
4 記者 阿斯鋼;蒙古國(guó)總統(tǒng)簽命令推廣回鶻式蒙古文[N];新華每日電訊;2010年
5 記者 蘇布達(dá);全盟首屆蒙古文圖書節(jié)落幕[N];錫林郭勒日?qǐng)?bào)(漢);2012年
6 陳崗龍 (蒙古族);蒙古文文學(xué)翻譯的兩個(gè)問(wèn)題[N];文藝報(bào);2013年
7 金壇;蒙古文:描繪大自然的千姿百態(tài)[N];中國(guó)民族報(bào);2014年
8 阿勒得爾圖;沙日布卻瑪:用回鶻體蒙古文還原《蒙古秘史》[N];中國(guó)民族報(bào);2006年
9 記者 張文強(qiáng);蒙古文圖書農(nóng)牧民閱讀大接力活動(dòng)啟動(dòng)[N];內(nèi)蒙古日?qǐng)?bào)(漢);2008年
10 徐恒泰;要全力抓好蒙古文教學(xué)資源建設(shè)[N];鄂爾多斯日?qǐng)?bào);2008年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前8條
1 蘇向東;基于深度學(xué)習(xí)和知識(shí)策略的蒙古文古籍識(shí)別研究[D];內(nèi)蒙古大學(xué);2016年
2 淑琴;蒙古文同形詞知識(shí)庫(kù)的構(gòu)建[D];內(nèi)蒙古大學(xué);2010年
3 達(dá)古拉;《清內(nèi)秘書院蒙古文檔案匯編》語(yǔ)言研究[D];內(nèi)蒙古大學(xué);2012年
4 魏宏喜;蒙古文古籍圖像檢索技術(shù)研究[D];內(nèi)蒙古大學(xué);2012年
5 通拉嘎;基于蒙古文語(yǔ)料庫(kù)的人名自動(dòng)識(shí)別[D];中央民族大學(xué);2013年
6 莎日娜;烏蘭巴托版蒙古文譯本《今古奇觀》研究[D];中國(guó)社會(huì)科學(xué)院研究生院;2010年
7 王桂榮;蒙古文字結(jié)構(gòu)研究[D];內(nèi)蒙古大學(xué);2011年
8 普日布蘇榮;蒙古語(yǔ)語(yǔ)料庫(kù)建設(shè)的有關(guān)問(wèn)題[D];內(nèi)蒙古大學(xué);2015年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 關(guān)高娃;蒙古文停用詞和英文停用詞比較研究[D];內(nèi)蒙古大學(xué);2011年
2 常紅梅;袞布扎布語(yǔ)言論著中的蒙古文阿里嘎禮研究[D];內(nèi)蒙古大學(xué);2013年
3 劉璐;面向蒙古文增量g┱溝男畔⒓燜骷際躚芯縖D];內(nèi)蒙古大學(xué);2015年
4 李坤;蒙古文網(wǎng)絡(luò)熱點(diǎn)詞提取算法研究[D];內(nèi)蒙古大學(xué);2015年
5 王洪偉;基于規(guī)則和統(tǒng)計(jì)的西里爾與傳統(tǒng)蒙古文相互轉(zhuǎn)換方法研究[D];內(nèi)蒙古大學(xué);2015年
6 張畔;蒙古文搜索引擎基本方法的實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2015年
7 宋莉;蒙古文字造形元數(shù)據(jù)的分類編號(hào)探討[D];內(nèi)蒙古農(nóng)業(yè)大學(xué);2015年
8 青玉;指導(dǎo)小學(xué)生蒙古文正字法教學(xué)探析[D];內(nèi)蒙古師范大學(xué);2015年
9 達(dá)拉夫;文獻(xiàn)學(xué)視角下的蒙古文古籍研究[D];內(nèi)蒙古大學(xué);2015年
10 王亞君;基于Linux IBUS的傳統(tǒng)蒙古文輸入法的研究與實(shí)現(xiàn)[D];內(nèi)蒙古師范大學(xué);2015年
,本文編號(hào):1083196
本文鏈接:http://sikaile.net/tushudanganlunwen/1083196.html