藏文搜索引擎中的分詞算法研究
本文關(guān)鍵詞:藏文搜索引擎中的分詞算法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著藏文信息技術(shù)的不斷普及和發(fā)展,搜索引擎技術(shù)成為藏文信息處理一項新的研究課題。對搜集到的藏文網(wǎng)頁文本或用戶查詢關(guān)鍵詞進(jìn)行理解、提取和組織等處理是搜索引擎的一項基礎(chǔ)性工作,其中藏文分詞的準(zhǔn)確與否,直接影響到搜索引擎查詢效果及查詢結(jié)果列表的排序問題,因此分詞成為藏文搜索引擎技術(shù)中需要解決的關(guān)鍵問題。文章針對藏文搜索引擎中基于字符串匹配的藏文分詞技術(shù)進(jìn)行研究并提出相應(yīng)的解決算法。
【作者單位】: 西藏大學(xué)藏文信息技術(shù)研究中心;
【關(guān)鍵詞】: 藏文搜索引擎 藏文文本 藏文分詞
【基金】:2013年度西藏大學(xué)青年科研培育基金項目“藏文搜索引擎倒排索引模塊的設(shè)計與實(shí)現(xiàn)”(項目號:ZDPJZK201310) 2011年度國家自然科學(xué)基金項目“基于虛詞的藏語基本句型的形式化研究”(項目號:61063015);2011年度國家自然科學(xué)基金項目“藏語依存樹庫的構(gòu)建”(項目號:61163043)階段性成果
【分類號】:TP391.1
【正文快照】: 引言近幾年藏文信息處理研究內(nèi)容的不斷擴(kuò)展和深入,為藏文搜索引擎技術(shù)提供了較為實(shí)用的理論和實(shí)踐基礎(chǔ)。然而藏文分詞處理技術(shù)作為藏文搜索引擎的基礎(chǔ)環(huán)節(jié),在整個搜索引擎中起著舉足輕重的作用。如果不能很好的處理藏文分詞問題,那么藏文搜索引擎也就無從談起,成為無根之木。
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 丁俊苗;;不足與需要:論標(biāo)點(diǎn)符號的語法功能[J];安徽大學(xué)學(xué)報(哲學(xué)社會科學(xué)版);2008年04期
2 魏順平;;2010年度教育技術(shù)(遠(yuǎn)程教育)研究進(jìn)展調(diào)查與分析[J];北京廣播電視大學(xué)學(xué)報;2011年05期
3 胡莉;;中文“詞”的語言模型識別研究方法綜述[J];北方文學(xué)(下半月);2011年03期
4 李玉森;張雪英;袁正午;;面向GIS的地理命名實(shí)體識別研究[J];重慶郵電大學(xué)學(xué)報(自然科學(xué)版);2008年06期
5 王海靜;;俗語語料庫與語典編纂相關(guān)問題的思考[J];辭書研究;2011年04期
6 邱金萍;裴雨來;;幾種動詞義項區(qū)分的判定方法[J];滁州學(xué)院學(xué)報;2009年02期
7 魏順平;何克抗;;文本智能處理技術(shù)在遠(yuǎn)程教育元研究中的應(yīng)用[J];中國遠(yuǎn)程教育;2007年08期
8 魏順平;;基于文獻(xiàn)文本的概念圖構(gòu)建方法——以協(xié)作學(xué)習(xí)領(lǐng)域概念圖構(gòu)建為例[J];中國遠(yuǎn)程教育;2008年02期
9 魏順平;;語料庫支持下的小學(xué)語文閱讀環(huán)境創(chuàng)設(shè)研究[J];電化教育研究;2008年01期
10 馬林兵;曹小曙;;空間關(guān)系的動態(tài)性和模糊性描述[J];地理與地理信息科學(xué);2006年06期
中國重要會議論文全文數(shù)據(jù)庫 前8條
1 段永強(qiáng);馬亞平;王世文;;基于智能模板的文圖互生自動轉(zhuǎn)換的研究[A];全國第19屆計算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會議論文集(下冊)[C];2008年
2 林小俊;田浩;王馨浩;杜蘊(yùn)璇;許敏;吳璽宏;遲惠生;;語言模型訓(xùn)練語料處理方法及解碼詞典的設(shè)計[A];第八屆全國人機(jī)語音通訊學(xué)術(shù)會議論文集[C];2005年
3 王斯日古楞;德·薩日娜;那順烏日圖;;現(xiàn)代蒙古語謂語段自動標(biāo)注系統(tǒng)的設(shè)計與實(shí)現(xiàn)[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年
4 周學(xué)文;鄭玉玲;;《元朝秘史》相似人名考[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年
5 才華;趙晨星;;藏漢英詞匯對照語料庫的設(shè)計[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年
6 陳毅恒;秦兵;劉挺;林建國;李生;;基于錯誤預(yù)測的文本分類方法[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
7 王東波;陳小荷;年洪東;;有標(biāo)記聯(lián)合結(jié)構(gòu)的語言學(xué)特征統(tǒng)計分析[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年
8 王花;古麗拉·阿東別克;;基于語料的哈薩克語詞頻統(tǒng)計的研究[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 斯·勞格勞;現(xiàn)代蒙古語依存句法自動分析研究[D];內(nèi)蒙古大學(xué);2011年
2 劉朝濤;中文問答系統(tǒng)中的句型理論及其應(yīng)用研究[D];重慶大學(xué);2010年
3 馮文賀;漢語連詞及其相關(guān)結(jié)構(gòu)的依存分析[D];武漢大學(xué);2011年
4 鄧杰;論語言測試效度的辯論方法[D];上海外國語大學(xué);2011年
5 甘瑞瑗;國別化“對外漢語教學(xué)用詞表”制定的研究:以韓國為例[D];北京語言大學(xué);2005年
6 劉偉;現(xiàn)代漢語代詞隱現(xiàn)的動態(tài)研究[D];北京語言大學(xué);2005年
7 易勇;計算機(jī)輔助詩詞創(chuàng)作中的風(fēng)格辨析及聯(lián)語應(yīng)對研究[D];重慶大學(xué);2005年
8 額爾敦朝魯;面向信息處理的蒙古語動詞語義研究[D];內(nèi)蒙古大學(xué);2005年
9 達(dá)胡白乙拉;蒙古語基本動詞短語自動識別研究[D];內(nèi)蒙古大學(xué);2005年
10 張亮;面向開放域的中文問答系統(tǒng)問句處理相關(guān)技術(shù)研究[D];南京理工大學(xué);2006年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 左維松;規(guī)則和統(tǒng)計相結(jié)合的篇章情感傾向性分析研究[D];鄭州大學(xué);2010年
2 黃勇杰;基于統(tǒng)計NLP技術(shù)的甲骨卜辭的分析研究[D];華東師范大學(xué);2010年
3 蘇俊峰;基于HMM的藏語語料庫詞性自動標(biāo)注研究[D];西北民族大學(xué);2010年
4 阿圓;高校校園網(wǎng)論壇熱點(diǎn)話題發(fā)現(xiàn)系統(tǒng)的研究與實(shí)現(xiàn)[D];昆明理工大學(xué);2009年
5 趙小曼;英漢平行語料庫句子級對齊研究及其在機(jī)器翻譯中的應(yīng)用[D];安徽大學(xué);2010年
6 戴霖;網(wǎng)絡(luò)輿情信息挖掘關(guān)鍵技術(shù)研究與應(yīng)用[D];浙江工商大學(xué);2011年
7 徐艷艷;本體技術(shù)在協(xié)同學(xué)習(xí)交互信息處理中的應(yīng)用研究[D];山東師范大學(xué);2011年
8 李芬;雙音結(jié)構(gòu)“X以”的詞匯化研究[D];華中師范大學(xué);2011年
9 吳金星;蒙古語詞法標(biāo)注語料庫的構(gòu)建及相關(guān)技術(shù)研究[D];內(nèi)蒙古大學(xué);2011年
10 包薩仁圖雅;蒙古語簡單句句法結(jié)構(gòu)樹庫的建設(shè)[D];內(nèi)蒙古大學(xué);2011年
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 普布旦增;歐珠;;藏文分詞中交集型歧義字段的切分方法研究[J];西藏大學(xué)學(xué)報(社會科學(xué)版);2010年S1期
2 高定國;關(guān)白;;回顧藏文信息處理技術(shù)的發(fā)展[J];西藏大學(xué)學(xué)報(社會科學(xué)版);2009年03期
3 史曉東;盧亞軍;;央金藏文分詞系統(tǒng)[J];中文信息學(xué)報;2011年04期
4 扎西加;珠杰;;面向信息處理的藏文分詞規(guī)范研究[J];中文信息學(xué)報;2009年04期
5 關(guān)白;;信息處理用藏文分詞單位研究[J];中文信息學(xué)報;2010年03期
6 李海剛;于洪志;;藏文文本情感分類系統(tǒng)設(shè)計[J];甘肅科技縱橫;2011年01期
7 才智杰;才讓卓瑪;;藏文自動分詞系統(tǒng)的設(shè)計[J];計算機(jī)工程與科學(xué);2011年05期
8 江濤;于洪志;徐濤;;互聯(lián)網(wǎng)藏文內(nèi)容安全檢測過濾系統(tǒng)研究[J];信息網(wǎng)絡(luò)安全;2009年10期
9 才智杰;;藏文自動分詞系統(tǒng)中緊縮詞的識別[J];中文信息學(xué)報;2009年01期
10 才智杰;;班智達(dá)藏文自動分詞系統(tǒng)的設(shè)計與實(shí)現(xiàn)[J];青海師范大學(xué)民族師范學(xué)院學(xué)報;2010年02期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 才智杰;索南仁欠;;藏文分詞算法研究[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年
本文關(guān)鍵詞:藏文搜索引擎中的分詞算法研究,由筆耕文化傳播整理發(fā)布。
本文編號:457260
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/457260.html