基于語料庫的藏文字屬性分析系統(tǒng)設(shè)計(jì)
[Abstract]:Through the statistics of Tibetan corpus and the analysis of modern Tibetan character structure, this paper studies the model of modern Tibetan character attribute analysis system, designs the basic component word table database, the combination component word table database, the coarse grained structure word table database and the fine-grained structure word table database. The structural features of each word table database are described, and an algorithm for attribute analysis of Tibetan characters is introduced. By using this algorithm and the attribute analysis system model of Tibetan characters, the use frequency, structure, word length, component decomposition, position and frequency of each component of modern Tibetan characters are analyzed, so as to study the layout of Tibetan keyboard and the input method of Tibetan. Tibetan search engine, machine translation and network information security provide theoretical basis.
【作者單位】: 青海師范大學(xué)藏文信息處理省部共建教育部重點(diǎn)實(shí)驗(yàn)室;
【基金】:國家自然科學(xué)基金資助項(xiàng)目(61163018) 國家“973”計(jì)劃前期研究專項(xiàng)基金資助項(xiàng)目(2010CB334708) 國家社會(huì)科學(xué)基金資助項(xiàng)目(09XYY024) 青海省科技廳應(yīng)用基礎(chǔ)研究計(jì)劃基金資助項(xiàng)目(2011-Z-755) 青海師范大學(xué)科研創(chuàng)新計(jì)劃基金資助項(xiàng)目,青海師范大學(xué)中青年科研基金資助項(xiàng)目
【分類號(hào)】:TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前7條
1 扎西次仁;《中華大藏經(jīng)·丹珠爾》藏文對(duì)勘本字頻統(tǒng)計(jì)分析[J];中國藏學(xué);1997年02期
2 才科扎西;黃景廉;;基于前綴樹的高效頻繁項(xiàng)集挖掘算法[J];計(jì)算機(jī)工程;2010年04期
3 王花;古麗拉·阿東別克;;基于語料的哈薩克語詞頻統(tǒng)計(jì)研究[J];計(jì)算機(jī)工程;2010年24期
4 高定國,龔育昌;現(xiàn)代藏字全集的屬性統(tǒng)計(jì)研究[J];中文信息學(xué)報(bào);2005年01期
5 才智杰;;藏文自動(dòng)分詞系統(tǒng)中緊縮詞的識(shí)別[J];中文信息學(xué)報(bào);2009年01期
6 才智杰;才讓卓瑪;;班智達(dá)藏文標(biāo)注詞典設(shè)計(jì)[J];中文信息學(xué)報(bào);2010年05期
7 才讓卓瑪;才智杰;;現(xiàn)代藏文字構(gòu)件分解方法[J];青海大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年04期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陳玉忠,俞士汶;藏文信息處理技術(shù)的研究現(xiàn)狀與展望[J];中國藏學(xué);2003年04期
2 尼瑪扎西;李志蜀;擁措;群諾;普頓;;實(shí)現(xiàn)計(jì)算機(jī)藏文快速輸入的關(guān)鍵問題研究[J];電子科技大學(xué)學(xué)報(bào);2009年01期
3 羅進(jìn)軍;;當(dāng)前計(jì)算語言學(xué)研究的發(fā)展態(tài)勢[J];湖南工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報(bào);2006年04期
4 歐珠;普次仁;大羅桑朗杰;趙棟才;劉芳;邊巴旺堆;;印刷體藏文文字識(shí)別技術(shù)研究[J];計(jì)算機(jī)工程與應(yīng)用;2009年24期
5 才讓加;;藏語語料庫加工方法研究[J];計(jì)算機(jī)工程與應(yīng)用;2011年06期
6 珠杰;歐珠;格桑多吉;;基于DOM修剪的藏文Web信息提取[J];計(jì)算機(jī)工程;2008年24期
7 陶克;王意潔;;數(shù)據(jù)流上的頻繁閉項(xiàng)集挖掘算法[J];計(jì)算機(jī)工程;2010年18期
8 許曉東;李柯;朱士瑞;;Web日志中RCFA路徑的挖掘方法[J];計(jì)算機(jī)工程;2010年22期
9 史建軍;繆裕青;;微陣列數(shù)據(jù)中Top-k頻繁閉合項(xiàng)集挖掘[J];計(jì)算機(jī)工程;2011年02期
10 彭學(xué)武;王黎明;;三維數(shù)據(jù)集中基于位運(yùn)算的挖掘算法[J];計(jì)算機(jī)工程;2011年06期
相關(guān)會(huì)議論文 前3條
1 江荻;;藏語文本信息處理的歷程與進(jìn)展[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
2 劉匯丹;芮建武;吳健;;藏文網(wǎng)頁的編碼識(shí)別與轉(zhuǎn)換[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
3 才讓加;頭旦才讓;周毛先;;藏語語料庫加工方法研究[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識(shí)庫建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
相關(guān)碩士學(xué)位論文 前10條
1 何向真;多語言電子詞典構(gòu)建[D];西北民族大學(xué);2010年
2 王思麗;藏文網(wǎng)頁自動(dòng)發(fā)現(xiàn)與采集技術(shù)研究[D];西北民族大學(xué);2010年
3 劉濤;藏文數(shù)字圖書館的研究與實(shí)踐[D];湖南大學(xué);2005年
4 李剛;印刷體藏文識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[D];上海交通大學(xué);2007年
5 頓珠次仁;Openoffice藏文本地化及其實(shí)現(xiàn)[D];西藏大學(xué);2008年
6 尼瑪扎西;漢藏在線翻譯多媒體電子詞典設(shè)計(jì)研究與實(shí)現(xiàn)[D];西藏大學(xué);2008年
7 邊巴旺堆;基于ISO/IEC10646藏文編碼字符集標(biāo)準(zhǔn)的藏文排序算法設(shè)計(jì)與實(shí)現(xiàn)[D];西藏大學(xué);2009年
8 春燕;藏文編碼識(shí)別與轉(zhuǎn)換算法的研究與實(shí)現(xiàn)[D];西南交通大學(xué);2010年
9 普布旦增;藏文自動(dòng)分詞技術(shù)方法研究[D];西藏大學(xué);2010年
10 官卻多杰;漢藏輔助翻譯研究與實(shí)現(xiàn)[D];西藏大學(xué);2011年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陳玉忠,俞士汶;藏文信息處理技術(shù)的研究現(xiàn)狀與展望[J];中國藏學(xué);2003年04期
2 孫茂松,鄒嘉彥;漢語自動(dòng)分詞研究評(píng)述[J];當(dāng)代語言學(xué);2001年01期
3 劉艷;古麗拉.阿東別克;伊力亞爾;;哈薩克語詞性自動(dòng)標(biāo)注研究初探[J];計(jì)算機(jī)工程與應(yīng)用;2008年20期
4 曹洪其;姜志峰;孫志揮;;基于FP-tree的多層關(guān)聯(lián)規(guī)則快速挖掘算法[J];計(jì)算機(jī)工程;2007年19期
5 張艷;石磊;衛(wèi)琳;;Web緩存優(yōu)化模型研究[J];計(jì)算機(jī)工程;2009年08期
6 熊忠陽;付玲玲;張玉芳;蔣健;;結(jié)合語義的特征選擇方法[J];計(jì)算機(jī)應(yīng)用;2010年10期
7 江荻,周季文;論藏文的序性及排序方法[J];中文信息學(xué)報(bào);2000年01期
8 王浩軍,趙南元,鄧鋼軼;一種現(xiàn)代藏文筆段提取算法[J];中文信息學(xué)報(bào);2001年04期
9 陳玉忠,李保利,俞士汶;藏文自動(dòng)分詞系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];中文信息學(xué)報(bào);2003年03期
10 李慶虎,陳玉健,孫家廣;一種中文分詞詞典新機(jī)制——雙字哈希機(jī)制[J];中文信息學(xué)報(bào);2003年04期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 扎西加;高定國;;藏語語料庫TEI標(biāo)記規(guī)范探討[J];中文信息學(xué)報(bào);2011年04期
2 于康;;【自制語料庫】第1講 軟件的下載與安裝[J];日語知識(shí);2011年08期
3 宋玉璞;劉敏;;軟件構(gòu)件在專家系統(tǒng)中的應(yīng)用研究[J];價(jià)值工程;2011年20期
4 朱培焱;夏棟梁;;漢英跨語言信息檢索研究[J];計(jì)算機(jī)與現(xiàn)代化;2011年08期
5 羅細(xì)平;;基于構(gòu)件的軟件工程概念模型研究[J];科技創(chuàng)新導(dǎo)報(bào);2011年19期
6 胡莉;;中文“詞”的語言模型識(shí)別研究方法綜述[J];北方文學(xué)(下半月);2011年03期
7 楊撼岳;陳笑蓉;鄭高山;;水族文字筆形編碼方法研究[J];計(jì)算機(jī)工程;2011年14期
8 靳丹寧;;基于語料庫調(diào)查中動(dòng)詞句型錯(cuò)誤探析[J];安徽電子信息職業(yè)技術(shù)學(xué)院學(xué)報(bào);2011年04期
9 彭成;季培培;;基于確定性退火的中文術(shù)語語義層次關(guān)聯(lián)研究[J];計(jì)算機(jī)應(yīng)用研究;2011年09期
10 楊皓東;江凌;李國俊;;國內(nèi)自然語言處理研究熱點(diǎn)分析——基于共詞分析[J];圖書情報(bào)工作;2011年10期
相關(guān)會(huì)議論文 前10條
1 郭曙綸;;基于語料庫的HSK多功能例解字典:設(shè)想與樣例[A];2004年辭書與數(shù)字化研討會(huì)論文集[C];2004年
2 梁紅梅;尹曉霞;李宇莊;;有關(guān)語料庫驅(qū)動(dòng)下的外語在線自主學(xué)習(xí)的工作底稿[A];全國大學(xué)英語教學(xué)改革暨網(wǎng)絡(luò)環(huán)境下外語教學(xué)學(xué)術(shù)研討會(huì)論文集[C];2004年
3 許小星;亢世勇;孫茂松;劉金鳳;;語料庫語義成分標(biāo)注的若干問題[A];第三屆學(xué)生計(jì)算語言學(xué)研討會(huì)論文集[C];2006年
4 宋鴻彥;劉軍;姚天f ;劉全升;黃高輝;;漢語意見型主觀性文本標(biāo)注語料庫的構(gòu)建[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
5 黃玉;李生;孟遙;丁華福;;基于大規(guī)模語料庫的英語從句識(shí)別[A];第一屆學(xué)生計(jì)算語言學(xué)研討會(huì)論文集[C];2002年
6 李明;;語料庫·藍(lán)本·雙語詞典[A];中國辭書學(xué)會(huì)雙語詞典專業(yè)委員會(huì)第五屆年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2003年
7 郭啟新;;論語料庫與英漢詞典配例[A];中國辭書學(xué)會(huì)雙語詞典專業(yè)委員會(huì)第四屆年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2001年
8 王仁華;胡郁;李威;凌震華;;基于決策樹的漢語大語料庫合成系統(tǒng)[A];第六屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];2001年
9 蔡蓮紅;蔡銳;吳志勇;陶建華;;語音合成語料庫的設(shè)計(jì)與聲學(xué)特征分析[A];中國聲學(xué)學(xué)會(huì)2002年全國聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2002年
10 郭慧志;王強(qiáng)軍;劉華;張普;;大規(guī)模動(dòng)態(tài)流通語料庫的構(gòu)建[A];第二屆全國學(xué)生計(jì)算語言學(xué)研討會(huì)論文集[C];2004年
相關(guān)重要報(bào)紙文章 前10條
1 姚雙云 華中師范大學(xué)語言與語言教育研究中心;虛詞知識(shí)庫:中文信息處理的基石[N];中國社會(huì)科學(xué)報(bào);2011年
2 記者 梁捷;我國中文信息處理技術(shù)從實(shí)驗(yàn)室走向全面應(yīng)用[N];光明日?qǐng)?bào);2009年
3 倪光南;活力重現(xiàn)的中文信息處理[N];計(jì)算機(jī)世界;2001年
4 齊悅;速記界泰斗唐亞偉 獲中文信息處理領(lǐng)域最高科技獎(jiǎng)[N];中國質(zhì)量報(bào);2006年
5 本報(bào)記者 王向華;藏文圖書:發(fā)現(xiàn)幾多雪原奇葩[N];四川日?qǐng)?bào);2009年
6 本報(bào)記者 蔣翠蓮;信息化使古老藏文煥發(fā)生機(jī)[N];西藏日?qǐng)?bào);2009年
7 大山;藏文媒體發(fā)展還需加力[N];西藏日?qǐng)?bào);2009年
8 樊曦;藏文軟件讓藏族同胞踏上信息化“天路”[N];中國民族報(bào);2010年
9 記者 張黎黎 曉勇;新一代藏文軟件推廣應(yīng)用取得實(shí)質(zhì)進(jìn)展[N];西藏日?qǐng)?bào);2010年
10 唐大山;為傳統(tǒng)藏文插上科技翅膀[N];西藏日?qǐng)?bào);2010年
相關(guān)博士學(xué)位論文 前10條
1 張廷香;基于語料庫的3-6歲漢語兒童詞匯研究[D];山東大學(xué);2010年
2 由麗萍;構(gòu)建現(xiàn)代漢語框架語義知識(shí)庫技術(shù)研究[D];上海師范大學(xué);2006年
3 呂艷輝;基于語料庫的現(xiàn)代漢語手部動(dòng)詞研究[D];山東大學(xué);2008年
4 夏云;基于語料庫的英漢翻譯小說常規(guī)化研究:歷時(shí)的視角[D];山東大學(xué);2010年
5 李瓊;漢語復(fù)句書讀前后語言片段的非分句識(shí)別[D];華中師范大學(xué);2008年
6 何婷婷;語料庫研究[D];華中師范大學(xué);2003年
7 王青;基于語料庫的《尤利西斯》漢譯本譯者風(fēng)格研究[D];山東大學(xué);2010年
8 吳應(yīng)良;網(wǎng)絡(luò)計(jì)算中的智能信息處理方法研究[D];華南理工大學(xué);2000年
9 尹蔚;多維視域下的有標(biāo)選擇復(fù)句研究[D];華中師范大學(xué);2008年
10 唐斌;《人民日?qǐng)?bào)》中(1987-2007)農(nóng)民工的話語再現(xiàn)[D];上海外國語大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 羅麗俊;中文信息處理中若干技術(shù)的研究與實(shí)現(xiàn)[D];遼寧科技大學(xué);2008年
2 苗璽;中文語料庫切分不一致字串分類校驗(yàn)方法研究[D];山西大學(xué);2006年
3 傅成宏;現(xiàn)代漢語兼語結(jié)構(gòu)的自動(dòng)識(shí)別[D];南京師范大學(xué);2007年
4 梁文娟;漢字語法語義智能輸入法搭配庫設(shè)計(jì)與實(shí)現(xiàn)[D];河南大學(xué);2006年
5 沈威;基于渡越矩陣與語境計(jì)算模型的復(fù)句關(guān)系詞的自動(dòng)標(biāo)注[D];華中師范大學(xué);2007年
6 秦健;N-gram技術(shù)在中文詞法分析中的應(yīng)用研究[D];中國海洋大學(xué);2009年
7 關(guān)宏超;基于統(tǒng)計(jì)的開放式漢語自動(dòng)分詞[D];大連理工大學(xué);2002年
8 錢小飛;含“的”最長名詞短語的自動(dòng)識(shí)別[D];南京師范大學(xué);2007年
9 羅萬;基于生成性詞庫分詞技術(shù)的漢語拼音自動(dòng)轉(zhuǎn)換研究[D];湖南師范大學(xué);2009年
10 謝曉燕;基于眼動(dòng)技術(shù)和動(dòng)態(tài)流通語料庫(DCC)的漢語閱讀注視塊研究[D];北京語言大學(xué);2005年
,本文編號(hào):2391950
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2391950.html