多語言電子詞典構建
【文章頁數(shù)】:57 頁
【學位級別】:碩士
【部分圖文】:
圖2-1一個完整的藏文音節(jié)藏文字序,即藏文字典序,是通過比較各個位置上的字符的優(yōu)先關系而確定的
語言障礙地推向市場,除了解決排序語言軟件主要以文字的形式來顯示在對同一事物的拼寫不同,形狀不同,靠文字來交互,少數(shù)是圖形。即使語這個問題,表2-1。表2-1不同語言文字的尺寸差別漢語藏語樹贕繴︽纈軹繴︽﹀稱義︽纈羑繳纍﹀,音節(jié)與音節(jié)間用音節(jié)分隔符分開而)是由前加字符、....
圖3-3使用文本編輯器打開ifo文件后顯示的內容
期處理的詞條信息采用文本文件存儲,具體存儲的格式為:文件設定詞典信息文件,詞典信息文件中存儲詞典文件的名、詞條數(shù)量信息等字典的基本信息。文本文件編譯成相應的字典庫文件,將編譯后的文件提供給足用戶的需要,用戶想要添加自己的詞典,就可以把所需要換成字典可以使用的文件,就可以將自己的詞....
圖3-4詞典庫的整理在Excel表格中整理好的詞庫,最后在形成詞庫文件的時候,在專用文本編輯器②中編輯,
接著就是第二個單詞,依次重復。所有這些單詞,按一定的排序規(guī)則來存儲類似strcasecmp的函數(shù)。3)dict文件格式:dict文件是純粹的數(shù)據(jù)塊,每個數(shù)據(jù)塊的開始偏移地址和大小件里了。由于idx文件里已經(jīng)有了數(shù)據(jù)長度信息,所以字符串可以不要結尾的\0塊的類型由.if....
圖4-7多語言詞典取詞結果
圖4-7多語言詞典取詞結果碼自動檢測及編碼轉換技術實現(xiàn)多語言電子詞典中,由于藏文詞庫的編碼采用的是基于Unicod鼠標取詞只限定于Unicode編碼的藏文。但是,這樣會產生一操作過程中,有時候并不知道所要取詞的文本是何種編碼的藏測詞庫中沒有相關釋義的詞。加之目前藏文編碼....
本文編號:3930431
本文鏈接:http://sikaile.net/wenyilunwen/yuyanxuelw/3930431.html