天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類碩士論文 >

Gzip-U:針對(duì)維吾爾語(yǔ)文本的壓縮算法研究

發(fā)布時(shí)間:2018-02-01 19:28

  本文關(guān)鍵詞: 移動(dòng)互聯(lián)網(wǎng) 維吾爾語(yǔ) 數(shù)據(jù)壓縮 Gzip 出處:《新疆大學(xué)》2017年碩士論文 論文類型:學(xué)位論文


【摘要】:移動(dòng)互聯(lián)網(wǎng)的發(fā)展引導(dǎo)著終端設(shè)備承載的信息量的與日俱增,移動(dòng)用戶分享的數(shù)據(jù)量的增長(zhǎng)與4G網(wǎng)絡(luò)的普及量密切相關(guān)。消極方面來(lái)說(shuō),移動(dòng)互聯(lián)網(wǎng)的發(fā)展對(duì)網(wǎng)絡(luò)數(shù)據(jù)的影響和有限的帶寬成為數(shù)據(jù)傳輸?shù)钠款i。在海量數(shù)據(jù)的處理中數(shù)據(jù)壓縮算法逐漸受到重視。數(shù)據(jù)壓縮是在不影響得知有效信息的前提下,縮小數(shù)據(jù)占用空間,以便通信更快更節(jié)省資源。本文首先概述數(shù)據(jù)壓縮在大數(shù)據(jù)時(shí)代中的重要意義,陳述了數(shù)據(jù)壓縮的基本概念和方法來(lái)證實(shí)壓縮的重要性。從數(shù)據(jù)壓縮的歷史探討逐步引入屬于無(wú)損壓縮的文本壓縮的基本思路和幾個(gè)壓縮算法。其次詳盡分析維吾爾文字母在Unicode編碼上的分布情況,根據(jù)維吾爾文的文本壓縮現(xiàn)狀更進(jìn)一步提出了對(duì)維吾爾文本的壓縮方法。為了方便理解提供的客戶端開(kāi)發(fā)中的部分核心代碼,事先簡(jiǎn)單介紹Xcode開(kāi)發(fā)環(huán)境,開(kāi)發(fā)語(yǔ)言的特性,開(kāi)發(fā)模式等基礎(chǔ)知識(shí)。最后利用Http協(xié)議上的Gzip編碼,核心內(nèi)容用試驗(yàn)的方法對(duì)維吾爾語(yǔ)文本提出一種改進(jìn)壓縮算法,命名為:Gzip-U。其主要思想是首先把詞語(yǔ)中的每個(gè)字母分解成獨(dú)立字符后轉(zhuǎn)換成Unicode表中的編碼類型再與前綴06比較(維吾爾文文本06區(qū)),如果包含前綴為06那先去掉前綴再把整個(gè)數(shù)據(jù)類型拼接成數(shù)組。而有些符號(hào)因?yàn)榕c英文的符號(hào)編碼一樣,不能套一個(gè)流程編碼和解碼。論文最后在同樣的數(shù)據(jù)上的實(shí)驗(yàn)表明,在Unicode編碼中,與Gzip相比Gzip-U算法更有效,壓縮比也提高3倍。
[Abstract]:The development of mobile Internet leads to the increasing amount of information carried by terminal devices. The increase of the amount of data shared by mobile users is closely related to the popularity of 4G networks. The influence of the development of the mobile internet on the network data and the limited bandwidth become the bottleneck of the data transmission. In the processing of the massive data, the data compression algorithm is paid more and more attention. The data compression does not affect the availability of information. On the premise. This paper first summarizes the significance of data compression in the big data era. This paper describes the basic concepts and methods of data compression to prove the importance of compression. From the history of data compression, the paper discusses the basic idea and several compression algorithms of text compression which belongs to lossless compression step by step. Secondly, the dimension is analyzed in detail. The distribution of my letters in Unicode codes. According to the current situation of Uygur text compression, this paper further proposes a compression method of Uighur text. In order to understand the client development provided in part of the core code. A brief introduction of the Xcode development environment, the characteristics of the development language, development patterns and other basic knowledge. Finally, the use of Gzip code on the Http protocol. This paper presents an improved compression algorithm for Uygur language text by experimental method. The main idea is to decompose each letter in a word into separate characters, then convert it to the encoding type in the Unicode table and compare it with the prefix 06. Uygur text 06). If it contains a prefix of 06, remove the prefix before splicing the entire data type into an array. Some symbols are encoded as symbols in English. Finally, experiments on the same data show that the Gzip-U algorithm is more efficient and the compression ratio is three times higher than that of Gzip in Unicode coding.
【學(xué)位授予單位】:新疆大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 于莎莎;;高校檔案館移動(dòng)服務(wù)趨勢(shì)及策略研究[J];檔案天地;2017年02期

2 張?jiān)迄i;;淺談iOS系統(tǒng)的使用心得[J];通訊世界;2016年08期

3 胡輝;;IOS環(huán)境下使用MVC模式進(jìn)行APP開(kāi)發(fā)的設(shè)計(jì)思路探索[J];數(shù)字技術(shù)與應(yīng)用;2015年06期

4 陳曉男;張海越;;NoSQL的分析與研究[J];科技創(chuàng)新導(dǎo)報(bào);2015年10期

5 右舍;;摩爾定律面臨挑戰(zhàn) 轉(zhuǎn)戰(zhàn)移動(dòng)賦新內(nèi)涵[J];通信世界;2015年14期

6 林娜;;4G時(shí)代移動(dòng)互聯(lián)網(wǎng)的發(fā)展趨勢(shì)[J];信息技術(shù)與信息化;2014年11期

7 楊海霞;楊冬英;;基于Map-Reduce的PageRank算法設(shè)計(jì)[J];電腦開(kāi)發(fā)與應(yīng)用;2014年09期

8 聶君;方之洋;;基于云計(jì)算的物聯(lián)網(wǎng)融合開(kāi)放技術(shù)架構(gòu)研究[J];郵電設(shè)計(jì)技術(shù);2014年01期

9 崔力升;;分布式文件系統(tǒng)的應(yīng)用研究[J];科技視界;2014年02期

10 鄧仲華;李志芳;;科學(xué)研究范式的演化——大數(shù)據(jù)時(shí)代的科學(xué)研究第四范式[J];情報(bào)資料工作;2013年04期

相關(guān)博士學(xué)位論文 前1條

1 于華楠;基于壓縮傳感的無(wú)線通信系統(tǒng)信道估計(jì)研究[D];吉林大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 宋立;iOS平臺(tái)社交應(yīng)用系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京交通大學(xué);2014年

2 馬海昌;基于大規(guī)模語(yǔ)料庫(kù)的中文同義詞抽取方法研究[D];西北師范大學(xué);2014年

3 張偉;基于壓縮感知框架的選擇性重構(gòu)方法[D];西安電子科技大學(xué);2014年

4 高雅靜;星載多光譜圖像高效壓縮技術(shù)研究[D];西安電子科技大學(xué);2013年

5 張自強(qiáng);基于內(nèi)容的音頻匹配研究[D];華東師范大學(xué);2012年

6 顧曉宇;移動(dòng)通信終端硬件設(shè)計(jì)研究[D];山東大學(xué);2011年

7 陳粒;P2PARES協(xié)議緩存服務(wù)器的研究與實(shí)現(xiàn)[D];南京郵電大學(xué);2011年

8 夏萍;數(shù)據(jù)壓縮技術(shù)的研究[D];中北大學(xué);2010年

9 陳宏旦;移動(dòng)P2P網(wǎng)絡(luò)中的基于DHT的分層Chord算法研究[D];重慶大學(xué);2010年

10 鄭桂鳳;移動(dòng)互聯(lián)網(wǎng)的用戶行為分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2010年



本文編號(hào):1482684

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1482684.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶316b9***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com