首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 426 毫秒
1.
一种基于动态词典的英文文本压缩算法   总被引:1,自引:0,他引:1  
传统的压缩算法LZ77、LZ78以及改进的LZW都是以单字符为单位进行处理的.这种处理模式降低了对多字符词汇相关性的适应速度,从而直接导致压缩效率的降低.为了提高压缩效率,在LZW压缩算法的基础之上,结合以词汇为单位的处理模式的设计思想,提出了一种基于词汇模式的LZW算法.实验结果表明,这种以词汇为基础的文本压缩算法比原来的LZW算法具有稳定的、更高的压缩效率.该压缩算法可直接推广应用到其他语言的文本压缩中去.  相似文献   

2.
针对电力系统采样数据量大,传输、存储困难等问题,根据采样数据特点,整数小波变换理论以及LZ系列压缩算法,提出应用整数小波变换的LZ77电力数据压缩算法.该算法针对电力系统数据周期性的特点,选择合适的小波基,依据其多分辨率分析特性,将电力数据信号变换到小波域,使信号分解为低频分量和高频分量.对具有重要价值的低频信息使用LZ77压缩算法进行无损压缩,对高频分量进行阈值量化处理.通过仿真测试,获得了10.76%的压缩比和2.078%的重构误差,证实该算法是一种有效的实时数据压缩方法.  相似文献   

3.
LZ77压缩算法及其派生算法探究   总被引:2,自引:0,他引:2       下载免费PDF全文
随着信息量的不断增加,现在用计算机处理的文件越来越大,并且这些信息的表达都存在一定的冗余,因此我们需要使用压缩算法对信息进行压缩。本文介绍了数据压缩算法的发展历程和Z77压缩算法的编程实现。  相似文献   

4.
基于列存储数据库数据访问的特点, 对主流整数压缩格式进行改进, 提出了3种整数压缩算法及相应的压缩态数据访问算法. 实验结果表明, 不解压而直接访问压缩态数据非常高效, 从而为数据的压缩态运算提供了有力支持.  相似文献   

5.
肖武德 《甘肃科技》2010,26(4):45-48,39
随着知识爆炸式的发展,数据压缩在计算机领域起到举足轻重的作用。Huffman编码是一种常用的压缩方法,其原理是将使用次数多的代码转换成长度较短的代码,而使用次数少的可以使用较长的编码,并且保持编码的唯一可解性。LZ77算法通过使用已经出现过的相应匹配数据信息替换当前数据从而实现压缩功能。LZW算法是基于LZ77思想的一个变种。由于专利权原因,LZW没有得到像LZ77一样的流行。DEFLATE方法是LZ77算法与Huffman编码的组合,具有LZ77与Huffman编码的优势。DEFLATE方法具有开源通用高压缩率的优势,因此,得到了广泛的应用。将采用DEFLATE方法的GZIP压缩应用到B/S架构的企业应用中可以减小网络传输的数据量,进而提高系统的整体性能。  相似文献   

6.
文本压缩算法的比较研究   总被引:2,自引:0,他引:2  
论述了4种不同的文本压缩算法。根据压缩算法的优点和缺点,在实践中,要有针对性选择算法,用其优点,从而得到比较理想的压缩文本。  相似文献   

7.
进行计算机远程控制时,为实时显示受控端受控桌面,受控端受控程序需要不断的发送改变区域的图像数据到控制端控制程序,未经处理的图像数据量很大,对这样的图像进行传输和处理将对网络带宽、处理器造成很大的压力,必需使用有效的压缩编码技术对图像进行压缩编码以提高传输和处理的速度。本文主要分析LZ77算法和Hufihlan编码  相似文献   

8.
在分析了Alpha图像的特征及其在串匹配编码过程中未匹配像素的分布情况之后,提出了一种Alpha图像熵编码的改进算法.该算法首先对未匹配像素进行滤波处理使其具有独特的分布性质,然后依据该性质进行分段编码以减少码流比特数,从而达到更好的压缩效率.实验结果表明,相比于LZ4HC,ZLIB,PNG等常用的压缩算法,改进算法具有编码效率高和复杂度低的优势.  相似文献   

9.
藏文作为一门古老的语言有其独有的规则和特点。随着网络的普及,互联网用户中的藏族同胞迅速增加,网络上的藏文文本也越来越多。利用藏文文本聚类来提供更高效的管理和更良好的用户体验成为近年的研究热点。本文首先介绍了藏文文本聚类的应用背景和相关概念,然后介绍了藏文文本特点和藏文文本聚类的相关技术,讨论了藏文文本建模和聚类算法,最后对藏文聚类发展和应用进行了总结和展望。  相似文献   

10.
针对藏文信息处理的需求,提出了一套层次化、基于规则的藏文文本规范化处理方案.首先分析整理了藏文文本中的不规范文本类型,然后根据藏文文本中不同类型的不规范文本特征,分别设计文本规范化算法,并用程序实现了藏文文本的规范化.最后对该方法进行了实验测试,测试结果表明该方法能较好地实现藏文文本的规范化.  相似文献   

11.
为了获取压缩中文文本的高压缩比,变长编码集合扩展的中文文本压缩算法依据中文语言文字的特点,以不等长高概率汉字串为单位,定义固定字典集,同时寻求高压缩率的匹配方式进行编码,算的编码转换过程适应了自然语言中的部分马尔可夫过程,相对于不同文本长度及文体风格压缩比分布均衡,此算法能够获得较高的压缩比。  相似文献   

12.
在搜索技术和各种流行的排序算法优缺点比较的基础上,给出了一种基于后缀数组的新的快速排序算法,该算法在时间和空间性能上均优于传统的快速排序算法;并在同等的条件下,用该方法与快速排序算法对相同的内容进行排序,结果表明:该算法特别适用于大文本的排序问题,可用于搜索技术和数据压缩中.  相似文献   

13.
藏语语音信号降噪算法研究   总被引:1,自引:0,他引:1  
藏语语音在识别过程中会受到各种信号的干扰,从而影响语音识别的质量。在进行语音识别预处理过程中,语音信号的降噪技术是一个关键的环节。文章通过分析各种降噪手段,重点研究了藏语语音信号降噪方法,提出了符合藏语语音信号降噪的小波包降噪算法。其研究结果为进一步的藏语语音识别技术的研究提供了基础。  相似文献   

14.
双门限算法是语音端点检测的一种重要方法,对藏语语音识别和处理具有重要意义。提出了用双门限端点检测技术对藏语语音进行音节分割的方法,首先根据双门限语音端点检测原理进行Matlab编程和仿真,然后结合藏语语音的音节特点和双门限算法分别在正常语速和慢语速环境下对藏语的30个辅音语音、随机抽取的双音节、三音节及句子语音进行双门限算法的音节分割和分析,实验表明双门限算法对没有太多连读音节的藏语语音和慢语速下长句的音节分割准确率较高。  相似文献   

15.
藏语特征提取算法是藏语语音识别系统中最为关键的一个环节。文章在分析藏语发音特点的基础上,建立了基于模拟人耳听觉系统的Mel倒谱系数(MFCC)特征提取算法,然后通过LDA信息压缩算法,对提取的特征数据进行压缩,在降低维数的同时提高了识别率和运算效率,总结出了符合藏语语音特点的LDA-MFCC特征提取算法。  相似文献   

16.
改进的PPM数据压缩算法及性能分析和比较   总被引:1,自引:0,他引:1  
PPM算法在文本无损压缩方面具有比LZ算法更高的压缩率。PPM算法分建模和编码两步,在建模时有两种方法选择上下文模型,一种是固定最大长度上下文,即PPM;另一种是不固定最大长度上下文,即PPM^*.在VC 环境下利用PPM^* D算法编制的压缩软件,通过对文本、图像、声音文件以及可执行文件进行实验,效果令人满意,其压缩率都比Winzip要高.  相似文献   

17.
移动通讯技术的快速发展使移动下载服务越来越普及.针对手机存储容量有限和文件版权保护的问题,提出一种针对二进制文本文件的ICE算法,它基于著名的压缩算法Huffman,通过在压缩过程加入密钥实现文件压缩和加密的一次运算完成,不仅节约了手机存储空间,而且避免了文件的恶意传播.通过仿真实现,ICE算法在加密强度、压缩效率、内存占用、运行时间、代码大小上具有良好效果,证明了ICE算法在移动文件下载服务的有效可行性.  相似文献   

18.
以藏文音节拼写检查、梵音转写藏文检查、接续关系检查、词语检查为研究内容, 提出藏文文本自动校对框架和接续关系检查算法。根据该框架及算法, 设计并实现藏文自动校对系统。通过实验证明算法和系统的可靠性和有效性。  相似文献   

19.
改进Huffnan算法,提出了多叉树Huffnan算法.理论分析表明该算法优于常规的Huffnan算法,其平均码长已接近信源的熵函数值,且其解码速度快.将其实现用于文本压缩,压缩比大约为3:1左右.该算法已长期用于众多产品中,取得了良好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号