摘 要: | 基于专家模型算法(XM 算法)原理和有限上下文混合统计模型估计 DNA 序列每一个符号的概率,提出一种基于混合统计模型的 DNA 序列压缩算法.将采用混合统计模型计算出的概率估计应用于算术编码中,对标准 DNA 序列集的符号位进行压缩编码.实验结果表明,文中提出的混合统计模型能得到比原有限上下文模型更好的压缩效果,且能比其他经典 DNA 序列压缩算法产生更大的压缩率,弥补基于统计信息的当前较先进的XM 算法用于标准 DNA 序列集时一些数据的不足,但对高通量 DNA 系列的压缩效果有待提高.
|