摘 要: | 在大数据背景下,非结构化云数据管理系统中数据节点需要处理不断膨胀的原 始数据、索引数据和中间数据,“数据膨胀”将显著增加云数据管理系统的时间和能耗等 各类开销. 为降低非结构化数据管理系统因数据频繁移动而导致的数据传输开销,文中提 出了一种不稳定数据分区的识别算法. 首先面向非结构化数据管理系统,通过引入云模型 理论对存储系统中的数据分区进行云建模,识别出不稳定的数据分区,然后调用相关算法 对其进行重新布局. 实验结果显示,不稳定数据分区识别算法可以有效地识别出不稳定的 数据分区,对其重新布局后,降低数据传输开销的效果显著.
|