首页 | 本学科首页   官方微博 | 高级检索  
     

基于Alluxio的新闻文本存储优化方法
作者姓名:桂静  王永滨
作者单位:1. 中国传媒大学媒体融合与传播国家重点实验室;2. 中国传媒大学计算机与网络空间安全学院
摘    要:新闻数据的指数级增长对新闻的高效存储和管理提出了重大挑战。为解决存储与计算分离模式下新闻文本的存储与读访问瓶颈问题,提出了一种基于数据编排平台Alluxio的新闻文本存储优化方法。首先,利用Alluxio对不同存储系统中的新闻文本进行缓存并提供统一命名空间,加速了计算应用的数据访问。其次,为了解决新闻文本存储在远程场景下所面临的读访问性能瓶颈问题,对新闻文本进行了基于目录聚合的合并,并利用最小完美哈希算法对新闻文本元数据构建索引,实现了新闻文本的快速检索。

关 键 词:分布式系统  新闻数据  小文件存储  缓存  Alluxio
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号