一种大容量数据文件抽取算法的优化研究 |
| |
作者姓名: | 张志强 王伟钧 施达 |
| |
作者单位: | 成都大学信息科学与工程学院,四川成都610106;成都大学模式识别与智能信息处理四川省高校重点实验室,四川成都610106;成都大学信息科学与工程学院,四川成都,610106 |
| |
基金项目: | 四川省科技厅基础与应用研究项目;成都市科技局科技项目;成都大学模式识别与智能信息处理四川省高校重点实验室科研基金资助项目 |
| |
摘 要: | 数据挖掘过程中,对数据文件进行数据抽取是构建数据仓库的重要过程.目前在抽取大容量数据文件时会出现很多局限性问题,如抽取操作出错、数据量无法自动匹配获取及数据库写入速度较低等.为了解决这些局限性问题,对大容量数据文件抽取算法进行了优化研究,提出并设计了一种大容量数据文件抽取算法.实验结果表明,该算法能够优化常规算法的效率,并具有数据容量自适应抽取及数据库快速写入等特点.
|
关 键 词: | 大容量数据 抽取算法 自适应 快速写入 优化 |
本文献已被 CNKI 万方数据 等数据库收录! |
|