首页 | 本学科首页   官方微博 | 高级检索  
     检索      

长白山生态数据爬取及清洗研究
引用本文:郑国勋,姚学坤,陈冠澎,胥政尧.长白山生态数据爬取及清洗研究[J].长春工程学院学报(自然科学版),2021,22(4):82-86,124.
作者姓名:郑国勋  姚学坤  陈冠澎  胥政尧
作者单位:长春工程学院计算机技术与工程学院;长白山历史文化与V R技术重构吉林省重点实验室,长春130012
摘    要:在开展长白山生态数据智能分析时,需要爬取大量的网络数据,这些数据大概率会出现缺失、重复、异常、噪声等情况,因此需要对爬取到的数据进行必要的清洗的功能.设计了一种爬虫,并实现了数据清洗的功能,实验证明,100万条数据的爬取用时<30 min.

关 键 词:长白山生态数据  爬虫  缺失值  数据清洗

Research on Crawling and Cleaning of Ecological Data in Changbai Mountain
ZHENG Guo-xun.Research on Crawling and Cleaning of Ecological Data in Changbai Mountain[J].Journal of Changchun Institute of Technology(Natural Science Edition),2021,22(4):82-86,124.
Authors:ZHENG Guo-xun
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号