共查询到20条相似文献,搜索用时 8 毫秒
1.
随着计算机和网络在人们工作和生活中的广泛普及,图片数据也成几何倍地急剧膨胀。面对日益增多的海量图像数据,如何进行有效的存储及图像信息数据的快速挖掘,是目前需要解决的主要问题。本文借助云平台Hadoop的分布式文件系统(HDFS)和分布式并行计算框架(MapReduce),进行海量数字图像的数据挖掘。构建基于Hadoop云平台的海量数字图像数据挖掘系统,实现海量数字图像信息数据挖掘。 相似文献
2.
针对海量Web文本的关键词提取问题,提出一种基于Hadoop分布式计算平台的关键词提取方案.首先,配置Hadoop平台,使其能够支持自然语言处理过程;然后,使用GATE工具对Web文本进行词句分割、词性标注和注释规则操作,得到候选关键词集;最后,利用单词位置和跨度重要性因子对传统TF-IDF算法进行加权,从而计算候选关键词与文档之间的相关性,最终获得该文档的关键词以标注文档属性.实验结果表明,提出的分布式关键词提取方案能够快速准确地提取Web文档的关键词. 相似文献
3.
针对聚类算法并行化的需求,该文对基于Hadoop平台Kmeans算法进行了改进,选用Canopy算法对数据进行预处理,并在具有一定数据结构的电影数据集上进行了单机对比实验,集群加速比实验和集群扩展率实验,分别体现改进后算法实现的高效性、良好的加速比和可扩展性,从而可以有效地运用在实际海量数据挖掘中. 相似文献
4.
5.
6.
7.
《哈尔滨师范大学自然科学学报》2018,(6)
设计了一种基于云计算和虚拟化技术的网络空间安全仿真学习系统,采用KVM虚拟机,通过B/S架构对外提供服务.设计了API接口,让Web服务器与OpenStack中的控制节点进行交互,这样的控制节点和计算节点共同配合管理系统创建的KVM虚拟机提供的实验平台,为用户提供了一个交互性的实验环境.主要包括用户管理模块、实验原理学习模块、实战演练模块、论坛交流模块.能够为网络攻击与防护、渗透测试等与网络安全相关的实验提供综合的实验环境,具有较强的实践性、可扩展性和复用性. 相似文献
8.
在工业控制趋于信息化、智能化和网络化的背景下,远程监控应用成当今控制系统的迫切要求。随着云服务的普及应用,为提高污水处理设备的运行效率,减少运维成本,在工业云服务器上搭建污水处理远程监控运维平台,随时随地监控污水处理系统的设备工作状态和运行情况,实时对各种运行参数进行远程采集和存储等,并实现PLC程序的远程上下载,极大地提高了控制系统的自动化程度,全面提高企业的综合管控水平。 相似文献
9.
一种文本分类数据挖掘的技术 总被引:7,自引:0,他引:7
挖掘的理论和应用研究是数据挖掘领域一个新的重要分支,介绍了一种文本数据挖掘方法. 首先,论述了文本挖掘的意义和重要性,探讨了文本挖掘的定义和文本分类的一些形式,然后讨论了一个以数据预处理、特征提取、特征表示和特征匹配等文本分类的一些关键理论问题,并给出了一个基于该方法的文本分类系统的实验结果,实验结果表明了该方法的可行性. 相似文献
10.
11.
12.
13.
14.
《湖南师范大学自然科学学报》2016,(1)
针对云平台的运行效率及信息的安全问题,引入思杰Xen App技术,设计了以身份认证、权限管理、数据保护、行为监控四维一体的安全部署思想,从数据传输到信息安全为区域云量身打造高效安全的运行环境,为解决云安全问题提供科学而有效的方法. 相似文献
15.
16.
为了提升车辆管理系统的应用效果及用户满意度,设计一种基于Hadoop的车辆管理系统.该系统是以Hadoop为核心的三层架构,数据存储层利用数据采集接口接收交警侧采集终端传输的车辆数据,经数据加载、查询、存储后,通过数据访问服务接口将数据传输至服务层.服务层利用Min-Max方法获取车辆移动近似节点和车辆短时位置信息,获... 相似文献
17.
18.
19.