首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
提出了一种面向大规模数据集的单类支持向量机(OCSVM)方法.该方法基于k近邻思想得到表征数据集合分布特征的集合内点,并依此生成集合边缘点,而后由二者重新组成数据集合,用于OCSVM训练.该新建数据集不仅极大压缩了原有大规模数据集的样本数量,还可以保留原有大规模数据集的分布特征,从而有效解决了OCSVM在处理大规模数据集时所存在的训练时间长、模型复杂以及预测效率低等问题.最后,通过在典型数据集合上进行的对比实验,表明了所提方法的有效性.  相似文献   

2.
抽象的聚类分析是数据挖掘研究的重要领域.随着数据量每3年翻一番,关键问题是如何对大型数据集高效率地进行聚类操作.文章首先将当前主流的聚类算法应用于大规模数据集,通过实验指出现有的聚类技术存在的关键问题及所面临的技术挑战,然后使用了数据聚合树(DA树)作为代表性大型数据集的数据结构,设计了一个新的聚集算法(CLUK算法)...  相似文献   

3.
在大型数据关联规则开采过程中,采用动态项目集计算算法寻找大项目集,以空间换取时间方案提高执行效率,同时,用坚信度作为构造关联规则的依据,更好地反映逻辑上的因果关系。  相似文献   

4.
混沌系统的全局指数吸引集在混沌的控制和同步之中起着非常重要的作用.给出了一个五维混沌系统的模型,然后借助一个适当的Lyapunov函数和最优化理论,研究了这个混沌系统的全局指数吸引集,得到了它的五维椭球全局指数吸引集.最后,通过了计算机模拟,数值模拟验证了计算理论的可行性.  相似文献   

5.
针对目前研究人员已经提出多种中文评论挖掘方法,缺乏统一的评论实验数据集的现状,首先从知名网站上随机抽取手机评论,经过垃圾去除、手工标注,最终构造出手机领域的评论挖掘实验数据集.基于实验数据集构造出手机领域的情感词库,并利用模式匹配方法建立了产品特征粒度树,开发出一个可视化平台,研究人员可以直接用其检验挖掘方法的效果,也可以对不同的挖掘方法进行客观比较.  相似文献   

6.
数据采掘中的可视化技术和方法   总被引:2,自引:0,他引:2  
主要介绍了几种目前常用的可视化数据采掘技术,以及它们的含义、技术特点和适用范围;同时描述了一个集成多种可视化数据采掘技术的系统工具——VisDB系统,并对其性能进行了评价;最后,通过一个商业POS的数据采掘应用实例,说明可视化数据采掘技术对分析和检索大型数据库是非常有用的。  相似文献   

7.
为了有效地从凸序列中约简数据和发现知识,解决Rough集集中的凸序列问题,在深入研究凸序列和Rough集理论的基础上,提出了凸Rough集模型,定义了凸Rough集和凸Rough集糊集,给出了凸Rough集糊集的隶属函数和应用凸Rough集进行数据约简及规则发现的算法,最后分析了一个应用案例,验证了模型的可行性,表明应用凸Rough集模型可以更好地进行数据约减和规则发现。  相似文献   

8.
决策支持系统中OLAP的设计与实现   总被引:1,自引:0,他引:1  
目的设计和实现对数据仓库中的信息进行决策分析的OLAP。方法以零售企业销售预测为切入点,研究决策支持系统中OLAP的设计。结果建立了用来进行OLAP分析的多维数据集,并对多维数据集中的数据用切片、切块、钻取和旋转等方式进行分析,用MDX多维查询语言对多维数据集中的数据进行复杂查询,提出了对OLAP分析数据展现的3种解决方案。结论在研究决策支持系统中OLAP的基础上,建立和实现了对数据仓库进行决策分析的OLAP。  相似文献   

9.
粗集在知识发现中的应用   总被引:4,自引:0,他引:4  
粗集作为一种数据分析理论,能有效地从不确定性的数据中发现知识,是目前在知识发现领域研究的热点之一。首先对粗集理论做了简单介绍,在此基础上论述了粗集作为一种数学工具在知识发现领域中的重要问题,并提出粗集的进一步可能发展方向。  相似文献   

10.
可视化和可视化分析学   总被引:1,自引:0,他引:1  
可视化就是把数据、信息和知识转化为可视的表示形式的过程。一般来讲,可视化可分为数据可视化、科学计算可视化、信息可视化和知识可视化。可视化可以看做是人类与计算机这两个信息处理系统之间的一个接口单元。本文在给出可视化定义基础上,简要介绍了国际近年出现的可视化分析学情况,讨论了可视化在数据挖掘、复杂网络等领域的应用。最后指出了可视化研究存在的问题和重要发展方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号