排序方式: 共有107条查询结果,搜索用时 15 毫秒
61.
基于分布式概念格的分类规则挖掘 总被引:1,自引:0,他引:1
以概念格为分类模型,引入知识合并思想,并针对大规模数据的分类求解以及过拟合问题引入剪枝策略,从而得到分类剪枝概念格模型,在此基础上提出了基于分布式概念格模型的强分类规则提取算法;通过理论证明了算法的正确性,并通过实验证明了算法的可行性。 相似文献
62.
分析现有等价矩阵规则提取算法对于大数据集低效性的根源,提出了一种新的等价矩阵以及根据决策类数目分割大数据集的方法,将条件属性和决策属性等价矩阵合并为一个矩阵,称为联合决策矩阵,该矩阵大大降低了等价矩阵的规模;提出了将大数据集转化为在多个子系统上串行进位链计算流程的规则提取快速矩阵算法,充分体现了人工智能领域中分而治之的思想.理论分析表明该算法在效率上较现有算法有显著提高;相应的对比实验结果表明,这种分治策略的矩阵分块和串行进位链法对大数据集上的规则提取的实用性和高效性. 相似文献
63.
针对网络舆情分析的实际应用,在综合考虑网络舆情特征和人们认知规律的基础上,重点进行舆情热点挖掘、文本倾向性分析两个关键技术的研究并在此基础上构建了网络舆情分析系统.通过将实验结果与权威数据对比,验证了相应方法的有效性. 相似文献
64.
中文分词技术是中文信息处理的基础,快速、准确的中文分词方法是进行中文信息搜索的关键。基于N-最短路径的分词算法,需要计算有向图中从起点到终点的所有路径值,分词效率低,将动态删除算法与最短路径算法结合,通过从最短路径中删除部分节点的策略减少搜索路径范围,从而提高分词效率。 相似文献
65.
数据的存储存在多源化,从多数据源中进行局部模式挖掘为不同层次决策提供服务是数据挖掘领域的一个研究热点。文章介绍了多数据源挖掘方法的研究进展,从数据源的划分、多种模式的挖掘、局部模式的合成等方面进行了详细的阐述和分析,并指出了多数据源挖掘的进一步研究方向。 相似文献
66.
关联挖掘在耕地流失原因分析上的应用研究 总被引:1,自引:0,他引:1
在传统算法的基础上,针对耕地流失原因分析时关心的规则后件只包含一个主要因素的特点,提出了改进的基于约束的频繁谓词集和关联规则生成算法,从而大大减少谓词集元素和无趣规则的数量,为该类问题提供了一个有效解决方法。实验证明该方法具有较好的有效性。 相似文献
67.
基于量化概念格的关联规则挖掘 总被引:4,自引:0,他引:4
在概念格的内涵中引入等价关系并将其外延量化 ,得到量化概念格。利用量化概念格可以清晰地表示知识 ,从而便于挖掘包括关联规则在内的多种规则 ,与经典的 A priori算法相比较 ,规则表示更简捷、直观 ,尤其重要的是用户可根据自己的兴趣交互地挖掘关联规则 ,不需要计算频繁项目集 ,因而提高了挖掘规则的效率 ,适用于大型数据库中关联规则的挖掘 相似文献
68.
首先对面向对象方法进行简单介绍,然后说明怎么使用这一方法来分析和设计一个实验室管理系统. 相似文献
69.
基于边界域的知识粗糙熵与粗集粗糙熵 总被引:5,自引:0,他引:5
传统的知识粗糙熵表征了知识整体的统计特征,是总体的平均不确定性的量度,知识和粗集的不确定性值被放大。从Pawlak拓扑的角度,给出了一种基于边界域的知识粗糙熵新定义,并修正了粗集粗糙熵的定义,集合的不确定性可以通过边界域来描述,能更精确的度量知识不确定性;证明了知识粗糙熵和修正后的粗集粗糙熵都随着信息粒度的变小而单调减少等重要结论。最后,通过弹簧振子系统定性仿真例子,结合定性推理技术,构造属性约简的启发式算法,消去定性描述中的冗余,获得了其系统的定性微分方程,说明了粗集理论在定性推理与定性仿真技术中的重要应用价值。 相似文献
70.
为了解决数据挖掘过程中挖掘的知识粒度过粗或过细问题,并利用概念格的偏序特性,提出了一种基于量化概念格的属性归纳算法.首先对概念格的外延进行量化,得到量化概念格,再根据概念格的哈斯图,采用概念的爬升进行相应的泛化,从而获得基于量化概念格的多层、多属性归纳.与面向属性归纳(AOI)算法相比较,结果表明所提算法不仅能实现AOI的单一属性归纳,还能进行多层、多属性的归纳,其属性泛化的路径不是惟一的,并且很容易在量化概念格的哈斯图中寻找合适的泛化路径和阈值,以此得到用户要求的、合理的属性归纳结果. 相似文献