首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 381 毫秒
1.
以某冶炼制造企业原材料管理系统为实例,结合实际工程项目中原材料采购与生产消耗情况,提出一种原材料软分类方法。该方法以意大利经济统计学家Vilfredo Pareto提出的ABC分类法为主要规则,关联性为参考规则,与原有分类方法结合并用。详细描述了该方法的算法设计和程序实现,并对其在实际运行系统中的实施效率进行了分析。效率的明显提高,证明了该分类方法的合理性。  相似文献   

2.
针对关联分类规则产生的候选规则过多导致效率不高的问题,提出一种基于频繁闭项集组成的扩展概念格的分类规则获取方法.利用频繁闭项集提出一种新的概念格模型,通过性质和定理对概念格结点进行剪枝,以抽取分类尽量少且最有效的关联分类规则.研究结果表明:该算法能挖掘出高质量且包含重要信息的关联分类规则,并大大减少关联分类规则的数量,在分类准确率上比现有的关联分类典型算法更高.  相似文献   

3.
利用各种分类规则挖掘方法,提取出的分类规则集中,存在许多的冗余规则,从而降低了分类效率。采用谓词公式描述分类规则,给出了一种分类规则集约简方法。该方法利用谓词公式中的逻辑推理,对分类规则集进行约简,消除了冗余规则。采用恒星光谱数据,实验验证该方法在保证分类规则集的分类能力不变的前提下,有效地提高了分类的效率。  相似文献   

4.
通过分析分类规则与训练集之间的映射关系,采用集合的相关运算寻找特征规则及相应特征集,从而消除分类规则集中存在的冗余,并在此基础上提出了基于集合运算的分类规则处理算法(PASO).最后,以恒星光谱数据为背景,实验验证了该方法的正确性和可行性.  相似文献   

5.
研究工业酶非分类关系抽取问题.针对传统关联规则抽取非分类关系时存在效率低、收敛速度慢及漏报规则等问题,提出了一种基于小生境技术的萤火虫算法.该算法利用小生境技术的融合、演化算法丰富种群的多样性,结合萤火虫算法寻优速度快的优势抽取非分类关系,解决了局部最优、规则冗余问题.针对工业酶语料进行了验证性实验,实验结果表明,相对于传统的关联规则挖掘算法,该方法在个体多样性及提取有效规则的效率上都有较大的提高,挖掘结果对工业酶非分类关系抽取具有一定的参考价值.  相似文献   

6.
概念格是数据分析与知识提取的一种有效工具,具有精确性和完备性等特点.目前,基于概念格的分类规则提取算法很多,但在提取到规则的数量上和规则的形式上并不能达到令人满意的效果.针对基于概念格的分类规则提取方法进行了研究,在改进内涵缩减的增量式计算方法基础上给出了基于内涵缩减的确定的分类规则和近似的分类规则的提取方法,通过有效限制计算内涵缩减的节点的范围降低了内涵缩减的计算规模,利用分类规则基,降低了需要计算的分类规则的数量,提高了分类规则的提取效率.为验证本研究提出分类关联规则的挖掘方法,用C++实现了上述算法.测试结果表明,本文给出的算法是有效的.  相似文献   

7.
根据词条聚合和决策树原理,提出了一种文本分类的新方法.决策树分类方法具有出色的数据分析效率和容易抽取易于理解的分类规则等优势,但只能应用于维数较低的特征空间.本方法将与各个类别相关程度相似的词条聚合为一个特征,有效地降低了向量空间的维数,然后再使用决策树进行分类,从而既保证了分类精度又获得了决策树易于抽取分类规则的优势.  相似文献   

8.
探讨基于粗糙集的分类规则挖掘技术,提出一种融合不同数据源中的分类规则的方法.该方法能保证规则的完整性,即获得适用于全局的所有分类规则,并通过实验进行验证,结果表明该融合方法与直接在全局数据中挖掘分类规则的方法相比,具有运算量小、效率高的优势.针对大规模数据在分类求解中出现的过融合问题,应用剪枝策略进行实验,实验结果表明该剪枝策略正确可行,可以提高分类效果.  相似文献   

9.
现有基于置信规则库参数学习的分类系统存在着一些问题,如分类准确度受模糊子区间划分数量约束,成非严格正相关关系;参数学习方法需人为给定规则数量;推理过程未体现特征与分类结果关联度等.为解决这些问题,提出基于差分进化算法的置信规则库推理的分类方法,该方法包括置信规则库分类系统构建及参数训练.首先引入置信规则库分类系统构建策略确定规则数;然后使用置信推理方法作为分类查询推理机;最后结合差分进化算法建立训练模型.在实验分析中,首先通过与现有分类方法进行对比,验证该方法的有效性;再通过对比不同区间划分数的置信规则库分类系统,说明参数训练的合理性.实验结果表明,该方法合理有效.  相似文献   

10.
采用类别相似度聚合的关联文本分类方法   总被引:1,自引:0,他引:1  
针对基于关联规则的分类方法在分类时仅考虑规则的置信度并使用规则修剪技术,导致分类器的分类精度难以进一步提高的问题,提出了一种基于类别相似度聚合的关联文本分类方法.该方法采用修改的χ2统计技术提取各类别的特征词;为保证规则匹配的精度和速度,使用CR-tree存储分类规则,并给出了CR-tree的构建与匹配算法;采用向量内积来计算文本类别分量与类别标志向量的相似度,进而使用规则置信度和类别相似度的聚合值作为文本分类的依据.基于实际网络文本的实验表明,该方法仅需提取30个特征词,分类结果的微平均值即可达到92.42%,优于未经剪枝的ARC-BC分类器及KNN、Bayes分类器;在分类耗时方面,该方法与未经剪枝的ARC-BC分类器持平,表明该方法引入的相似度与聚合值的计算开销在可接受的范围内.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号