首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 375 毫秒
1.
贝页斯数学模型在文本分类计算中得到广泛应用。过滤模型原理简单、运算效率高,保证了文本分类准确,但同时也产生一定偏差。利用贝页斯数学模型[1],针对测试样本集合的变化,分析研究贝页斯过滤规则的变化规律。为设计一种过滤方案提供理论依据。  相似文献   

2.
文本分类是机器学习重要任务之一,如何对文本信息进行有效分类组织,对用户查找并获取有用信息具有重要作用。针对新闻文本分析,提出了一种基于集合运算特征提取及Stacking策略的新闻多分类方法,该方法基于集合运算的方法来提取文本特征,采用Stacking策略,使用SVM以及贝叶斯方法来对文本进行分类。与典型同类方法对比,在复旦大学文本分类数据集上的实验结果表明,该方法随着样本数增加,各分类指标逐渐升高并趋于稳定。  相似文献   

3.
针对粗糙集的决策系统,给出了有效等价类细化和有效集合细化的定义,从理论上分析了必要属性细化后对上近似和下近似、近似分类精度和质量以及决策规则的数量和相对约简的影响.针对细化的区域分三种情况讨论,得出了在各种区域下划分的结果,如果对有效集合细化划分的越细,上近似和下近似就越逼近给定的集合,分类精度和近似分类质量就越大,产生的规则在包含原规则的基础上增多,并且相对约简和属性的必要和不必要的性质保持不变.研究结果对决策表的属性约简、决策规则形成和有效性等问题具有实际意义.  相似文献   

4.
一种求解集合组合问题的离散粒子群优化模型   总被引:2,自引:2,他引:0  
针对变长集合组合优化问题,提出了一种离散粒子群优化模型.该模型将集合的概念和运算引入粒子群优化中,定义了一个可变集合搜索空间,并重新定义了粒子的位置、速度及作用于此空间的运算规则,既保留了粒子群本身的优化特性,又体现了集合组合优化的特点.采用典型的变长集合组合优化问题——背包问题来验证此模型的性能,并与二进制粒子群优化(BPSO)算法进行了对比.结果表明,该模型具有较强的寻优能力和更高的稳定性.  相似文献   

5.
在对经典的关联规则算法进行了分析后,通过引入多维链表结构,提出了利用事务集合匹配运算和链表操作高效地挖掘关联规则的算法ARM LL.实验结果表明该算法是可行的,并具有较高的效率.  相似文献   

6.
本文提出了一种新的集合表示方法即刻划函数方法,并且讨论了在该表示方法下的集合运算.该方法不同于特征函数法和线性表表示方法.该方法把集合表示成刻划数,刻划数唯一刻划了集合的本质特征,使得集合运算转化为简单的数值运算,运算方便,节省空间.  相似文献   

7.
基于粒计算的信息系统规则提取方法   总被引:1,自引:0,他引:1  
根据关系的粒矩阵表示和矩阵运算简便直观的特点,计算条件属性集的粒关系包含度矩阵,并在该矩阵中获得满足给定阈值的决策规则集合;在保持该集合中元素个数不变的前提下对决策信息系统进行属性约简,并在约简的属性集上提取具有更高泛化能力的决策规则.理论证明和实例分析检验了该方法的可行性和有效性.  相似文献   

8.
样本分类规则提取是基因表达谱数据挖掘工作中的重要内容,提取肿瘤病理组织与正常组织的样本分类规则具有重要的生物学意义与临床诊断价值.针对该问题,基于机器学习与数据挖掘技术,研究了用于区分肿瘤与正常组织样本的分类规则提取问题.首先,利用改进的Relief算法生成候选特征子集,并以支持向量机作为样本分类模型,利用交叉验证方法在训练集上评估候选特征子集的样本分类能力,确定分类特征基因集合;然后,利用CART(classification and regression trees)学习算法构建决策树获得样本分类规则;最后,对所得规则进行了分析和解释.  相似文献   

9.
产生频繁项目集是关联规则挖掘中的一个关键步骤.在对Apriori算法分析的基础上,提出了一种基于集合和位运算的频繁项目集挖掘算法.该算法用位视图表示使用了每个项目的事务,通过对位视图进行位运算来计算每个项目集的支持数,避免了Apriori算法中多次扫描数据库的问题.  相似文献   

10.
决策树学习算法是数据挖掘中一类经典的分类算法。传统的决策树学习算法把数据集合中的实例同等对待,而忽略了实例之间存在的可疑性和影响度差异,导致错误实例扭曲了学习结果,严重影响学习质量。在此提出基于可疑实例影响度分析改进的C4.5 rules算法,在给定一个噪音集合后,首先把可疑实例与原集合划分开,并对可疑实例的影响度进行分析和度量,然后依据分类规则对可疑实例的覆盖情况进行重新排序和分类预测。算法在对分类规则重排序后将错误实例对学习结果的影响最小化,得出尽可能接近正确数据的学习结果。将此算法与经典的C4.5 rules算法进行实验比较,结果表明该算法有着良好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号