共查询到19条相似文献,搜索用时 62 毫秒
1.
2.
粗糙集的应用中,对象集通常具有数量大、属性多、单一属性分类大的特点,这是在已有知识基础上提出规则时所遇到的3个主要问题,针对其中单一属性分类的约简问题提出了一种新的方法,它采用了先合并分解再综合的思想简化问题的求解,能快速有效地发掘信息中蕴涵的规则。 相似文献
3.
为了从海量的信息资源库中快速、准确地进行分类并提取出有用的信息,提出了一种基于粗糙集和KNN混合的Web文本分类模型。利用粗糙集的属性约简理论降低了文本分类过程中的向量维数,使用一种基于分明矩阵的属性约简算法,特征选择过程采用互信息量计算方法,并对该混合算法进行了实验,同时结合传统的KNN方法对该混合算法进行比较,验证该算法的可行性。 相似文献
4.
基于粗糙集属性约简的模糊模式识别 总被引:3,自引:1,他引:3
通过运用粗糙集归约理论对资料进行浓缩和筛选,略去不必要的属性,简化数据。用模糊模式识别确定对象应当归属的模式,给出其对于各个模式的相对隶属度,从而达到分类目的。经实例计算,得到了较好的结果。 相似文献
5.
一种基于粗糙集的文本分类规则抽取方法 总被引:10,自引:0,他引:10
随着文本数据库的日益增大,寻找新的文本数据处理方法变得十分紧迫。本文将粗糙集理论应用于文本自动分类的规则提取,提出了基于粗糙集理论的文本分类方法。把文本特征项的权值进行离散化处理后,作为规则的条件属性,文本所属的类别用作决策属性,构造决策表,然后通过决策表的知识约简算法提取出文本的分类规则。实验结果表明,该方法提取规则的分类正确率较高,分类速度较快。 相似文献
6.
利用覆盖粗糙集研究信息系统的属性约简.首先,回顾了覆盖粗糙集的基础知识,然后提出了相关类的概念以及几个相关定理,并且逐步阐述如何用相关类的方法来进行属性约简,最后用例子证明了此方法的可行性,并得出结论. 相似文献
7.
沈晨鸣 《南京工程学院学报(自然科学版)》2007,5(1):30-34
粗糙集理论是一种研究不完整、不确定知识处理的数学工具,属性约简是粗糙集理论的核心内容之一.阐述了粗糙集理论的基本思想,给出了一种启发式的最小约简算法,通过一个实例,分析说明算法的可行性和有效性. 相似文献
8.
基于克隆选择的粗糙集属性约简方法 总被引:6,自引:1,他引:6
基于免疫克隆选择的原理,提出了一种新的粗糙集属性约简方法,将属性集合的分类近似质量作为进化目标,利用免疫反应的分布性特点通过局部并行搜索实现全局优化,并采用抗体更新和亲和力抑制手段来维持群体的多样性,保证了各抗体局部优化解的稳定性,从而获得了多个优化约简集合,通过机械故障诊断数据的实例应用,表明该方法可以获得多个符合分类质量要求的属性约简集合,因此满足了设备故障诊断的特征优化选择要求。 相似文献
9.
结合粗糙集的属性约简和神经网络的分类机理,提出了一种混合算法. 首先应用粗糙集理论的属性约简作为预处理器,把冗余的属性从决策表中删去,然后运用神经网络进行分类. 这样可以大大降低向量维数,克服粗糙集对于决策表噪声比较敏感的缺点. 试验结果表明,与朴素贝叶斯、SVM、kNN传统分类方法相比,该方法在保持分类精度的基础上,分类速度有明显的提高,体现出较好的稳定性和容错性,尤其适用于特征向量多且难以分类的文本. 相似文献
10.
11.
K最近邻算法(KNN)被认为是向量空间模型下最好的分类算法之一,在准确率和召回率方面比较出众,但随着样本数量的增加其相似度计算开销很大。本文提出一种改进算法RS-KNN,主要是利用粗糙集的相关理论,计算训练样本集中各样本子类的上近似空间和下近似空间,根据待分类文本出现在不同的近似空间,以缩减与待分类样本计算相似度的训练样本个数。实验表明此算法能够有效地降低分类计算开销。 相似文献
12.
基于贝叶斯粗糙集的文本特征选择方法 总被引:3,自引:1,他引:2
特征选择是文本分类的一个核心研究课题.首先给出了一个基于最小词频的文档频,然后简单分析了经典粗糙集和变精度粗糙集的不足,紧接着把贝叶斯粗糙集引入进来并提出了一个属性约简算法,最后把该属性约简算法同基于最小词频的文档频结合起来,提出了一个综合的特征选择方法.该综合方法首先利用基于最小词频的文档频提取初始特征,然后利用所提属性约简算法消除冗余,从而获得较具代表性的特征子集.实验结果表明,该算法是有效的. 相似文献
13.
43(2000)01-0007-04摘要:根据信息表中相对每个条件属性的集合和划分的粗糙逼近精度,给出衡量属性重要性程度的一种准则.在此基础上,提出了信息表属性约简的一个较为简单有效的算法. 相似文献
14.
结合高压输电线路远程监测系统,在参考粗糙集理论的基础上,结合粗糙熵相关知识,针对复杂系统故障影响因子的特点,提出了一种属性约简算法,最后得出相应的算法规则,解决了复杂信息数据简化的问题。实例证明,该算法是可行的。 相似文献
15.
文章提出了一种利用粗糙集理论生成文本分类规则的方法.首先,抽取特征词并计算权重.然后,在权值离散化之后,构造决策表.其中,特征词作为条件属性,类别作为决策属性.之后,将文本用属性约简和属性相对约简进行处理,得出决策规则.最后给出分类算法. 相似文献
16.
分析了文本自动分类的关键理论及技术,给出一个已实现的基于向量空间模型(VSM)的文本自动分类系统的框架模型,重点描述此系统的实现算法.此算法在训练阶段通过部分训练集确定向量的特征提取维数,并提出一种"平均值"匹配阈值调整方法,从而在精度和效率方面优于传统的分类算法.实验表明此系统查准率为91.8%,查全率为85%. 相似文献
17.
LDA主题模型是一种有效的文本语义信息提取工具,利用在文档层中实现词项的共现,将词项矩阵转化为主题矩阵,得到主题特征;然而在生成文档过程中会蕴含冗余主题。针对LDA主题模型提取主题特征时存在冗余的不足,提出一种基于邻域粗糙集的LDA主题模型约简算法NRS-LDA。利用邻域粗糙集构造主题决策系统,通过预先设定主题个数,计算出每个主题的重要度;根据重要度进行排序,将排序后重要度低的主题删除。将提出的NRS-LDA算法应用于K-means文本聚类问题上并与传统的文本特征提取算法及改进的算法进行比较,结果表明NRS-LDA方法可以得到更高的聚类精度。 相似文献
18.
胡国定教授基于“概念的内涵与外延的反比例关系律”这种思想,给出了一种信息度量方法。本文以粗糙集理论为基础,利用胡教授提出的这种信息度量,讨论了决策表属性约简和信息量之间的关系,证明了对于相容决策表,其属性约简在代数表示和此种方法给出的信息表示下的等价性。并举例说明对于不相容决策表,其属性约简不能用信息量来等价表示。 相似文献
19.
一种基于粗糙集理论的数据挖掘算法的研究 总被引:6,自引:0,他引:6
研究了粗糙集理论在数据挖掘中的应用,提出了一种基于粗糙集理论的数据挖掘算法.首先对信息系统的数据加工泛化,构造其二进制可辨矩阵.对矩阵进行化简得到属性约简并生成规则.最后,结合银行申请信用卡的实例,利用上述方法进行数据挖掘,消去冗余属性,抽取决策规则. 相似文献