首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对工业生产过程中所产生的产品缺陷数据经过数据挖掘后关联规则存在不能有效组织的问题,提出一种基于项目属性差异的产品缺陷数据关联规则模糊分类方法,在建立模糊分类树的基础上,计算出关联规则间距离,并采用自组织神经网络聚类的方法对挖掘结果进行聚类分析。将该方法应用于冷轧带钢表面缺陷数据挖掘后处理,结果表明,该方法不仅能够得出两种不同属性项目间的关联性,还可以求出缺陷关联规则间的距离,距离越近的关联规则被聚为一类,其相似性越大。  相似文献   

2.
基于量子机制的改进的分类属性数据聚类算法   总被引:1,自引:1,他引:0  
分析量子势能、量子力学中粒子分布机制和针对分类属性数据的量子聚类CQC算法,发现该算法采用传统的Hamming相异性测度计算分类属性数据间的相异性测度,忽略分类属性取值自身的涵义和值间的特征关联,导致其聚类准确性较差.提出一种改进的MCQC算法,能根据数据对象的关联情况计算同属性不同值间的相异性,计算数据对象间的相异性测度,从而提高聚类准确率.仿真实验采用3个数据集,即:大豆疾病、国会投票真实数据集和从KDD-CUP99训练样本集抽取离散属性维构成的人造样本集.实验结果表明,该算法是有效且可行的,对分类属性、二值属性和混合属性数据的聚类准确率明显高于CQC算法.  相似文献   

3.
基于属性相似度的云分类器   总被引:4,自引:0,他引:4  
提出了属性相似度概念解决高维对象分类的权重问题,并结合云理论建立了基于属性相似度的云分类器.采用云理论建立训练集的各属性模型,表达各属性值隶属于其类别中心Ex的程度.分类模型由属性模型集成得到,属性权重根据属性相似度计算.各类别的同一属性间的相似度越大,此属性对分类的作用越小.基于粒子群优化方法对分类模型的中心位置Ex进行优化.将此分类器与普通云分类器应用于iris数据集的分类实验,该分类器的分类效果好于后者.  相似文献   

4.
针对生产调度规则提取工作对数据集属性约简的客观需求,提出了一种关键属性提取技术.首先,分析了生产数据的特点,并依据重要性和关联性,将生产数据的属性划分为多个集合;然后,在此基础上利用模糊熵与聚类准确度建立重要性目标函数,用于发现重要属性.最后,利用关联性分析查找重要属性的关联属性,将相关属性进行合并,形成重要复合属性,以进一步增强属性提取效果.为了验证该技术的有效性,将利用该技术所获取的数据子集与通过随机法所得到的数据子集进行了对比,分析比较了各数据子集的相容性和规则提取准确性.结果表明,提取属性后所形成的数据子集具有较低不相容度,浓缩了原始数据集的调度规则知识,可显著提升多种生产调度规则挖掘算法的准确度与效率.该技术非常适用于生产调度规则挖掘数据预处理阶段的关键属性提取工作.  相似文献   

5.
基于关系马尔可夫模型的枚举型缺失值估计   总被引:1,自引:1,他引:0  
针对数据质量中数据缺失问题,提出了基于关系马尔可夫模型(RMM)的枚举型缺失值估计方法.该方法充分考虑属性间的关联性,将动态属性选择(DAS)方法与RMM结合,最大限度地利用完整数据的信息,提高了该方法的估计能力;利用RMM计算源状态到目的状态的转移概率,采用MaxPost和ProProp 2种缺失值填充方法,对缺失值进行填充.采用公认数据集,进行了对比实验,验证了该方法的有效性和优越性.  相似文献   

6.
基于时序的关联规则挖掘算法的研究一直都是人们关注的课题,提出了一种基于时序逻辑的不同事物同属性的关联规则挖掘。传统的关联规则主要是揭示了多个事物的同一属性在相同的时间点上的相互关联性,这样的关联规则的项与项之间没有体现时间上的差别,也就无法对时间序列的发展趋势进行预测。实验表明这种方法对于不同事物同属性预测具有现实意义。  相似文献   

7.
为提高大数据粗糙集挖掘能力,提出基于信息熵的粗糙集连续属性离散检验算法﹒在云计算环境下进行粗糙集连续属性大数据挖掘,采用特征空间重组方法进行粗糙集连续属性离散数据的模糊特征重构,提取粗糙集连续属性离散数据的信息熵,并得到其分布序列特征;对所提取的信息熵进行聚类分析,采用空间决策树模型,获取离散数据闭繁项关联分析度量;通过数据特征权重的决策树分布特征量化集,得到粗糙集连续属性离散数据空间重组;采用大数据挖掘方法,将离散数据空间重组的信息融合,得到优化的粗糙集和连续属性离散数据检验输出;根据粗糙集连续属性的融合结果,实现离散检验优化﹒仿真结果表明:在迭代次数为400时,收敛程度为0.265%,远远高于其它方法,证明采用该方法进行粗糙集连续属性离散检验的数据聚类性较好﹒  相似文献   

8.
权重的确定是决策研究中的关键性问题,已有的基于粗糙集的权重确定方法克服了过于依赖先验知识的缺陷,但其未充分考虑属性间的相互作用,此外考虑到等价关系的局限性,着重研究优势关系信息系统的属性权重确定问题,首先提出由属性集包含信息量的多少来确定属性的重要性,并基于信息量对属性集进行约简,在保证对元素间优劣关系区分能力不变的同时简化了计算;其次开创性选用Shapley值方法对"损失信息量"进行分配,进而确定属性权重,该方法以严格的公理为基础,充分考虑了属性间的相互作用,保证了属性权重分配的公正、合理;最后通过实例演示了利用Shapley值确定属性权重的具体操作步骤。该方法直观性和可操作性强易于推广,为各类信息系统属性权重确定提供了参考,亦是对策论方法交叉应用的成功探索。  相似文献   

9.
在中文事件检测任务中,存在着领域互相独立,领域间的数据无法互通,需要分别为每个领域标注大量数据的问题。本文充分借鉴前人的研究,提出一个基于迁移学习的开放式中文事件检测方法。首先基于两个触发词关联假设,一个是同一个事件类型下,触发词与触发词在语义空间上有着一定的关联,且关联性较强。第二个是不同事件类型之间的触发词和触发词之间也存在着一定的关联,不过其关联性弱于相同事件类型下触发词之间的关联性。之后借助外部词典,构建候选词与种子触发词的关系特征以及候选词的上下文特征,再利用卷积神经网络构建事件检测的基础模型和迁移模型。最后对于新领域下的事件检测,只需要借助极少量的已知领域的标注数据即可完成。在ACE2005的中文事件数据集上,该方法在触发词识别这项任务上仅用20%的数据,其效果即可超越当前的主流方法。  相似文献   

10.
一种应用关联规则森林的改进贝叶斯分类算法   总被引:1,自引:0,他引:1  
针对朴素贝叶斯分类方法中属性值条件独立假设不适应实际情况的问题,提出了关联规则森林表示法及应用关联规则森林的改进贝叶斯分类算法(ABC算法).ABC算法利用关联规则挖掘得到满足条件的关联规则,并由此来构造关联规则森林,而规则森林中所有根节点的概率与所有适用的规则置信度连乘,就得到所有属性值的联合概率.应用UDI数据集对分类器进行了测试,分类结果表明,ABC算法的分类准确率明显高于朴素贝叶斯分类算法,平均提高5%,特别是对属性间有着较强依赖关系的数据集,其分类准确率提高了37%.  相似文献   

11.
传统的抽象化技术用于高维(属性)数据的匿名发布时会造成不可容忍的信息缺损,而分解技术虽然确保了数据真实性,但由于视图划分破坏了属性之间的内在关联,因此发布数据的可用性受到限制。该文提出了一种基于极大关联属性集的分解法MAAD(maximal associated attributes based decomposition),该方法利用频繁模式挖掘技术,寻找具有强关联性的属性组集合,并以此指导多视图的分解和生成。MAAD优先考虑了属性之间的关联性,所生成的多视图能够提供更好的数据挖掘性能。该文还定义了多视图发布的隐私保护模型-λmatching。实验结果表明:尤其在用于高维数据的匿名处理时,MAAD方法能够有效地提高数据可用性,具有很高的实用价值。  相似文献   

12.
针对评价信息为概率语言术语集,专家权重和属性权重完全未知的多属性群决策问题,提出基于概率语言相关系数的多属性群决策模型.首先定义了概率语言的相关系数并且拓展到概率语言矩阵间的相关系数; 然后基于每个专家的决策矩阵,通过最小化加权相关系数总和求得每个专家的属性权重向量,并且通过决策矩阵的相关系数客观地确定专家权重; 最后将经典的ELECTRE方法加以改进用于方案排序,并且通过算例分析与比较分析证明了该决策方法的有效性与优越性.  相似文献   

13.
大数据中的知识发现是大数据应用中的核心热点.本文从高度抽象认知事物视角出发,以表征事物普遍性为特征的概念驱动与表征事物特异性为特征的数据驱动两种方法学为哲学原理,提出了基于属性偏序结构图和对象偏序结构图的知识发现方法.分别从群结构、子群结构、支路、节点等角度对数据特征之间的结构关系进行讨论分析.属性偏序结构图将数据中具有某些共同特征的对象聚类到一起,是数据共性的表达;对象偏序结构图中,通过数据的独有属性可以快速有效的将特异性对象区分于其他对象.最后,以中医药方剂配伍研究问题为例,对张锡纯治疗中风的32个处方进行数据挖掘和知识发现,证明了该方法的有效性和实用性,为大数据知识发现研究提供了新的思路和方法.  相似文献   

14.
针对先前研究工作对行人属性相关性分析不足和行人图像中细粒度属性特征难以捕获的问题,首先基于关联规则寻找属性之间的相关性,然后根据相关性改变网络结构,提升有较强相关性属性的准确率并嵌入改进的HSA(hierarchysplitattention)注意力模块,将特征图中的潜在信息进行深度挖掘.HSA注意力模块将特征图进行分组和在子特征图之间增加通道交互操作,整合后的特征图输入挤压激励(squeezeandexcitation,SE)模块中,提取图像在通道上的信息.在PA100K、Market-1501和PETA数据集上的实验结果表明,本算法的精确率、召回率、F1值与其他算法相当,但是准确率有较大提升.  相似文献   

15.
针对现有实体对齐方法大多以本体模式匹配为基础,处理异构关联数据集间对齐关系存在局限性且实体链接缺失问题严重的现状,在分析关联数据语义的基础上,提出了一种独立于模式的基于属性语义特征的实体对齐方法,对关联数据集中实体属性根据语义标签特征及统计特征建模,并采用有监督的可变样本集VS-Adaboost算法实现分类器优化。实验结果表明,该方法的时间效率、准确率、查全率较高,F测度效果较好。  相似文献   

16.
随着大数据技术的迅猛发展,健康医疗大数据突破性增长,且具有多源异构、多类型、多关联性.健康医疗大数据也具备特有的5V特征:volume, velocity, variety, value, veracity.然而健康医疗数据的安全问题也随之产生,如何保护病患的隐私数据不被泄露成为一项研究热点.该文针对病患隐私保护及其数据分析问题进行研究和探讨,以PCA-GRA Datafly算法为研究对象,为了解决传统算法的QI属性过度泛化的问题及K-means算法的局部最优问题,提出PCA-GRA-BK算法(主成分分析灰度关联分析BiK-means K匿名算法).首先通过PCA算法对医疗数据进行降维分析,利用少量数据揭示医疗数据之间的内在联系,并选择出QI属性;再使用GRA算法对QI属性进行关联度分析,确定与敏感属性的关联度,构建QI属性的泛化层次,使用手肘法确定聚类算法的最佳k值,并通过聚类算法完成健康医疗数据集相似等价类的聚类;最后借助K匿名算法完成对健康医疗数据的匿名化.通过将Datafly算法、PCA-GRA Datafly算法、PCA-GRA-KK算法和PCA-GRA-BK算法进行医疗数据...  相似文献   

17.
针对在识别框架不确定时基本概率分配(BBA)生成困难的问题,提出一种基于聚类特征的基本概率分配生成方法,以减弱对样本长度的依赖性,并分析2种情况下的BBA生成。在框架未知时,通过聚类分析获得各个类别的聚类特征,建立样本属性的聚类特征区间模型;在框架已知时,获取聚类特征,建立样本属性的聚类特征区间模型;然后用各个区间模型之间的距离表示样本属性之间的差异,在此基础上建立了一种相似度的度量方法;最后对相似度进行归一化得到BBA。采用Iris数据集和Wine数据集的实验结果表明:所提方法对样本长度敏感程度低,对Wine数据集的一个类的分类结果达到100%。将该方法应用于某煤化工企业压缩机组子系统状态监测信息数据集,实现了监测信息状态的识别。  相似文献   

18.
郭海彦  韩利娜 《科技信息》2009,(27):168-169
现实中的不确定性处处存在,因此对模糊多属性决策问题的研究是十分必要的。Vague集同时考虑了隶属与非隶属两方面的信息,较全面地反映了决策方案和评价属性之间的相关性。当决策者无法给出对各属性的偏好时,就较难确定各属性的权重,这样就无法姣好地解决模糊多属性决策问题。由于利用DEA评价模型不需要提前给定各属性的权重值。因此为了更好地对决策方案进行评价,本文将DEA模型与Vague集相结合.利用DEA—C^2R模型给出了解决含有Vague集的模糊多属性决策问题的一种评价方法。  相似文献   

19.
针对高分辨率遥感影像复杂道路提取难题,提出一种利用概率增进树和路径形态学的遥感道路条带提取方法。通过一维Gabor滤波器提取道路角度纹理特征,融合光谱特征构建特征矢量。设计训练样本数据集,利用概率增进树算法提取道路候选点。针对具有一定曲率的复杂道路,兼顾直线和弯曲道路,设计4个主方向邻接图检测线状或条带状道路,改进二值路径形态学为概率路径形态学剔除大多数非道路点。针对小面积噪声和条带孔洞问题,采用数学形态学的方法弥补条带孔洞,得到完整道路条带。结果表明:提取道路条带的准确率达到了88.99%,提取结果较为理想。  相似文献   

20.
莫索湾地区梭梭群落种间关联性的研究   总被引:3,自引:0,他引:3  
采用2×2列联表,应用χ2检验方法研究了古尔班通古特沙漠南缘莫索湾地区梭梭群落15个种群的种间关联性。结果表明:1)15个主要种群间所联结的种对在1m×2m至4m×8m 5个样方尺度内,总体呈显著的负关联,随调查样方尺度的扩大,关联性减弱,但当扩大到一定尺度时(32m×32m),则开始总体出现正关联。2)选择的105个种对中,有50个种对分别在不同样方尺度中表现出显著或极显著的种间关联,约占总数的47.6%;其中27个种对为正关联,20个种对为负关联,3个种对在小样方时呈负关联,当样方尺度扩大到一定时开始呈现正关联。3)调查发现群落中种对间的关联性除与一定尺度下的关联系数有关外,还与调查样方尺度有关。一般说来,最小关联面积越小,关联系数越大种对间关联程度越强。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号