首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
大数据中的知识发现是大数据应用中的核心热点.本文从高度抽象认知事物视角出发,以表征事物普遍性为特征的概念驱动与表征事物特异性为特征的数据驱动两种方法学为哲学原理,提出了基于属性偏序结构图和对象偏序结构图的知识发现方法.分别从群结构、子群结构、支路、节点等角度对数据特征之间的结构关系进行讨论分析.属性偏序结构图将数据中具有某些共同特征的对象聚类到一起,是数据共性的表达;对象偏序结构图中,通过数据的独有属性可以快速有效的将特异性对象区分于其他对象.最后,以中医药方剂配伍研究问题为例,对张锡纯治疗中风的32个处方进行数据挖掘和知识发现,证明了该方法的有效性和实用性,为大数据知识发现研究提供了新的思路和方法.  相似文献   

2.
形式概念分析是一种强有力的数据分析和可视化工具,自提出至今已被应用到数据挖掘、知识发现等领域.但由于概念间复杂的关系使得概念格中的连线错综复杂,尤其是在处理大的形式背景时显得尤为混乱.形式背景中所包含的属性间关系、对象间关系以及对象一属性关系是形式背景的本质关系,本文在人类认知事物哲学原理的指导下,构建了以描述属性间关系和区分对象为基本目的的偏序结构图,并描述了其构建方法.该种图形层次分明、结构清晰,不存在线的交叉连接,具有比较好的可视化效果,尤其计算方法简单,存在应用到大数据的潜能,为大数据数据分析和知识发现提供了一种潜在工具.  相似文献   

3.
随着信息技术的快速发展,人类面临的数据呈爆炸式增长,大数据的时代已经来临.大数据研究成为当今科学和经济社会发展的重大战略方向和必然趋势.大数据的巨大价值在于依据数据间关联性而建立的复杂结构关系网络中所蕴含的知识.大数据知识发现是一个非常重要和亟待解决的问题.本文总结了以燕山大学为核心的大数据研究团队部分最新工作,重点给出了大数据偏序结构理论及其相关工作的简要介绍,为快速、准确了解该团队的研究现状提供参考.  相似文献   

4.
偏序结构图因其良好的知识可视化特性已在知识发现、数据挖掘等领域得以广泛应用.但在对大数据所形成的超大形式背景进行研究和分析时,偏序结构树形图存在的一些不足,使大数据可视化效果欠佳,不利于对大数据进行数据挖掘和知识发现.本文对偏序结构树形图进行改进,提出了可用于大数据分析的偏序结构环形图.对实例形式背景绘制出偏序结构环形图,并与其偏序结构树形图比较.实验结果表明,该方法清晰、直观,可视化效果较好,能更有效地呈现出大形式背景中的重要信息,可以应用在大数据的数据挖掘和知识发现中.  相似文献   

5.
方证研究是中医领域研究的热点,但方证之间数据量大,复杂度高,传统的数据挖掘方法面对海量的中医数据显得力不从心.随着大数据时代的到来,大数据的理念和技术为中医知识的充分研究带来机遇.本文基于形式概念分析的属性偏序表示原理,运用属性偏序结构图揭示方证的特征症状,对挖掘中医经典的科学内涵、促进学术创新有一定的借鉴价值.  相似文献   

6.
基于形式概念分析理论,以《伤寒论》中含干姜方剂、方剂中药物和方剂-药物关系为概念,借用描述事物普遍性和特殊性层次的复杂概念网络生成方法生成属性偏序结构图,从而给出相应方剂(对象)和不同含量的药物(属性)之间的关系结构可视化表示和解释.通过属性偏序结构图探析《伤寒论》中干姜的配伍规律,包括黄连汤、半夏泻心汤、小青龙汤中干姜配半夏,四逆汤中干姜配生附子.属性偏序结构图是将信息科学与传统中医伤寒学结合的新尝试,这种新途径有利于我们对《伤寒论》再学习和认识.  相似文献   

7.
中医类方的研究是目前中医研究的热点之一,然而类方的研究是一个多层面的复杂工程,单一的数据挖掘方法面对大量的高维数据显得力不从心.随着大数据时代的到来,本文提出基于属性偏序结构理论的大数据分析新方法,利用属性偏序结构图,用可视化的方式展现中医的诊疗规律.本文基于属性偏序结构理论,利用临床病历数据,对李赛美教授运用柴胡类方诊疗消渴病及瘿病的辨证思路及处方经验进行了分析,从结果证明,运用属性偏序结构理论,能使中医的理论体系得到客观展现,为建立中医辨证论治的个体化诊疗体系提供坚实的基础.  相似文献   

8.
知识发现中缺损数据的处理(I)   总被引:3,自引:2,他引:1  
研究了如何在知识发现中处理属性值缺损的问题,通过发现值缺损属性的取值集合,值缺损属性是否为强作用属性以及与其他属性是否相关。不仅解决了对含有缺损数据信息源进行知识发现的问题,同时也说明了对缺损数据处理的意义。  相似文献   

9.
知识发现中缺损数据的处理(Ⅱ)   总被引:1,自引:1,他引:0  
研究了在知识发现过程中处理连续取值属性值缺损的问题,提出了进行连续值划分的“超长方体”划分法,在此基础上,通过发现值缺损属性的取值集合,值缺损属性是否为强作用属性以及与其它属性是否相关,解决了对含有缺陷数据的信息源进行知识发现的问题,文中通过处理UCI机器学习数据库中的COIL数据库,说明了本方法是可行的。  相似文献   

10.
知识发现过程中连续属性离散化方法研究   总被引:8,自引:0,他引:8  
在综合分析知识发现过程中连续属性离散化方法的基础上,提出了一种基于全局聚类分析来处理连续属性离散化问题的方法。实例验证结果表明该方法对知识发现过程中连续属性离散化的划分更为合理。  相似文献   

11.
知识发现中缺损数据的处理(II)   总被引:1,自引:0,他引:1  
研究了在知识发现过程中处理连续取值属性值缺损的问题。提出了进行连续值划分的“超长方体”划分法。在此基础上 ,通过发现值缺损属性的取值集合 ,值缺损属性是否为强作用属性以及与其他属性是否相关 ,解决了对含有缺损数据的信息源进行知识发现的问题。文中通过处理UCI机器学习数据库中的 COIL数据库 ,说明了本方法是可行的。  相似文献   

12.
基于粗糙集方法的知识发现   总被引:1,自引:0,他引:1  
属性约简和属性值约简是租糙集理论中的重要研究内容,也是粗糙集理论应用于知识发现的主要方法.但求取任意问题的最小属性集是一个NP难问题.本文利用属性间的知识依赖度,提出了一个求取属性约简的贪心算法,它可以在多项式时间内得到一个约简.同时,把粗糙集方法应用于知识发现,通过属性约简删除信息系统的冗余属性,减少数据量,再利用属性值约简,获取决策规则.最后通过实例说明了基于粗糙集方法的知识发现过程,验证了方法的有效性.  相似文献   

13.
粗集在知识发现中的应用   总被引:4,自引:0,他引:4  
粗集作为一种数据分析理论,能有效地从不确定性的数据中发现知识,是目前在知识发现领域研究的热点之一。首先对粗集理论做了简单介绍,在此基础上论述了粗集作为一种数学工具在知识发现领域中的重要问题,并提出粗集的进一步可能发展方向。  相似文献   

14.
知识概念的研究是知识表示、知识发现和知识获取的基础.利用概念的内涵与外延的特点,给出信息系统的知识概念,得到信息系统知识概念的性质和知识发现原理,并给出基于知识概念的属性约简和应用.  相似文献   

15.
属性偏序形式结构,作为一种基于人类认知原理和粒计算思想的知识发现和知识表示新理论,目前已有广泛的应用,但其理论基础缺乏抽象化数学化,这势必影响该理论的系统发展。针对上述问题,研究了属性偏序形式结构的数学形式化描述问题。首先,基于粒计算的思想提出了知识表示的形式化框架。在此基础上,通过定义对象集合的覆盖和最简覆盖,给出属性偏序形式结构的粒和粒群的概念,进而通过对粒衍生出粒群的充要条件的讨论,给出了属性偏序形式结构中的知识结构,从而完成属性偏序形式结构的数学形式化描述。最后,通过具体实例展示了利用数学形式化描述构造属性偏序形式结构的过程,并揭示了该过程所体现的人类认知规律。  相似文献   

16.
讨论了利用领域知识,如完整性约束,分级概念等,对原数据库进行重新处理并且给那些丢失或明显背离常规的属性确定一个取值区间。实验证明利用这种基于属性的知识发现方法处理缺损数据是很有效的。  相似文献   

17.
介绍了基于偏序关系的偏序决策表,研究了偏序决策表各条件分类和决策分类集合之间的关系,提出了从各分类中计算偏序决策表核及属性约简方法,通过实例,验证了这些方法的有效性。  相似文献   

18.
知识的属性扰动引起知识规律的变化,这些属性扰动知识规律具有链式特征;利用S-粗集,给出知识规律、属性扰动的知识规律和扰动度的概念,并对知识规律与属性扰动的知识规律进行了讨论,提出了属性扰动知识规律的链式定理.  相似文献   

19.
在数据库中发现知识是一个非常活跃的研究领域。在本文中,我们提出一种改进的面向属性的归约算法,即引入充分扩展关系这样一个中间概念,以方便从数据库中提取有趣的结果。  相似文献   

20.
基于 Rough Set 的知识发现系统   总被引:1,自引:0,他引:1  
RoughSet理论是近年来出现的处理模糊和不确定性的数学工具,已广泛应用于人工智能的许多领域特别是KDD领域。文章介绍了RoughSet理论的基本思想,并着重讨论了几个基于RoughSet理论的典型KDD系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号