首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
从非结构化文本中抽取给定实体的属性及属性值,将属性抽取看作是一个序列标注问题.为避免人工标注训练语料,充分利用百度百科信息框(Infobox)已有的结构化内容,对非结构化文本回标自动产生训练数据.在得到训练语料后,结合中文特点,选取多维度特征训练序列标注模型,并利用上下文信息进一步提高系统性能,进而在非结构化文本中抽取出实体的属性及属性值.实验结果表明:该方法在百度百科多个类别中均有效;同时,该方法可以直接扩展到类似的非结构化文本中抽取属性.  相似文献   

2.
知识图谱以图的形式描述概念、实体及它们之间的关系,通过建立唐诗、作者和地点等关系图谱,可以从古诗词数据中挖掘深层次的知识。获取互联网中的各种类型的唐诗相关的数据,包括各类百科数据和垂直网站等。利用自顶向下的方法,构建本体,定义领域概念,并自动的从多数据源中抽取出实体、关系及属性等信息进行填充。基于词向量进行实体对齐,判断不同来源的实体是否描述的是现实世界中的同一实体,从而扩充构建好的知识图谱。最后,通过Neo4j图数据库进行展示。  相似文献   

3.
属性约简和属性值约简是利用粗糙集理论从决策表中挖掘决策规则的基础,挖掘决策规则是粗糙集理论的重要研究领域之一。本文根据属性的重要度和条件差别矩阵来进行条件属性约简,找出有效约简。同时定义了决策表的不一致度,并根据属性重要度来进行属性值约简,在保持决策表不一致度不增加的前提下挖掘出决策规则,该决策规则集满足独立性、覆盖全域性、可接受性和一致性,即决策规则集为决策算法,最后运用实例对该方法的有效性进行说明。  相似文献   

4.
基于本体抽取三元组〈概念,属性,属性值〉,以词汇聚类为基础,将概念表示为属性和属性值的组合向量,对基于属性的概念模板和基于属性值的概念模板进行对比.研究发现,基于属性和属性值组合的概念模板优于任何一个单独的模板.  相似文献   

5.
感觉抽取的定性映射模型   总被引:3,自引:3,他引:0  
将其检测属性的定量属性值转化为定性属性值是感觉的一个基本功能,根据属性的哲学定义,本文给出了属性、定量属性值、性质、定性映射和定性一基准等术语的哲学--数学定义,并指出:感觉抽取可归结为一个定性映射。  相似文献   

6.
基于Rough集的数据挖掘在教学评价中的应用   总被引:2,自引:0,他引:2  
基于粗集的数据挖掘的主要过程是数据预处理、约简及规则提取.为了分析教师教学行为和教学效果之间的关系,以教学评价的数据为基础,利用基于粗糙集的数据挖掘技术进行挖掘.实例研究中采用基于分明矩阵的属性约简算法和启发式属性值约简算法,去掉决策表中的冗余属性和属性值,得到了影响教学效果的关键因素刎和相关规则.  相似文献   

7.
一种基于粒度的规则挖掘方法   总被引:3,自引:0,他引:3  
利用知识的粒度,提出了一种新的规则挖掘方法.首先利用粗糙集中判断属性重要性的尺度,获取一个属性,由此属性形成对域的粒度,并对粒度中的每一个粒进行同样操作,直至所有粒的决策属性值唯一为止.算法分析与实验对比说明,该方法是有效可靠的.  相似文献   

8.
海量新闻文本中往往涉及多个实体,并蕴含复杂多样的事件.为了挖掘这些实体、事件信息,先前的以事件为中心的事件抽取方法大多先检测事件,再抽取事件论元.受限于触发词和事件识别,该方法无法应用于真实工业场景下的新闻事件抽取.考虑到命名实体识别(named entity recognition, NER)的性能达到90%以上,提出了以目标实体为视角的事件抽取任务—目标依赖的事件识别(target-dependent event detection, TDED),旨在抽取出实体并识别其对应的事件.基于该任务,提出了先抽取实体再识别目标级事件类型的两阶段模型框架.该模型融合了事件关键词和句法依存距离特征,能够学习目标依赖的上下文信息.在构建好的真实中文金融数据集上的实验结果表明,该模型抽取性能较佳,即使在句中存在多个实体或事件的复杂情形下也能取得很好的性能表现.  相似文献   

9.
识别和抽取XML文档中的关系信息及其出现模式   总被引:3,自引:0,他引:3  
Web中存在着大量描述实体间相互关联的信息,而目前的搜索引擎缺乏知识的处理和理解能力,无法对Web中的关系信息进行识别.该文以XML作为研究对象,提出了一种XML文档中识别和抽取关系信息及其出现模式的方法.该方法按照用户的挖掘请求搜集XML文档;通过计算XML文档的相似度来识别目标文档;建立用户挖掘模式并与目标文档进行模式匹配实现关系数据的抽取.实验结果表明提出的XML相似度计算方法能较好的实现目标文档的识别,同时采用的模式表达和匹配方式也能较准确地从目标文档中抽取出用户所需的关系数据.  相似文献   

10.
为了解决技术创新中可用资源选择过程算法化程度与创新效率较低的问题,提出基于知识图谱自动构建的可用资源表示与推荐方法;首先采用双向长短期记忆模型和条件随机场模型建立可用资源实体抽取模型,基于依存句法分析实现实体关系抽取,从而构建可用资源知识图谱;然后分析可用资源属性在可用资源利用过程中的作用,并架构属性匹配网络,实现基于知识图谱的可用资源推荐;最后通过实验和案例分析验证所提方法的有效性。结果表明,知识图谱能够有效表示可用资源,可以应用于智能化计算机辅助创新系统的开发。  相似文献   

11.
随着中文网站数量的日益庞大,中文的Deep Web信息集成已成为网络信息领域的焦点。属性相似度计算是Deep Web信息集成中模式匹配的关键一步。该文根据中文查询接口中的属性词汇常常表现为1-3个词语构成的短语的特点,提出一种更有效的基于《知网》的属性相似度计算的方法,使属性匹配的准确率得到大幅度提高。  相似文献   

12.
面向属性归纳的方法以关系的或面向属性的操作实现数据挖掘过程。文中将统计分析方法和面向属性的归纳方法接合起来 ,形成了一种应用比较广的数据挖掘方法。同时提出属性数据挖掘可分为两个层次 ,包括从数据产生模型和从数据归纳出知识。从数据推导出的模型可以进行数据预处理和定量描述变量之间的关系 ;由数据挖掘出的知识可以揭示客观世界的普遍规律  相似文献   

13.
一种基于属性重要性的属性约简启发式算法   总被引:2,自引:0,他引:2  
属性约简是粗糙集理论研究中的关键问题之一.文中定义了一种新的属性重要性度量准则,克服了多值偏向性问题,并给出一种新的属性约简算法.该算法以核属性集为初始约简集合,以新的属性重要性度量准则为启发信息,通过逐步加入相对于决策而言重要的条件属性来求取最小约简.实例分析表明该算法是有效的.  相似文献   

14.
属性融合是潜藏在 P-集合内的一个重要的应用特性,P-集合的动态特性来自 P-集合的属性融合。利用内 P-集合的结构与动态特性,给出属性内-融合概念、结构和定理,最后给出在属性内-融合条件下的数据融合挖掘和数据融合挖掘准则与数据融合挖掘-筛选的应用。  相似文献   

15.
基于属性识别理论的塔里木河水质评价与分析   总被引:3,自引:0,他引:3  
属性识别理论是根据实测资料构造样本空间矩阵,利用评价指标进行样本属性分类和构造样本属性矩阵,用熵理论确定指标权重,然后进行水质评价.根据塔里木河各测站的资料,建立了属性识别模型,评价了塔里木河的水质;结果表明塔里木河枯水期水质较差,丰水期水质良好,平水期水质一般,评价结果符合塔里木河水质的现状.属性识别理论概念清晰,计算简单,评价结果比较客观.  相似文献   

16.
基于关系积的属性约简算法   总被引:1,自引:0,他引:1  
粗糙集的属性约简是一个NP难问题,目前尚无高效的算法.基于集合理论,提出了关系积概念和基于关系积的属性约简算法,把决策表的属性约简过程转化为关系积的运算,减小了对决策表的扫描次数,提高了属性约简的效率;算法采用自底向上和宽度优先的搜索策略,可确保找到最小属性约简集.结合实例,给出了算法的具体实现.  相似文献   

17.
粗糙集理论是一种新的处理模糊和不确定知识的数学工具。属性约简是粗糙集理论研究中的重要内容之一。本文提出基于属性约简的模糊综合评判。通过属性约简,模糊评判过程中因素集(属性集)的指标数大大减少,从而达到简化运算、节约时空资源的目的。  相似文献   

18.
陈炎龙 《科学技术与工程》2012,12(24):6179-6183,6199
属性约简是粗糙集理论的核心研究内容之一。通过对某些现存属性约简算法分析,发现它们并不能有效地或正确地获取约简结果。为此,论文提出了一种基于属性递减策略的属性约简递归算法,该算法首先求出每个条件属性的依赖度,然后依次从条件属性集中减去依赖度较小的属性,并判断剩余属性集依赖度是否为1,如果是,则算法递归执行。最后把所获属性集并入约简集并求得核。该算法不仅能够快速计算出所有约简和核,而且运算简单、计算量较少,从而提高了算法效率。实例验证表明,该算法能更有效地对决策表进行约简,具有很强的实用性。  相似文献   

19.
属性约简是数据挖掘之中最核心的问题,是任何一个部门决策知识获取的关键技术。基于深入研究模糊粗糙理论、直觉模糊粗糙集理论在属性约简知识方面的研究成果,通过定义区间模糊粗糙集的正域、依赖度与非依赖度等相关概念,提出一种启发式区间直觉模糊粗糙集属性约简方法。结果表明:该方法在知识约简中是可行的,并且相比差别矩阵方法,能有效降低空间和时间复杂度。  相似文献   

20.
属性约简是粗糙集的核心问题之一。本文基于决策规则给出属性约简相关结论和属性重要性,提出启发式约简算法,引入黄金分割法思想,提高算法效率,并以实例验证算法有效性和正确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号