首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 406 毫秒
1.
合理利用城市轨道交通安全事件案例对突发事件下辅助制定应急决策具有重大意义.目前,中国轨道交通运营商存储了大量的安全事件案例,但大多以自由化或半自由化文本的形式存储在数据库中,使用率较低.为提高城市轨道交通安全事件案例的使用效率,提出了基于规则的信息抽取方法,将城市轨道交通安全事件案例的自由文本转化为用共性知识元表示的结构化数据.通过指标计算,所提出的方法可以以较高的准确率和召回率对安全事件要素进行抽取,可为突发事故时的应急决策制定提供高效的数据支撑.  相似文献   

2.
基于案例推理中案例表示的研究   总被引:1,自引:0,他引:1  
基于案例推理利用过去的案例或经验进行推理来求解新问题,是一种重要的机器学习方法.在CBR(Case-based Reason ing)中知识表示以案例表示为基础,案例是一段带有上下文信息的知识,该知识表达了推理机在达到其目标的过程中能起关键作用的经验.案例表示可能是半结构化或非结构化的,甚至用自然语言来表达的,涉及系统的运行效率.分析了目前的多种表示方法,研究了不同环境下的案例表示,以及选用合适的方法来构筑的案例库.  相似文献   

3.
随着互联网的普及,非结构化文本数据的规模不断扩大且越来越多地用于大众传播。因此,从海量数据抽取热点信息已成为一个重要的研究课题。针对新闻的热点挖掘进行方法改进及分析,结合新闻及事件模型,使用TextRank算法提取关键词,运用相似度计算方法,提出了一种基于评论的热点新闻事件识别方法。研究结果表明该方法具有一定的可行性。  相似文献   

4.
信息抽取任务旨在从非结构化的文本中抽取出结构化的信息,帮助将海量信息进行自动分类、提取和重构,提高信息的利用率.目前,基于深度神经网络的信息抽取技术已经成为自然语言处理领域最重要的研究主题之一,它提供了分析非结构化文本的有效手段,是实现大数据资源化、知识化和普适化的核心技术,此外进一步为更高层面的应用和任务提供了支撑....  相似文献   

5.
针对煤矿突发事件的特点,对一起瓦斯实例对案例的原始文本信息进行了规范化与知识化,基于数据库技术构建了案例库,提出了基于模板检索与最近邻法相结合的案例检索策略,并作了新的改善,最后提出了基于粗糙集理论的案例库优化方法.将案例推理应用于煤矿突发事件的预测决策中,具有一定的实际意义.  相似文献   

6.
针对复杂多源的非结构化数据,提出一种数据标准化方法,在抽取信息的同时,能将不同来源的数据转换为统一的表示形式.首先,对文本进行词性标注等预处理,提取出需要进一步识别类型的实体;其次,使用语言表征模型对文本信息进行向量表示;最后,通过基于注意力机制的卷积神经网络对抽取出的实体进行分类,以适应不同应用场景的分类标准.实验结果验证了该模型的有效性.  相似文献   

7.
王腾阳  赵小丹  胡林 《科学技术与工程》2023,23(27):11562-11569
马铃薯育种领域积累有大量尚未结构化处理的育种文献文本,人工整理文献内的种质资源数据费时费力。为了快速、准确地从育种文献中提取种植资源数据,使用基于词性标注规则和预设词的方法抽取文献数据。文献格式为PDF文档,对于不能直接获取文档文本的情况,使用游程平滑算法和光学字符识别(Optical Character Recognition, OCR)获取文本内容。采用用户可灵活建立的关键词库保存抽取项,通过正则表达式获取关键词所在语句,并利用自然语言处理工具对语句进行分词与词性标注,根据规则抽取目标词,同时采用基于关键词与预设词距离的信息抽取方法,实现将育种文献从自由文本转化为结构化数据。对115篇文献的1490个抽取项进行信息抽取,实验表明,该方法的准确率为82.97%,召回率为99.72%,F值为90.58%,能以较高的准确率和召回率对马铃薯育种文献种质资源进行抽取,可为构建马铃薯遗传育种数据库提供数据基础。  相似文献   

8.
信息抽取技术是深层次分析文本语义信息的基础.随着数据量的增加,尤其是针对海量网络信息分析的需求,传统的基于手动标注或人工干预的训练分类方法已不能满足要求.以“大学生心理健康”相关网页作为信息语料,提出一种基于案例分析的文本数据抽取方法,可以实现跨领域信息自动抽取,能够快速有效地获得满足用户需求的信息.  相似文献   

9.
实体关系抽取是信息抽取的重要组成部分.描述了一种融合多信息的实体语义关系抽取方法,充分利用中文的各种特征和信息来提高关系抽取的性能.该方法主要结合特征向量和树核函数两种方法;特征向量表示了文本的语言信息,树核方法表示了文本的结构化信息.并且在2005年的自主内容抽取(automatic content extraction,ACE)基准语料上进行关系检测和6个关系大类抽取的实验.实验结果表明,该方法能识别出大部分的非关系实例,各种关系类型识别的精确率和召回率也有一定提高.  相似文献   

10.
从非结构化文本中抽取给定实体的属性及属性值,将属性抽取看作是一个序列标注问题.为避免人工标注训练语料,充分利用百度百科信息框(Infobox)已有的结构化内容,对非结构化文本回标自动产生训练数据.在得到训练语料后,结合中文特点,选取多维度特征训练序列标注模型,并利用上下文信息进一步提高系统性能,进而在非结构化文本中抽取出实体的属性及属性值.实验结果表明:该方法在百度百科多个类别中均有效;同时,该方法可以直接扩展到类似的非结构化文本中抽取属性.  相似文献   

11.
随着"智能油田"的建设加快,构建基于海量石油数据的智能分析系统意义重大。然而,由于石油生产过程中产生的文本数据往往无结构且类型多样,从中抽取关键信息进行分析成为一个研究热点,而信息抽取又需要高质量的语义实体做支撑。根据这一特定问题,提出基于命名实体识别(Named Entity Recognition,NER)技术针对石油非结构化文本进行信息抽取,构建双向长短时记忆(Bidirectional Long Short-Term Memory,Bi LSTM)网络模型提取语料特征,并结合条件随机场(Conditional Random Field,CRF)做分类器,构建了基于Bi LSTM+CRF的高精度NER模型,针对石油工业领域的非结构化文本进行命名实体抽取。通过在修井作业文本数据集上进行对比实验表明,本方法具有较高的精确率和召回率。  相似文献   

12.
开放式信息抽取系统是从Web等非结构化文本中挖掘知识的主要途径,但其抽取结果往往存在大量噪声,对知识发现以及知识库构建产生较大影响。提出一种基于概率软逻辑模型的知识推理验证方法,该方法首先使用一阶逻辑语言对知识抽取结果进行转化和推理,并且在推理过程中引入本体规则进行约束,在此基础上,建立推理规则的自动学习机制,解除传统规则推理对于实体解析规则的依赖,进而实现对知识的自动推理和验证。经实验对比验证,该方法具有更优的算法性能,实现了规则的自动学习,提高了知识推理效率,对验证知识的语义规范性和正确性有积极作用。  相似文献   

13.
知识图谱的表示学习方法将实体和关系嵌入到低维连续空间中,从而挖掘出实体间的隐含联系.传统的表示学习方法多基于知识图谱的结构化信息,没有充分利用实体的描述文本信息.目前基于文本的表示学习方法多将文本向量化,忽略了文本中实体间的语义关联.针对上述缺点提出一种利用实体描述文本进行增强学习的方法,基于文本挖掘出关联性实体并对关联性进行分级,将关联性作为辅助约束融合到知识图谱的表示学习中.实验结果表明,该辅助约束能明显提升推理效果,优于传统的结构化学习模型以及基于深度学习的文本和结构的联合表示模型.   相似文献   

14.
基于粗糙集的故障案例特征提取方法   总被引:1,自引:0,他引:1  
针对故障案例特征属性提取在故障案例推理中的重要性,提出了案例的决策表表示形式,介绍了Semi-Naive-Scaler属性离散化算法,并给出了基于遗传算法的属性约简算法。在粗糙集的基本理论和方法基础上,计算了特征属性的重要度,给出了计算实例。  相似文献   

15.
为实现对突发事件演化态势的推演及问题的分解,针对已有突发事件态势研究中缺乏与推理规则结合的问题,借鉴基于知识元的事物知识表示方法,提出突发事件问题域知识组织的事件对象-属性-关系层次模型.通过将模型关系层中推理规则由基本结构转换为最简结构,得到两个事物属性间最简洁的关联结构.连接推理规则最简结构,构建可用于表示突发事件问题域发展态势及实现问题分解的特征网络.最后,通过震后物资调度的案例验证了特征网络对突发事件态势描述的可行性.  相似文献   

16.
贝叶斯网络技术具有丰富的概率表达能力,不确定性问题的处理能力,以及多源信息的融合能力,其有利于辅助突发事件的应急决策,提高决策效率.突发事件应急决策具有较高的时间敏感性,因此要求能够尽可能缩短贝叶斯网络的建模时间,而从无到有的传统贝叶斯网络建模方法的效率显然无法较好地满足这一要求.因此,针对以上问题,提出了基于案例推理的应急决策贝叶斯网络建模方法.该方法基于历史案例库,通过相似度和偏离度两个指标对历史案例进行匹配并得到候选案例,最后通过案例合并和剪枝等方法对候选案例进行调整,最终得到新的案例模型.通过案例仿真对所述方法进行了验证,结果表明:基于案例推理的应急决策贝叶斯网络建模方法没有庞大的搜索空间,也不需要样本数据,只需要提前收集历史案例模型,与传统贝叶斯网络建模方法相比,该方法能够复用历史模型,从而缩短了建模时间,提高了建模效率.  相似文献   

17.
文本关键词的抽取作为文本摘要、文本检索以及文本挖掘任务的基础工作,在自然语言领域得到广泛应用。通过对文本关键词抽取方法和研究现状的详述,将文本关键词抽取方法分为传统文本关键词抽取方法和基于深度学习的文本关键词抽取方法,并对比分析各类方法的基本思想和优缺点,归纳了文本关键词抽取方法的评价指标。进一步调研了民族语言关键词抽取的研究现状,阐述处理民族语言文字时存在的困难,总结了几种民族语言如蒙古文、藏文、维吾尔文的关键词抽取技术和应用场景。  相似文献   

18.
文章将计算智能、启发式搜索技术和案例推理技术应用到决策技术的研究中,采用多策略相似性检索策略,优化案例属性的选择,优化目标问题的解决方案,提出了一种优化型案例决策技术框架.利用案例推理技术的学习优势,结合遗传算法与禁忌算法高效的搜索机制,可望部分解决现存决策支持系统知识获取困难和检索效率低下的问题,提高其解决半结构化和非结构化问题的能力.  相似文献   

19.
随着文本信息(软信息)对多传感器信息融合的影响不断加深,如何形成一个有效的软信息结构化转换模型,给予计算机和传感器更多可融合的结构化软信息,成为了一个重要的任务。针对软信息结构化问题,即文本表示问题,首先对文本分类技术中向量空间模型的TF-IDF权重进行研究;然后针对其结构化有效性方面的不足,通过引入事件全局权重和信息增益对TF-IDF权重进行特征项关于文本主旨的信息及特征项在文本类间的分布信息补充、完善和实现软信息的结构化表示;最后通过实验验证了该改进方法对软信息结构化转换的可行性和有效性。  相似文献   

20.
文章主要研究短文本关键词抽取及具有丰富文本含义的关键词扩展问题,在关键词抽取工作中将文本主题分类信息和词搭配关系引入到传统的TF-IDF算法中;在关键词扩展的工作中,通过构建词的特征表示向量,计算文本关键词和类别特征词相似度,从而发现所需扩展的关键词,两方面工作均取得了令人满意的结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号