首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
文本聚类作为一种自动化程度较高的无监督机器学习方法,能够实现对文本信息的有效组织、摘要和导航,近年来已经广泛应用在信息检索领域。笔者针对使用向量空间模型进行聚类时对于同义词和多义词的处理存在的缺陷,提出了基于本体的文本聚类模型。首先使用WordNet词典对文档中的词进行语义标注,得到文档的概念集合;然后对每个文档的概念集合进行概念聚类,生成文档的概念主题;最后通过计算主题的相似度完成文本聚类。该模型减少了相似度计算量,改善了聚类结果和聚类性能。  相似文献   

2.
从领域本体的结构和元素等层次,研究多粒度本体整合方法,开发出面向同一领域的本体整合工具系统.以两个电子类领域本体作为整合案例,分析OWL文件结构特征,抽取本体的主要信息以树型结构进行表示,通过元素层次和结构层次相结合的映射方法,同时采用相似度计算模型并借助本体词典Wordnet和基于统计学的方法,对领域本体进行整合操作,结果不仅实现了基于元素级层次的处理,而且实现了其语义层次上的分析.  相似文献   

3.
中文检索是信息产业中发展较快且很重要的领域,在对全文索引进行深入的理论分析基础上,设计实现了基于倒排索引结构的中文文本检索系统.该系统采用词库匹配法对文本文档进行关键词的切分,并对关键词建立索引,最后通过索引实现对关键词的检索.  相似文献   

4.
分析了门户网站全文信息检索系统的功能,对该系统的结构(包括数据采集引擎、索引数据库、索引引擎、文本分析引擎、数据查询引擎)进行了研究,重点讨论了数据采集引擎中的数据库采集器和HTML采集器.统一整合频道后建立的全文信息检索系统,能够提供高效、便捷的信息检索服务,提高用户对网站内容的搜索效率.  相似文献   

5.
在线词典是比传统纸质词典和一般电子词典更为先进的词典形式。介绍了在线词典的概念,指出在线词典具有信息容量大、实时共享、图文并茂、检索便捷、更新及时等特点,并对其未来的发展趋势作了简要预测和展望。  相似文献   

6.
提出了一个自动生成DBASE文件档案的数据宇典系统。该系统通过定义控制 信息字典和DBASE文件字典,对输入的文件信息加以组织和分类,进而自动生成 标准化的 DBASE文件档案。文中描述了该系统的信息分析过程和字典结构,并给 出了系统的存贮结构与设计方法。  相似文献   

7.
知识获取技术制约着知识系统的研究和应用,有效地从文本中提取领域知识成为知识获取的重要途径.本文提出了基于本体和图分析的领域知识获取技术,分析了本体数据结构、本体概念的实例化以及基于图分析的语义场构造方法.建立了具有广泛适用性的文本知识获取系统框架,实现了原型系统.通过针对中医医案的中医领域知识获取实验验证,取得了较好的效果.  相似文献   

8.
首先, 基于点互信息与信息检索(PMI IR)算法, 提出一种Laplace平滑情感判定(LS-SO)算法, 对情感词典与表情符号情感词典进行自动扩充, 得到了具有一定规模、 高质量的情感词典, 包括基础情感词典、 目标情感词典、 网络用语情感词典、 表情符号情感词典、 否定词词典、 疑问词词典、 程度副词词典和连词词典. 其次, 通过细化文本语义分析规则计算文本情感值. 实验结果验证了该方法的有效性.  相似文献   

9.
语义词典是人工智能、语义网与知识工程等研究领域的热点,它可以支持机器学习、自然语义理解、数据挖掘及机器翻译等技术。文章在藏语独特的文法理论研究基础上,利用对比英文和藏文词之间的语义关系、构建双语大型数据库和制定映射过程中词汇空缺等方法,构建了基于半自动匹配的藏文语义词典。本语义词典既兼容了国际通用的英文WordNet,又保留了藏语的特点,为藏文信息处理提供了重要的数据资源。  相似文献   

10.
随着"智能油田"的建设加快,构建基于海量石油数据的智能分析系统意义重大。然而,由于石油生产过程中产生的文本数据往往无结构且类型多样,从中抽取关键信息进行分析成为一个研究热点,而信息抽取又需要高质量的语义实体做支撑。根据这一特定问题,提出基于命名实体识别(Named Entity Recognition,NER)技术针对石油非结构化文本进行信息抽取,构建双向长短时记忆(Bidirectional Long Short-Term Memory,Bi LSTM)网络模型提取语料特征,并结合条件随机场(Conditional Random Field,CRF)做分类器,构建了基于Bi LSTM+CRF的高精度NER模型,针对石油工业领域的非结构化文本进行命名实体抽取。通过在修井作业文本数据集上进行对比实验表明,本方法具有较高的精确率和召回率。  相似文献   

11.
随着大数据与人工智能在各个领域的深入应用,知识表示的标准化问题被提到了重要的日程。为实现知识表示的标准化,引入了现实世界、概念世界与计算机世界3个世界模型,明确阐述了将现实世界中的事物通过抽象,将其转化为概念世界中的概念系统模型,依据标准将其转化为计算机世界中的信息模型,从而实现知识表示。为了使概念系统模型表示规范化,重点研究了ISO/IEC 11179 MDR系列标准,剖析了其中的概念系统注册元模型规范,构建了MDR概念系统的七元组模型,同时还定义了概念间关系表示方法,为概念系统模型的表示奠定了基础。为了将注册在MDR中的概念系统模型转为计算机世界中的OWL本体表示模型,定义了将MDR概念系统向OWL本体映射的规则。最后,设计并开发了概念系统注册原型系统,验证了MDR概念系统和本体表示的可行性。研究成果为领域知识表示的标准化提供了方法论。  相似文献   

12.
数据字典DD是数据处理系统结构化分析方法的重要工具之一.在DD中,各数据元素之间应能相互匹配,并应与数据流程图DFD中各元素一一对应.DD与DFD分别以文字和图形的方式描述系统,因此DD更有利于计算机的数据表达.若对DD的内容描述更进一步地细化和扩充,采用人工智能AI的方法来实现人的感知行为活动和推理的智能化数据字典,那么DD即可成为一份通过系统分析和设计而产生的系统的详细说明文档.为此,本文就智能化数据字典的知识库的建立,以及实现其推理机制、知识获取和实用数据处理系统的功能优化等问题进行讨论,并探讨由智能化数据字  相似文献   

13.
基于超级P2P的网格GIS体系结构及其支撑环境   总被引:1,自引:0,他引:1  
Grid-GIS是一个采用SOA思想,支持动态多功能集成的网格GIS系统.系统采用一种超级P2P的网格体系结构,实现GIS资源的分布式存储、查询处理和动态功能集成;根据领域本体知识和推理机制,实现基于语义的智能查询;基于文本相似性,可分领域注册GIS资源,实现资源的快速发现;根据系统的状态和任务之间的通信关系,改进成本约束的自适应调度算法,实现系统的动态调度和负载平衡;采用WS-security扩展实现网格的安全性,既可以保证网格的安全又可以实现与其他平台的兼容性.基于LAN做了一个数据共享和转换的试验系统,验证了系统的可行性和有效性.  相似文献   

14.
"一张图"是高品质国土资源信息服务的通俗表达,在地质灾害信息服务体系建设中具有借鉴意义和实践价值。在梳理地质灾害数据类型、建立地质灾害本体数据库模型基础上,设计地质灾害"一张图"信息服务解决方案,并据此完成龙门山地区地质灾害信息服务原型系统。  相似文献   

15.
在对RADIUS协议格式和C网A12、P1口的信令流程深入分析的基础上,设计了一种基于Hash算法的RADIUS协议字典,将文本文件格式的字典按特定字段重新组织,以提高查询效率.针对C网RADIUS协议提出一套基于字典的解码方法,利用查询字典的方式进行字段解析.将该方法应用于信令监测系统中,结合现网数据进行测试,解码结果准确,解码速度提高了约25%,测试结果验证了该解码方法是有效的.  相似文献   

16.
This paper presents a system to alert of dangerous a child situation of a child by applying context information collected from a home network to ontology that is capable of inference. Radio frequency Identification (RFID) and sensors were used for the configuration of a home network, to obtain the raw data to convert into context information. To express the ontology, web ontology language (OWL) was used to provide the inference of context information. Then, simple object access protocol (SOAP) messages were used to notify of the dangerous situations that a child may be involved in via mobile devices. The proposed system consists of Context Manager, Service Manager, and Notification Manager. The child's safety management system can proactively detect the context data of a child on the basis of context awareness. In the experiment, the Jena 2.0 by ontology reasoner and the OSGi(Open Service Gateway initiative) Gateway developed using open source software Knopflerfish 1.3.3 were used to implement the service frame work.  相似文献   

17.
为了适应实验室现代化管理的需要 ,进一步提高实验教学任务管理的效率 ,提出开发实验教学任务书管理系统 .本文介绍了实验教学任务书信息管理系统的开发方法、系统数据字典 ,并阐述了系统的功能和实现的关键技术 .采用可视化、面向对象的PowerBuilder作为开发工具 .  相似文献   

18.
This paper presents a system to alert of dangerous a child situation of a child by applying context information collected from a home network to ontology that is capable of inference. Radio frequency Identification (RFID) and sensors were used for the configuration of a home network, to obtain the raw data to convert into context information. To express the ontology, web ontology language (OWL) was used to provide the inference of context information. Then, simple object access protocol (SOAP) messages were used to notify of the dangerous situations that a child may be involved in via mobile devices. The proposed system consists of Context Manager, Service Manager, and Notification Manager. The child's safety management system can proactively detect the context data of a child on the basis of context awareness. In the experiment, the Jena 2.0 by ontology reasoner and the OSGi(Open Service Gateway initiative) Gateway developed using open source software Knopflerfish 1.3.3 were used to implement the service frame work.  相似文献   

19.
智慧旅游建设的目的是要用新一代信息技术提升旅游服务水平和改善游客旅游体验。针对现有的旅游景区电子讲解系统缺乏自然语言互动交流能力的问题,研究一种基于自然语言处理和本体知识检索技术的旅游景区智能讲解系统,以便旅游景区能为游客提供自然语音对话式的个性化智能讲解服务。笔者设计了系统的物理架构和逻辑架构,然后分析实现文本向量化处理、命名实体识别、对话策略管理和讲解知识检索等关键技术,最后通过开发、测试系统原型,验证了系统的可行性。  相似文献   

20.
为了解决分布式词表示方法因忽略词语情感信息导致情感分类准确率较低的问题,提出了一种融入情感信息加权词向量的情感分析改进方法。依据专属领域情感词典构建方法,结合词典和语义规则,将情感信息融入到TF-IDF算法中,利用Word2vec模型得到加权词向量表示方法,并运用此方法对采集到的河北省旅游景点的评论文本与对照组进行对比实验。结果表明,与基于分布式词向量表示的情感分析方法相比,采用融入情感信息加权词向量的改进方法进行情感分析,积极文本的准确率提高了6.1%,召回率提高了6.6%,F值达到了90.3%;消极评论文本的准确率提高了6.0%,召回率提高了7.2%,F值达到了89.6%。因此,融入情感信息加权词向量的情感分析改进方法可以有效提高评论文本情感分析的准确率,为用户获得更为准确的评论观点提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号