首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 593 毫秒
1.
随着网络信息的飞速发展,纯手工的信息归类手段已经严重影响信息处理的进程。因此自动化的信息归类处理越来越受到人们的重视,其中文本自动归类系统是信息归类处理的重要研究方向,它的功能是在给定的归类体系下,根据文本的内容自动判别文本的类别。本文在研究传统文本归类技术的基础上,包括向量空间模型、特征提取和TF/IDF分词算法,引入了领域本体知识推理和领域事件构造等关键技术,提出了基于本体领域事件驱动的文档自动归类算法,并给出了较满意的实验结果和评价。  相似文献   

2.
牟尧  李曦 《中国西部科技》2011,10(24):49-51
关于文本自动分类算法,理论界对此有很多的研究,本文详细介绍了一种新的分类算法:多因素加权归类算法,并对此算法在档案自动归类中的应用做了具体的阐述。文章主要讲述了三个方面的内容:分类词库的构造、分类用词的切分算法以及多因素加权归类算法。  相似文献   

3.
毛平 《科技资讯》2009,(36):183-183
本文在构建军用飞机领域本体的基础上,尝试基于领域本体的文本信息语义检索研究。重点探讨了基于领域本体的文本信息标注以及查询扩展方法以及知识片段的提取思想,实现了基于语义的文本信息资源的检索功能。  相似文献   

4.
Boosting算法在文本自动分类中的应用   总被引:7,自引:0,他引:7       下载免费PDF全文
随着网络信息的迅猛发展,如何快捷、准确地识别和获取有用信息显得更为重要。文本自动分类系统是信息处理的重要研究方向,它是指在给定的分类体系下,根据文本的内容自动判别文本类别的过程。Boosting算法是一种新兴的机器学习算法。在文本分类中应用Boosting算法经过试验证明是有效的,并且优于目前的大多数分类算法。  相似文献   

5.
针对工程安全管理中普遍存在的知识缺口问题,提出一套基于本体技术实现领域知识建模和更新的方法。以公路工程领域为范例,从行业标准规范的文本数据中自动提取安全知识,构建领域知识图谱;通过知识模型与建筑信息模型(BIM)的结合,开发安全管理应用场景,展示本体引导的知识图谱对工程安全管理的辅助作用。领域本体在知识图谱中作为本体层结构,表示为一个包含7个层级、 390个有效节点的多维度层状结构;基于本体层的引导开发知识提取算法,从海量文本中提取网状知识结构,形成知识图谱的数据层。知识模型的更新采用由数据层到本体层的知识流动方式;提出基于类属关系、构成关系和实体核心词聚类的3类方法,实现本体层的更新。将知识模型关联实际项目的BIM,从安全管理的应用层面出发,验证了本体的引入在知识的组织和扩展中起到良好效果,展现了知识模型与BIM的结合呈现出的智能化应用前景。该研究为领域知识图谱的构建、更新、应用全过程提供了一个完整的范例,对于本体更新过程实现了方法创新,拓展了知识图谱的应用领域和技术思路,有助于提升工程安全管理的信息化水平。  相似文献   

6.
方莹 《科技信息》2008,(18):49-50
关键字的上下文环境是自然语言处理的基础知识,其自动抽取是很多研究的基础和关键。本文主要研究了从百度搜索页面中提取出搜索关键字的文本信息,并将这些文本信息进行分词处理,最后基于去重算法将词语上下文去重的方法。算法的关键过程包括关键字的环境提取、文本分词和提取到的信息的入库三部分。  相似文献   

7.
针对俄文新闻文本的话题检测问题,以俄文文本的自动形态分析、命名实体识别作为辅助手段,设计了一种基于本体描述俄文新闻文本和话题信息并进行相似度计算的方法,随后使用Single-pass算法进行俄文文本的话题检测实验。通过对比基于向量空间模型和基于本体模型的俄文话题检测结果,证明了后者具有相对较高的准确性和有效性。  相似文献   

8.
为了标记海量Web信息的语义,实现计算机自理解和自动处理功能,提高信息查询准确率及效率,研究了信息的表达形式即本体,给出了本体的扩展定义及其快速识别的四个规则,通过模拟实验,验证了规则的实际应用效果及本体快速识别算法效率,本体识别速度和效率较普通的方法有一定的提高.  相似文献   

9.
本体广泛应用于语义网、自然语言处理、数字图书馆等领域,而自动构建本体是这些领域的难点之一.全自动的本体构建以及如何令机器自己不断学习并更新已有的本体知识的研究仍然缺乏.提出了一种基于认知算法的中文本体自动构建方法,建立了自动构建本体的概念和物理模型,并根据此模型实现了一个初步的自动构建本体的工具,在此基础上基于某些公理化算子来实现对已有本体的扩充、缩减、修正等操作,实验证明该模型和系统很大程度上降低了在构建本体过程中的人力投入.  相似文献   

10.
文本分类与文本信息特征概念的提取是当前智能信息服务研究的重点,为自动获取新的特征概念,提出了一种基于特征概念的自动提取系统,该系统包括分词、综合文本词权处理、类别归属和特征概念提取等部分,能有效地从概念上提取文本类特征,提高文本自动分类的准确性.  相似文献   

11.
提出建立本体的协作-挖掘方法,即领域专家、知识工程师、领域终端用户通过互联网,协作建立本体.利用网络爬虫从语义网搜索并收集RDF文档或片段,自动分析初步建立RDFDB.自动分析领域专家、领域终端用户使用半形式化语言RDFL书写的实例文档和它们使用引导程序输入的记录,完善RDFDB.检验清洗RDFDB数据,并设计本体挖掘算法挖掘产生初始领域本体.挖掘算法使用红黑树建立索引,最坏时间复杂度为O(n 3log 2n).验证、评估初始本体产生领域本体,并产生文档说明.建立新本体时,可合并RDFDB集成现有本体.在实验系统中,应用该方法建立计算机硬件信息领域本体.实验结果表明该方法是可行和高效的.  相似文献   

12.
目的在Web服务应用中,研究将多个服务组合成一个能完成复杂任务的组合服务技术。方法探讨一种基于领域本体的Web服务组合的消息处理方法,用它来处理信息并生成优化的服务组合图,在此基础上给出一个高效的服务组合算法。结果该算法综合考虑了服务的语义、服务组合的质量和服务组合的效率,能够自动地根据服务请求实现服务组合,方便灵活地实现消息处理,可以解决复杂的信息处理需求。结论基于领域本体的W eb服务组合的消息处理方法有较好的性能并且提高了处理消息的效率。  相似文献   

13.
随着计算机技术的发展,各个领域的信息层出不穷,使得文本分类显得十分重要。针对当前文本分类存在的不足,提出了基于本体的文本自动分类方法。该方法将文本自动分类技术与本体技术相结合,并提出只从提取每段首尾句中提取特征词的方法,提高了文本自动分类的效率。  相似文献   

14.
为了处理海量的异构信息,达到知识共享的目的,介绍和研究了半自动构建本体过程中涉及到的众多理论、技术和方法;介绍了构建本体的准则和方法;比较和分析了构建本体所需的几种常用的编辑工具;回顾了本体的半自动生成技术;介绍了本体的丰富技术,并对各种技术的不足之处做了分析.这些技术可以有效地帮助和指导用户半自动构建满足需求的领域本体.  相似文献   

15.
为了解决传统检索技术无法为用户提供个性化服务和检索效率低的问题,提出了一种基于领域本体的个性化文本信息检索模型,阐述了该模型的结构和关键算法,并验证了算法的可行性。实验结果表明:基于领域本体的个性化文本信息检索能有效提高信息检索的准确率和效率。  相似文献   

16.
基于本体的多Agent自动工艺系统   总被引:2,自引:0,他引:2  
为把本体理念应用于多Agent的CAPP自动工艺系统,提出了基于本体的多Agent自动CAPP系统模型,并构造了单个Agent的基本架构;建立了该领域的零件本体库和特征本体库,采用基于RDF(S)的OIL语言对系统中的各Agent零件特征知识的语法和语义进行详细的描述与注释,并利用一阶谓词逻辑对各Agent之间本体转换规则的语法和语义加以描述;最后通过实例验证了本体的功能和转换规则的智能推理机制,从而很好地满足多Agent自动工艺系统之间零件特征知识共享、复用和互操作的需求,同时对其它领域知识信息的处理也有着很好的借鉴意义。  相似文献   

17.
正图像识别是计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术,实现了图像信息到文本信息的转换,是现代计算机技术发展中极为重要的一步。识别过程包括图像预处理、图像分割、特征提取和判断匹配,让计算机像人一样读懂图片的内容,有视频内容识别、光学字符识别(OCR)等细分领域,在图片自动归类整理、图像优化、字符识别、人脸识别及视频监控安防等领域都有着不少应用。传统的识别方法主要基于统计学,其主要依靠  相似文献   

18.
语义相关度计算是信息检索、文档分类和聚类、推荐系统、机器学习等诸多领域的关键技术之一。研究基于地学领域本体,综合考虑了本体层级信息量、本体拓扑结构等基础上,引入约束性本体,实现相关度计算算法。实验结果表明,加入约束性本体条件下实现的算法,相关度计算结果明显提高。  相似文献   

19.
文本自动生成旨在实现机器像人一样写作,减少语言工作人员的工作量,为读者传送实时、简洁的新闻报道.它可被运用在智能问答和对话、新闻的自动撰写、突发事件报道等应用中,且一直是学术界和工业界想突破的研究问题.本文将文本自动生成建模成关键词集合覆盖问题,提出了一种无监督的抽取式文本自动生成算法.该算法优化了自动文本的结构,不再是一段式文本.实验表明,该算法在大规模语料库上可取得不错效果,生成的文本覆盖信息更全面,与人工生成的文本意思更接近.  相似文献   

20.
文本自动分类系统是信息处理的重要研究方向,在文献检索、信息过滤和文本管理等领域中有着广泛的应用。介绍了一种基于模糊模式识别以及向量空间模型提取特征向量的中文文本分类器的设计与实现。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号