首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
目的提高在股票资讯领域中关键词的匹配效率。方法提出了一种改进的正向最大匹配算法。该方法先通过真实的股票资讯数据构建匹配关键词词集,然后通过分析关键词集合获取词集的特征,最后利用哈希技术整理重构算法词库以提高算法的匹配效率。结果对比无优化词库、tire索引数优化词库和本文的方法,在获取的抽词结果质量相同的前提下,采用本文提出的词典优化方案所需的运行时间最少。并且随着股票资讯新闻的规模增大,本文方法的优势愈加明显。结论实验结果表明,本文提出的方案能够在保证匹配质量的情况下有效提高算法效率。  相似文献   

2.
由于本体中的个体能更好地描述其所属概念的真实语义,因此基于个体的本体匹配技术有助于提高本体匹配结果的准确性。针对现实的本体中缺乏双向标注的个体而导致的基于个体的本体匹配技术难以得到广泛的应用这一问题,本文提出了一种基于双向个体标注的本体匹配技术,该技术通过进化算法来实现本体间自动化个体双向标注和概念匹配的过程。实验采用OAEI 2012的测试数据集,结果表明本文提出的方法是有效的  相似文献   

3.
本文针对当前股票资讯服务中存在的实时性差、个性化缺乏和准确性不足等问题,设计并实现了一个基于资讯价值的股票资讯移动订阅系统。系统应用开源的Lucene和Weblech工具进行垂直搜索获取资讯,根据经济学知识构建个性化股票本体,通过查询扩展、本体匹配生成个性化的RSS种子,依据资讯价值进行排序,在移动端使用KXML进行解析,实现了资讯订阅。实验结果证明,本系统提供的股票资讯服务是有效的。  相似文献   

4.
本文在已建立的家电领域本体的基础上,提出一种面向家电领域的语义检索模型,该模型一改传统检索方法中机械式字符匹配的弊端,支持基于本体的语义理解.利用SVM分类器、自然语言处理、语义标注等技术,在对查询条件预处理以及资源语义标注的基础上,对标注资源库进行检索,提高了查准率和查全率。  相似文献   

5.
由于生物医学本体拥有规模庞大的概念和复杂概念间关系,已有本体匹配技术难以高效确定生物医学本体匹配结果。为解决这一问题,构建了生物医学本体匹配问题优化模型,提出基于进化算法的生物医学本体匹配技术来确定最优匹配结果。在求解生物医学本体匹配问题时,采用一种新的生物医学本体概念相似度度量来确保匹配结果质量,并通过基于推理的概念对剪枝技术缩小算法的搜索空间,提高算法效率。实验结果表明,基于进化算法的生物医学本体匹配技术能有效匹配生物医学本体。  相似文献   

6.
分析了目前搜索引擎研究的现状,利用语义Web和本体论的相关技术,实现了一个基于本体论的智能搜索引擎模型。主要研究了本体论的建立,网页本体标注,用户查询本体表达以及本体匹配等几个方面。通过对模型的原型设计运行和分析,结果表明通过本体论技术的支持该模型可以较好的理解采集到网页信息以及用户查询请求,从而提高了搜索引擎的自动化和智能化程度。  相似文献   

7.
为了提高专业领域内信息检索的查准率,使检索结果在语义层面能够重新进行排序以去除非相关条目,利用语义Web中的本体技术和本体标准描述语言OWL建立了证券领域本体,并且基于证券领域本体提出了面向专业领域的信息资源检索系统IRS—SA,该系统有助于机构或者个人投资者获得及时有效的证券信息.系统接受输入检索关键词从而利用查询转化器自动构造或扩展用户查询,将自然语言查询转化为系统内部的格式后,使检索获得的结果按照本体中定义的概念及关系进行语义再排序,并将最后所得结果返回给用户,提高了文档语义相关性程度.  相似文献   

8.
大数据时代,从海量的数据中发现对用户有用的知识成为研究领域重要的问题.通过集成多个搜索引擎的查询结果,实现食品安全领域中搜索信息的集成和个性化自适应排序.本文设计基于元搜索技术、知识本体和自适应的排序学习技术,实现多个搜索引擎相关查询结果集成,在对用户点击的标注和知识本体的基础上,利用基于监督学习的排序技术,实现对食品安全领域信息的个性化自适应排序.系统实现了集成多个搜索引擎的食品安全相关知识的提取和相关结果的重新排序.本研究不仅实现了多个搜索引擎食品安全信息查询相关的结果集成,而且能够根据用户的偏好实现结果的自适应排序.  相似文献   

9.
提出了一种基于Vague融合的自动图像标注方法,通过有效区域匹配方式,利用近邻语义信息来平衡正负样本数目,并且首次利用Vague集的真假隶属度融合图像的区域信息,从而获得更准确的标注结果.实验结果表明,该标注方法是可行的,同时,与传统的标注方法相比,标注结果得到了明显的提高.  相似文献   

10.
提出一个基于本体的语义检索方法,利用领域本体知识对各类资源进行语义标注.把用户查询转化为形式化的SPARQL检索描述,再把执行查询后的结果扩展到相关的标注资源.  相似文献   

11.
对当前的基于领域本体的语义标注方法进行了说明和分析,提出了基于领域本体概念划分的语义标注方法.该方法将领域本体中的概念分为特有概念和普通概念,先用一般的领域本体标注算法计算特征词的权值,再对普通概念特征词的权值进行调整,最后结合水稻领域进行试验.实验表明,该方法在保证查全率的基础上,提高了普通概念特征词的查准率.  相似文献   

12.
针对现实本体中缺乏双向标注的个体而导致的基于个体的本体匹配技术难以得到广泛应用这一问题,提出一种采用双向个体标注的本体匹配技术. 该技术通过进化算法实现本体间自动化个体双向标注和概念匹配的过程. 实验采用OAEI 2012的测试数据集,结果表明所提出的方法是有效的.  相似文献   

13.
基于语义Web的网页推荐模型   总被引:4,自引:1,他引:4  
如何使用语义 Web技术构建网页推荐模型是一个有着广泛应用前景的研究课题。语义 Web下的网页用本体标注 ,该模型自动采集被标注网页上的语义信息 ,利用网页中的标注信息和相应的本体概念对网页进行分类 ,将分类结果存放在数据库中。同时 ,在这个模型下 ,用户的兴趣存放在DAML (DARPA agent markup language)格式的文件中。通过用户兴趣和网页类别的匹配 ,就能够给用户推荐需要的网页 ,在推荐网页时 ,该模型还采用支持向量机用于分类用户。实验结果显示了该模型比传统的网页推荐模型准确率更高  相似文献   

14.
基于本体的英汉翻译记忆系统的研究   总被引:1,自引:0,他引:1  
在翻译记忆系统中,句子的语义理解是提高相似句子的匹配率的关键.提出了一种基于本体的英汉翻译记忆系统模型,以计算机文献领域的专业术语为范围构建了一个知识本体CSO,并引入本体的概念相似度进行模糊词对的相似度计算.实验证明,本体的语义信息能提高系统的匹配率.  相似文献   

15.
基于本体的语义标注工具使用已有本体在Web页面中插入语义元数据信息,从而使Web页的内容机器可识别,是将现有Web提升为语义Web的有效方法之一.大多数标注工具仅支持使用已存在的本体词汇来标注Web页,不具备标注过程中新建本体或在已有本体中添加新词汇从而补充标注词汇的本体编辑功能.针对语义标注中的本体编辑功能的特点及存在问题进行研究,并从实现的角度对OWL本体编辑进行讨论.  相似文献   

16.
毛平 《科技资讯》2009,(36):183-183
本文在构建军用飞机领域本体的基础上,尝试基于领域本体的文本信息语义检索研究。重点探讨了基于领域本体的文本信息标注以及查询扩展方法以及知识片段的提取思想,实现了基于语义的文本信息资源的检索功能。  相似文献   

17.
为了准确地获取和复用军事电子信息系统需求,提出了基于领域知识复用的需求建模方法.介绍了利用领域知识进行需求建模的过程,利用目标模型表达用户需求,并通过复用领域知识建立目标模型;通过目标查询匹配和复用获取目标相关需求,建立应用本体;利用顶层本体概念与MEISRDL业务框架的映射关系,根据应用本体生成需求模型.实例表明,通过复用领域知识,不仅保证了需求模型的质量,而且提高了需求建模的效率.  相似文献   

18.
互联网开源渠道蕴含大量国防科技信息资源,是获取高价值军事情报的重要数据来源。国防科技领域开放信息抽取(open information extraction, OpenIE)旨在从海量信息资源中进行主谓宾-宾补(SAO-C)结构元组抽取,其对于国防科技领域本体归纳、知识图谱构建等具有重要意义。然而,相比其他领域的信息抽取,国防科技领域开放信息抽取面临元组重叠嵌套、实体跨度长且难识别、领域标注数据缺乏等问题。本文提出一种国防科技领域两阶段开放信息抽取方法,首先利用基于预训练语言模型的序列标注算法抽取谓语,然后引入多头注意力机制来学习预测要素边界。结合领域专家知识,利用基于实体边界的标注策略构建了国防科技领域标注数据集,并在该数据集上进行了实验,结果显示该方法的F1值在两阶段上比长短期记忆结合条件随机场(LSTM+CRF)方法分别提高了3.92%和16.67百分点。  相似文献   

19.
在分析查找互联网股票信息存在问题的基础上,给出了一个基于语义Web的股票信息表示模型.首先利用语义Web定义股票本体,给出了相应的RDF模式描述,对本体进行评估.其次,通过分析用户股票信息需求,利用构建的股票本体,给出基于语义Web的模型的体系结构,建立了一个能根据用户请求提供所需要的股票信息的股票信息表示模型;最后通过实例验证了该模型的有效性.  相似文献   

20.
针对现有网络舆情分析系统缺乏语义信息,可能导致分析结果不精确的问题,研究了本体技术在构建网络舆情分析系统中的应用,提出基于本体的网络舆情分析系统结构,并对系统实现中采用的本体技术包括网络舆情本体库的构建、网络文本语义标注、基于语义相似度的敏感话题发现和构建查询词的概念空间等进行了研究。通过本体建立舆情分析概念的共享空间,可以有效地挖掘网络内容的语义信息,提高舆情分析的准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号