首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于语义分析的微博搜索   总被引:1,自引:0,他引:1  
提出构建基于语义分析的微博搜索以帮助用户从海量的、书写通常不规范的微博中有效地获取信息。和现有的微博搜索引擎不同,基于语义分析的微博搜索利用一系列的自然语言处理和文本挖掘模块从微博中获取各类兴趣点,例如命名实体、事件、情感等。这些兴趣点进一步被索引,以支持分类浏览和高级搜索。本文讨论了微博语义搜索所面临的挑战及对策,介绍了一种参考实现框架及相关的语义分析技术,特别是面向微博的语义角色标注技术。  相似文献   

2.
提出构建基于语义分析的微博搜索以帮助用户从海量的、书写通常不规范的微博中有效地获取信息。和现有的微博搜索引擎不同,基于语义分析的微博搜索利用一系列的自然语言处理和文本挖掘模块从微博中获取各类兴趣点,例如命名实体、事件、情感等。这些兴趣点进一步被索引,以支持分类浏览和高级搜索。本文讨论了微博语义搜索所面临的挑战及对策,介绍了一种参考实现框架及相关的语义分析技术,特别是面向微博的语义角色标注技术。  相似文献   

3.
面向语义搜索的推荐模型研究   总被引:2,自引:1,他引:1  
随着Web信息量的不断增多,人们不得不花费大量时间去搜索、浏览和选择自己需要的信息,改善和提升搜索引擎信息检索的能力已经越来越迫切.提出基于专家用户搜索历史的信息推荐模型,并重点介绍普通用户和专家用户Profile以及基于此的2个计算模型.在此基础上结合Nutch搜索引擎平台,开发面向语义搜索的推荐系统,实际使用证明推荐效果良好.  相似文献   

4.
专利在先搜索是专利检索的一种重要方法,在实际实施时,需从全文查询词中提取关键词来进行搜索。本文尝试研究用于查询词中关键词的提取的7种方法对专利搜索的功效。首先介绍了单频词去除、TF方法、TFIDF方法、BM25方法、基于语言模型的方法、基于相关反馈的方法以及基于IPC分类等7种关键词提取方法,然后开展了在两个不同CLEF-IP数据集上的大规模实验验证和评测工作,详细比较分析了这些方法及使用专利全文作为查询词在专利搜索中的不同性能和效率。实验结果表明,在信息检索中能取得不错结果的方法未必在专利搜索中取得同样的效果。论文亦发现一般选取65-95个关键词可以取得不错的结果。从准确率上来说,TFIDF方法性能最高,而基于IPC分类的方法可以提高召回率。  相似文献   

5.
基于HowNet构造语义场的方法   总被引:2,自引:0,他引:2  
为了能尽量消除传统语义场研究中的主观随意性,提出一种基于HowNet构造语义场的新方法,并充分利用语义场的空间特性,将词语相似度计算引入语义场用于划分语义场结构.计算实例表明 提出的构造语义场、划分语义场结构的方法,有利于计算机自动获得语义场,具有客观性和可计算性的特点,有效排除了以往构造语义场的主观随意性,可应用到各种基于语义的文本处理方法中.  相似文献   

6.
7.
基于有组织的P2P网络,给出了一个将语义和Chord算法融合的搜索算法,以解决搜索信息的表达能力和负载平衡问题.算法的基本思想是将一个引入超级节点和域组概念的有组织P2P结构作为基于语义的P2P网络的拓扑结构,利用超级节点和相似度思想,使含有相似主题的结点尽可能链接在同一个超级节点上,并利用关键字和语义的二次比较来进行查询定位,实现了在搜索效率和准确性上的相互协调.最后在现有Edutella架构基础上,分别对有组织语义P2P网络和Chord算法进行扩展,构建搜索算法的实验环境.实验表明,该方法提高了P2P系统的搜索成功率和搜索效率.  相似文献   

8.
基于领域本体的信息搜索模型   总被引:3,自引:0,他引:3  
针对目前的搜索模型局限于语法层次上关键词匹配的特点,以领域本体作为知识组织方式,提出了一种语义环境下基于本体的信息搜索模型.在此模型的基础上,分别提出了文档语义标注算法和搜索词语义扩展算法,两种算法分别对文档集语义分析和搜索词语义关系理解,实现双向语义信息搜索的目的.实验结果表明,提出的信息搜索方法能够克服关键词匹配搜索的不足,获得较好的搜索效果  相似文献   

9.
通过梳理知识图谱行业发展脉络,可以得出知识图谱技术概况、分布特征以及目前知识图谱行业的市场需求和研究方向.在文献调查的基础上,运用HimmPat数据库对知识图谱技术专利文献从专利申请趋势、专利技术构成、专利申请地域分布、专利受理地域分布和专利申请人5个方面,进行描述性统计、比较分析和因果分析.结果表明,知识图谱技术正处于高速发展的成长期,其前沿核心技术尚未成熟,专利申请和受理以及全球重要申请人的分布主要表现为中美之间激烈的竞争.  相似文献   

10.
通过分析中文短文本的特征,提出了一种基于语法语义的短文本相似度算法.该算法结合中文语句语义的相似性以及语句语法的相似性,即计算具有相同句法结构的短文本的相似度以及考虑语句词组顺序对相似度的贡献,对中文短文本相似度进行计算.实验表明,本文提出的算法在中文短文本相似度计算结果上更加接近人们的主观判断并且拥有比较好的精确率与召回率.  相似文献   

11.
陈英芝 《科技信息》2009,(30):I0107-I0108
本文提出了一种新的中方自动文摘的方法,基于hownet提取出词语的语义代替传统的词形频率统计,建立语义向量空间模型,并且通过对抽取出的语句进行句子语义相似度的计算提高文摘精确度。  相似文献   

12.
提出了一种中文问句语义相似度计算的新方法.该方法分为两步:第一步采用基于问句句型模板规则匹配的方法提取问句语义表征;第二步根据问句语义表征计算问句语义相似度.采用该方法开发了一个面向常问问题集(FAQ)的问答系统.实验结果表明,采用该方法获得的相似度计算的准确率约为85%.  相似文献   

13.
14.
从专利文献的方面看,目前专利文献的数量很大,并且每年的增长速度也非常的快,全世界有很多家专利组织机构,其中也包括中国知识产权局对专利进行分区域、有侧重点的管理,专利数据信息中蕴含了丰富的科技信息、经济信息与法律信息,如果能对专利文献进行准确的分析与挖掘,能帮助我们把握和研究最新的领域趋势,较全面深层次的挖掘专利文献中的信息能更好地帮助我们决策。  相似文献   

15.
将查询结果根据内容进行聚类是提高搜索引擎服务质量的关键技术之一.搜索结果聚类时只能从文档标题和文档片段中抽取有限信息,传统聚类方法难以准确计算其相似度.提出了一种基于词间语义相关度的搜索结果聚类算法,该算法以词为聚类的核心,词所出现的文档为词的属性,根据词在搜索结果文档中共现的情况来划分类别.该方法可以充分利用词间的语义相关性,类别划分后即可确定类名.实验结果表明,对搜索结果聚类时与K-Means和STC算法相比,质量上有所提高.  相似文献   

16.
基于语义的中文句子的直接生成方法   总被引:1,自引:0,他引:1  
给出一种基于知识机器翻译系统的中文句子的生成方法.这种方法根据中文的特点,从语义的中间语言表达式直接生成中文短语或句子,因此省却了中间语言到句法结构的变换步骤,简化了生成过程.  相似文献   

17.
以专利文献为基础,结合特征传递共现对映射潜在语义空间的影响,提出了基于专利信息的潜在语义索引优化方法。该方法根据专利文献的分解细节信息,将单独的专利文献分解为多个子文档和伪文档,使同一类别文档内特征共现度升高、不同类文档间特征共现度降低,从而使对应的潜在语义空间更加合理。同时提取专利核心特征构建专利信息伪文档,增强合理共现信息的出现频率。实验结果证明,专利文本分类任务结合本方法时,可以有效地提高分类的准确性。  相似文献   

18.
提出了一种支持用户在网上的浏览活动的语义标注方法.该方法从语义上同类型的标注信息中提取特征,通过获取标注信息以建立用户意图模型,再利用概率判断识别用户意图;语义转换后得到的信息可以和其它的或被评估的用户意图进行比较;最后利用启发式函数量化具体用户意图和信息的相似度,以达到用户在浏览语义异构网络信息空间时获取相关信息的目的.  相似文献   

19.
在面向服务的应用中引入语义协商的思想,使服务Agent能够在Web服务部署、发布、发现和组合过程中共享服务知识.并且具有足够的自治和理解能力.通过描述抽象和具体的语义Web服务以及分析服务Agent之间的交互过程,提出了适合协商的服务Agent和服务知识模型,并给出了服务Agent之间信念知识修正和更新的方法,形式化描述了协商过程中服务Agent的角色和行为以及针对服务属性的语义协商协议.实验结果表明,在服务发现过程中使用这种服务知识模型及语义协商交互协议,能够显著改善服务Agent的理解能力.随着部署的具体服务数和协商的服务属性数增加,返回服务发现结果的时间有所延长,但其精确度有了明显的提高.  相似文献   

20.
为了支持e-维护知识资源的共享和集成,提出了基于语义的e-维护知识资源服务模型。采用形式化定义对模型进行规范化表示,通过用扩展的Web服务本体描述语言(Web Ontology Language for Service,OWL-S)进行语义建模的实现。基于模型构建的知识服务注册组件已成功应用于某e-维护知识管理系统。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号