首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 187 毫秒
1.
随着大数据时代的到来,互联网所承载的信息呈现出异构性强、价值密度低、来源分布广、实时性高等新的特点.因此在信息检索时,与获取相关网页相比,人们更希望获得页面中包含的知识.RDF作为一种新的知识表示和发布形式,以其精确且易于理解的语义结构得到了广泛的认可和应用.但传统基于语法匹配策略的SPARQL查询方法无法发现RDF数据中不同谓词间的隐含语义,不能从语义层面上获取更加完备的查询结果.针对这一问题,设计了一种新的查询方法来扩充传统SPARQL查询模式.首先分析RDF三元组中谓词的语义属性.在此基础上,根据不同谓词间语义属性的标注,对输入SPARQL语句中具有语义属性的谓词进行扩展,从而给出了一种新的一般化的查询策略.最后通过实验验证了这种语义扩展查询方法的可行性和正确性.  相似文献   

2.
针对Web网页中事物描述信息的特点,提出了一种通过本体指导网页信息抽取的方法。首先建立抽取对象的本体模型,并为本体属性概念添加定位信息映射模型,通过映射模型定位和分离样本页中包含语义信息的数据块,结合路径分析算法生成抽取规则,之后利用抽取规则对同类网页中的事物描述信息进行抽取,最后以资源描述框架(RDF)数据格式储存信息。抽取性能测试实验表明,抽取结果具有较高的准确率,与无规则抽取方法相比,具有更高的抽取效率。  相似文献   

3.
基于语义联系的新闻网页关键词抽取   总被引:1,自引:0,他引:1  
提出一种基于语义联系的新闻网页度,还考虑词语在具体上下文中的相关性,用词汇链将词语语义联系表示成图形式,在此基础上抽取出新闻网页关键词.对从网易网站选取120篇有核心提示的新闻网页进行测试,实验结果表明,所提出的方法比基于词频的关键词抽取方法和基于<知网>语义相似度构建词汇链的关键词抽取方法,在准确率和召回率上有很大的提高,当抽取关键词个数为3时,比基于词频方法的准确率和召回率分别提高了27.77%和21.38%.  相似文献   

4.
文章提出了一种基于随机游走模型,用于抽取散文体裁情感词语的方法。首先利用一般词典确定种子集词语,然后通过词语之间的共现关系确定词语间的相关性,再利用Word2Vec计算词语间的语义相似度,在此基础上构建随机游走图,用于确定候选词语的情绪标签。通过实验表明,随机游走模型方法在散文体裁的低频情感词语抽取和情绪标签确定上取得了较好的效果。  相似文献   

5.
一种反映词语相关度语义库的构建方法   总被引:1,自引:0,他引:1  
为了反映词语间的语义相关程度.提出了一种基于向量空间模型的构建语义库的新方法.在构建语义库时,对大量语料文本进行迭代式学习,在学习过程中引入淘汰算法,并综合考虑了诸如共同出现次数、平均出现距离、信息熵以及单字语义信息等多种对词语间语义关系产生影响的因素.实验证明,用该方法得到的相关语义库能够较好地反映现实世界中词语之间的相关程度.  相似文献   

6.
在网络舆情分析中,人们迫切需要自动化的工具在海量信息中抽取所需要的信息,以供进一步分析利用.针对此问题,提出了基于自动生成模板的Web信息抽取方法,可以消除网页噪声,快速有效地抽取所需的网页信息.该方法通过解析器将Web文档解析成文档对象模型,根据用户需求建立抽取规则,采用自动生成模板机制,并依据模板的抽取规则对网页信息进行抽取.实验证明,该抽取方法具有较高的召回率和准确率.  相似文献   

7.
陈玉娥 《科技信息》2012,(30):55+57-55,57
本文首先从网页文档中抽取出关键词建立用户模型,然后从语义的角度出发,基于"知网"进行词语相似度计算,进而判定搜索引擎返回的网页与用户模型的相似度从而达到过滤信息的目的。实验表明,系统比传统的利用向量空间模型进行信息过滤具有更好的精度。  相似文献   

8.
准确挖掘网页中的信息对检索系统非常重要.提出了一种基于模板的网页信息抽取方法进行网页信息抽取.该方法采用网页抓取与数据模板技术实现了网页信息的自动发现与抽取.在Yahoo网站上的实验结果表明,该方法具有较好的检索效果.  相似文献   

9.
一种基于加权语义相似度模型的自动问答系统   总被引:26,自引:0,他引:26  
在对比传统词频相似度模型的基础上,提出并实现了一种基于加权语义相似度模型的自动问答系统.首先,利用语义树中词语间的距离和语义树的高度来计算词语间的语义相似度,然后利用词语间的语义相似度和词语的权重进一步计算用户问题与答案库中问题间的语义相似度.基于此模型的自动问答系统能够接受用自然语言描述的问题,通过语义相似度的计算,自动地返回相关答案.实验表明,本文提出的基于语义树的加权语义相似度模型与传统的词频相似度模型相比,准确率有明显提高.  相似文献   

10.
基于语义相关度计算的汉语词义消歧方法研究   总被引:1,自引:0,他引:1  
词义消歧(WSD)一直是自然语言处理(NLP)研究的重点和难点之一.本文以语义资源-《知网》为基础,从语义角度出发,抽取《知网》中义原之间的多种复杂关系,结合词性、词语组合等信息,提出一种基于相关度计算的汉语词义消歧方法.实验结果表明,该方法对于处理汉语WSD是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号