首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
Web网页知识获取技术   总被引:2,自引:0,他引:2  
描述一种基于类自然语言理解的Web文本知识自动获取技术. 用领域文法描述Web网页文本,将该领域文法转换成描述句子信息的、符合正则表达式规范的规则,使用该规则把Web网页文本转换为表示网页知识的语义三元组,最后形成领域知识库. 试验数据表明,通过本技术生成的领域知识库中不同类型网页数据的召回率平均值是71.5%,准确率平均值是79.1%.  相似文献   

2.
问题回答(Question Answering,简称QA)系统是当前检索等领域的研究热点之一,其目标是回答用户用自然语言提出的简单问题.文中给出了一个基于Web的中文QA原型系统--AskTheWeb的设计与实现机制.AskTheWeb利用搜索引擎获取相关网页,而后基于综合词频统计和概念的评分模型从这些网页中提取答案.文中给出的评测数据,验证了使用数据密集的思想实现基于Web的中文QA系统的可行性,而概念匹配技术对答案精度的提高有促进作用.  相似文献   

3.
基于语义的汉语文献主题词提取算法研究   总被引:10,自引:0,他引:10  
为了适应信息时代的迅速发展,提高从汉语文献中自动提取主题词的准确率,给出一种基于语义理解的汉语文献主题词自动提取算法模型.该模型以中文文本为处理对象,结合领域背景,构建概念语义网络作为分词词典和知识库,用概念之间的联系和匹配取代传统的字面匹配,克服了仅局限于表面形式的缺陷;把自然语言处理从目前基于关键词层面提高到基于知识的层面,从而在概念层次上理解文献主题,突破了传统的关键词匹配的局限,在一定程度上解决了词汇差异问题.该方法能对自然语言进行某种程度的语义理解,利用领域知识来实现主题词的规范标引.实验表明,采用本方法对测试文档进行主题词提取的准确率可达到71.03%,与传统方法相比提高了近1.87倍.  相似文献   

4.
传统方法采用数据挖掘的方式构建运维数据关联知识库,返回的关联信息并非用户想要的最终结果,不符合用户意图。为此,提出一种新的基于语义分析的运维数据关联知识库构建方法。给出运维数据关联知识库结构。采用文档主题生成模型LDA获取关键词,通过语义相似度求出知识案例与检索词间的相近程度,将和检索词相似度最高的结果作为检索结果。对运维知识项的各个属性赋予权值,依据构成元素的权值与知识库各个属性的匹配关系计算权值和,求出相似度。采用关键词权重量化法对检索结果进行处理。将构建知识库应用于动车系统中,结果表明,通过构建知识库可有效检索运维数据关联知识,为运维人员提供依据。  相似文献   

5.
网页搜索结果的多样化已经逐渐成为提高网页搜索效率和用户满意度的一个重要因素.文中将多样化问题形式化为信息面覆盖率的最大化问题,提出了一种基于关键词的网页搜索结果多样化方法KDM.该方法首先从与用户查询相关的结果文档中提取出可以描述结果文档所蕴含的信息面的关键词,然后根据关键词的同现性以及关键词对文档的描述能力,计算出结...  相似文献   

6.
传统方法采用数据挖掘的方式构建运维数据关联知识库,返回的关联信息并非用户想要的最终结果,不符合用户意图。为此,提出一种新的基于语义分析的运维数据关联知识库构建方法。给出运维数据关联知识库结构。采用文档主题生成模型LDA获取关键词,通过语义相似度求出知识案例与检索词间的相近程度,将和检索词相似度最高的结果作为检索结果。对运维知识项的各个属性赋予权值,依据构成元素的权值与知识库各个属性的匹配关系计算权值和,求出相似度。采用关键词权重量化法对检索结果进行处理。将构建知识库应用于动车系统中,结果表明,通过构建知识库可有效检索运维数据关联知识,为运维人员提供依据。  相似文献   

7.
提出一个新匹配的策略使用更加精确和现实的概念以提高过去的基于关键词的匹配策略.根据从各个网页中提取的自然语义概念为每个网页建立1个概念格子.这样概念格由双向联想记忆存储器进行编码以区别于过去复杂概念格建立算法.然后提取这些形式概念中与查询的关键词相关的对象与属性进行匹配操作.  相似文献   

8.
页没有提供关键词,人工标注关键词代价巨大,并且大多数已有的关键词自动提取算法都需要建立在人工标注的训练集之上,因而难以实用.由于关键词是文章中较重要且主题关联较凝聚的词的集合,因此提出一种基于密度聚类模式的中文新闻网页关键词提取方法,根据词语之间的共现信息,对网页分词后的词语进行聚类,在分析词语关联度的基础上提取出反映新闻主题的关键词.通过大量随机新闻网页实验结果表明,与单纯的TF/IDF(词频和文档频率倒数的乘积)方法相比,此算法召回率平均提高了7.15N,准确率平均提高了7.075%.  相似文献   

9.
针对甲骨文字形多变、异体字多等特点, 通过对甲骨字的构成分析, 提出一种基于语义构件的甲骨文字库自动生成方法。该方法以动态描述库为基础, 通过算法提取甲骨字的构件特征信息, 重组笔元生成语义构件, 再给语义构件加上特征描述生成构件知识库。通过仿射变换重复使用语义构件自动生成任意甲骨字。实验表明, 该方法能有效解决甲骨文无字库输入的实现, 还可以解决甲骨字编码、构件统计、未释字的考释等。  相似文献   

10.
为了解决传统算法学习规则有效性低、无法保证学习性能、匹配模板不全面、容易出现误识别现象的问题,提出一种改进的反向传播(back propagation,BP)神经网络算法研究多源头网络用户访问信息自适应识别问题。对多源头网络用户访问信息进行数据清洗处理,用多源头网络用户访问矩阵对全部会话集合进行描述;在矩阵中引入网络用户位置信息,将得到的信息保存至数据库,构成信息集。将一段时间内用户访问日志构成用户访问路径数据,依据访问请求抵达顺序,将其保存至相应用户缓冲区。把多源头网络用户访问路径当成隐马尔科夫模型的状态转移序列,将网页中信息集当成状态输出符号集,通过离散隐马尔科夫模型对不同源头网络用户访问信息进行分析,提取其特征。将多源头网络用户访问不同种类信息的概率特征作为输入,建立改进BP神经网络算法,得到的输出结果即为多源头网络用户访问信息自适应识别结果。结果表明:采用的BP神经网络算法学习性能优;所提算法识别准确性高。可见所提算法识别结果可靠。  相似文献   

11.
分子结构知识库是基于知识库的分子模型自动生成算法的关键部分。知识库中的知识单元为单个原子的几何构型数据,其中包含原子所处化学环境的信息。生成结构时通过在知识库中进行相似性搜索,确定所采用的知识项,用这种方法生成的分子模型质量已接近于国外的商品化软件。  相似文献   

12.
个性化Web推荐系统是利用用户的浏览行为定制符合用户结构和内容的过程。在综合应用协作过滤和内容过滤方法的基础上,通过对网站网页关键词的评估,提出了一种新的个性化Web推荐算法,研究了基于网页关键词的个性化模型,网站页面中关键词的权重计算,基于协作过滤的新用户推荐,基于内容过滤的再次推荐方法,以及基于用户群的用户兴趣调整方法。实验证明,本算法能够以较高的效率对用户进行网页推荐。  相似文献   

13.
模板化网页主题信息的提取方法   总被引:37,自引:0,他引:37  
为了消除网页噪音,有效地提取基于模板的网页主题信息,提出了一种新的信息提取方法.该方法采用机器自动学习方式生成网页集的模板;以网页链接关系中的锚点文本作为提取目标对模板进行标记,生成对应模板的提取规则;依据模板的提取规则对网页主题信息进行提取.对国内2 588个新闻网页进行了检测.实验结果表明,该方法可以快速、有效地提取模板生成的网页集主题信息,准确率达99.5%.将该方法应用于搜索引擎系统(木棉检索)中,与原来的检索系统相比较,索引文件的大小减少约50%,检索的速度和精确度也得到提高.  相似文献   

14.
通过反映教学资源本质特性的视角采用刻面技术对所要描述的资源进行精确地描述、表示、分类。一个刻面分类模式由一组描述资源本质特性(刻面术语)的刻面组成,从而构建出每个教学资源的描述树或查询匹配树。用户通过提供关键词(术语)形成查询条件,构成一棵刻面查询树,通过相应的匹配算法将描述树和匹配树进行比较,根据返回的i值的大小,找出近似匹配教学资源集有序地呈现给用户。  相似文献   

15.
复杂网络在新闻网页关键词提取中的应用   总被引:1,自引:0,他引:1  
通过分析新闻网页文档的特征,引入节点权重、有向网络加权聚类系数、中心介数等特征量,并结合传统关键词提取算法的一些优点及网页文档的部分特征,提出了一种改进的基于加权复杂网络的新闻网页关键词提取算法,并通过实验证实了该算法的正确性.  相似文献   

16.
语义相似计算驱动领域自动问答   总被引:3,自引:0,他引:3  
研究实体相似性的认知心理特征和受限领域自动问答(QA)系统的形式特点.基于结构对齐和几何相似模型,把词语概念描述分解为属性部分和语义角色部分,各部分结构分别对齐后,计算对齐义原的关系距离,加权组合计算词语的相似度.该方法也适用于解析成语义向量表示的疑问句的相似度计算.融合通用本体、领域本体和领域知识文本,构造了支持语义计算求解某一银行QA问题的知识库.实验表明,该方法可以提高领域QA系统的用户满意度.  相似文献   

17.
系统使用Visual Prolog语言,基于知识进行计算机辅助工艺设计。在系统中采用零件特征与加工特性相结合的方法描述零件;分层和分类收集存放知识,知识基与推理机分离,用户可以打开知识库根据要求修改知识;推理机制采用反向推理,进行合一算法自动生成工艺规程。  相似文献   

18.
设计了柑桔病虫害关键字提取算法,并构建了用户友好的界面系统,以便于农业专家上传与柑桔虫害相关的文本文件.系统从文本文件中提取关键字并与AGROVOC词典进行对比,生成柑桔病虫害本体库,农业专家可以通过专家知识库来补充新的病虫害信息.  相似文献   

19.
基于语义Web的网页推荐模型   总被引:4,自引:1,他引:4  
如何使用语义 Web技术构建网页推荐模型是一个有着广泛应用前景的研究课题。语义 Web下的网页用本体标注 ,该模型自动采集被标注网页上的语义信息 ,利用网页中的标注信息和相应的本体概念对网页进行分类 ,将分类结果存放在数据库中。同时 ,在这个模型下 ,用户的兴趣存放在DAML (DARPA agent markup language)格式的文件中。通过用户兴趣和网页类别的匹配 ,就能够给用户推荐需要的网页 ,在推荐网页时 ,该模型还采用支持向量机用于分类用户。实验结果显示了该模型比传统的网页推荐模型准确率更高  相似文献   

20.
基于改进ORB的图像特征点匹配   总被引:1,自引:1,他引:0  
鉴于ORB算法在特征点匹配时基本不具备尺度不变性,结合SIFT算法思想,提出了改进的ORB算法:SIRB(ORB and SIFT)。首先生成图像的多尺度空间,并在多尺度空间里检测稳定的极值点,使得提取出的特征点具有尺度不变信息;然后使用ORB描述子对特征点进行描述,生成旋转不变性的二进制描述子;最后通过Hamming距离完成对特征点的匹配。实验结果表明,SIRB有效地解决了ORB不具备尺度不变性的缺陷,在图像尺度发生变化时,SIRB算法特征点匹配的平均准确度达到约93.3%,相比于ORB提高了约70.7%;同时SIRB和ORB两种算法的匹配速度大致相当,SIRB保留了原ORB算法的快速优越性,平均匹配速度比SIFT快约63.2倍;将提出的SIRB算法应用到视频目标跟踪系统中,取得了良好的实验效果,具有一定的应用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号