首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
提出了一种针对网页结构树的相似度计算方法,首先把网页标签结构表示成树,然后通过动态规划算法,使两棵树在每一层上最相似的儿子节点继续进行比较,而那些没有找到匹配节点的儿子节点则产生距离,累加这些距离作为两棵树之间的距离,以此来衡量两个网页之间的相似程度。实验证明本方法可以正确区分同类网页和不同类网页。  相似文献   

2.
基于知网的领域概念抽取与关系分析研究   总被引:2,自引:0,他引:2  
针对目前领域概念抽取手工完成的现况,提出了一种基于知网的领域概念抽取和关系分析系统模型.本模型利用知网语义相关性从文本中生成领域语义词典,结合TFIDF算法建立"词-文本文档矩阵",用以代替传统的词形频率统计;通过产生领域语义本体,利用语义相似度对概念进行聚类.讨论了这3个步骤所涉及的算法,包括基于统计模式从文本中抽词,基于奇异值分解从词-文档矩阵中提取概念,基于语义相似度对概念进行聚类等.实验表明,本文提出的抽取方法相对与词频算法具有较高的准确度.  相似文献   

3.
针对在自然语言处理中起着关键作用的文本相似度计算问题,提出了一种神经网络深度学习的词向量模型计算方法.利用词向量计算文本语义相似度,并采用高频词滤波的方法削弱扰动的影响.对百度新闻、新浪新闻等的中文词库进行训练,并与传统的检测方法进行对比.实验结果证明了提出方法的有效性和准确性.  相似文献   

4.
在文本信息检索中,相似度是用以反映用户需求与数据库系统中文本内容的相近程度。相似度越大,表明文本越符合用户的需要,相似度越小,表明文本越不符合用户的需要。本文以属性论中的一个模型——属性重心剖分模型(又称属性坐标系)为基础,探讨属性论在文本相似度计算中的应用。  相似文献   

5.
6.
因为受到诸多物理因子的综合影响,台风运动轨迹变得极其复杂,运动轨迹和物理因子之间呈现高度非线性。因此,正确预测台风的未来轨迹对于风险评估具有极其重要的意义。本文通过建立一个基于路径相似度的模型来对台风路径进行预测。  相似文献   

7.
针对不完备信息系统下容差关系和集对α相似关系等模型的局限性.结合权值和联合概率的概念,建立了基于重要度相似关系的模型,这种模型更符合实际应用的需要.  相似文献   

8.
针对道路交通信息管理系统综合效果评价系统的不足,提出一种基于相似度的评价方法,方法中运用了模糊集综合评价原理,得出某一阶段系统效果指标与标准的相似度,试验说明方法是有效的.  相似文献   

9.
线状地物的化简是地图综合的重要组成部分,Douglas-Peucker算法作为一种经典的化简线状地物的算法,化简时需要进行多次实验才能选取到合适的阈值,得到最终化简结果。为了避免选取阈值繁琐的过程,通过计算不同阈值下化简前后线状地物间的空间相似度,并将绝对阈值转换为相对阈值,利用曲线拟合的方法得到相对阈值和空间相似度之间的关系。基于两者之间的关系,在使用Douglas-Peucker算法化简线状地物时,即可通过空间相似度来选取合适的化简阈值,提高了化简的效率。  相似文献   

10.
基于异或编辑距离算法的航班号相似度研究   总被引:1,自引:0,他引:1  
航班号是执行运输航空任务航空器的主用识别标志,但相似航班号会严重影响管制运行效率和航空安全.目前,相似航班号的判断主要依赖管制员的管制经验,对其尚无相关定量研究方法.该文在用于文本相似度定量比较的编辑距离算法基础上,提出了航班号相似度计算的异或编辑距离算法,并利用北京区域管制中心的实际运行数据验证了该算法的可行性.根据该方法计算了国内主要航空公司的平均相似度,相关结果可为航班号的分配提供定量参考.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号