首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 23 毫秒
1.
基于百度百科对词语相似度计算进行研究,结合TF-IDF算法和词条百度百科内容,提出一种基于改进TF-IDF的百度百科词语相似度计算方法。TF-IDF算法对文本中词语权重进行计算时,面临部分代表性较好的词语权重较低的问题,通过引进百科词条中词语分布的类别信息,包括词语在类内、类间分布对词语权重的影响改进词语权重计算,此外,根据词语在全集中出现的频率定义词语的代表性,通过计算百科词条中词语的权重因子,构建词条的相关向量,根据向量之间余弦值计算词语相似度。实验表明,相对于不使用TF-IDF方法计算权重和基于经典TF-IDF方法计算权重,结合类别信息的TF-IDF方法和定义代表性的TF-IDF方法提高了词语相似度计算的准确性。  相似文献   

2.
为了提高中文地名字段匹配的准确度,提出中文地名的相似重复检测与清洗策略和矩阵相似重复匹配方法. 该清洗策略采用矩阵相似重复匹配方法,通过矩阵运算计算中文地名数据之间相同字符或者词语出现的频率,利用频率计算两者之间的语义相似度和结构相似度,然后将语义和结构相似性有机结合,作为相似性判断和重复数据清洗的依据. 实验验证了该方法的可行性和有效性. 结果表明,该方法对于中文地名字段匹配在查准率和召回率方面优于已有的其他算法.  相似文献   

3.
提出了一种针对网页结构树的相似度计算方法,首先把网页标签结构表示成树,然后通过动态规划算法,使两棵树在每一层上最相似的儿子节点继续进行比较,而那些没有找到匹配节点的儿子节点则产生距离,累加这些距离作为两棵树之间的距离,以此来衡量两个网页之间的相似程度。实验证明本方法可以正确区分同类网页和不同类网页。  相似文献   

4.
针对在自然语言处理中起着关键作用的文本相似度计算问题,提出了一种神经网络深度学习的词向量模型计算方法.利用词向量计算文本语义相似度,并采用高频词滤波的方法削弱扰动的影响.对百度新闻、新浪新闻等的中文词库进行训练,并与传统的检测方法进行对比.实验结果证明了提出方法的有效性和准确性.  相似文献   

5.
基于异或编辑距离算法的航班号相似度研究   总被引:1,自引:0,他引:1  
航班号是执行运输航空任务航空器的主用识别标志,但相似航班号会严重影响管制运行效率和航空安全.目前,相似航班号的判断主要依赖管制员的管制经验,对其尚无相关定量研究方法.该文在用于文本相似度定量比较的编辑距离算法基础上,提出了航班号相似度计算的异或编辑距离算法,并利用北京区域管制中心的实际运行数据验证了该算法的可行性.根据该方法计算了国内主要航空公司的平均相似度,相关结果可为航班号的分配提供定量参考.  相似文献   

6.
在文本信息检索中,相似度是用以反映用户需求与数据库系统中文本内容的相近程度。相似度越大,表明文本越符合用户的需要,相似度越小,表明文本越不符合用户的需要。本文以属性论中的一个模型——属性重心剖分模型(又称属性坐标系)为基础,探讨属性论在文本相似度计算中的应用。  相似文献   

7.
概念相似度评估广泛应用于概念分类、概念聚合、概念合并等工作中.以往面向单本体概念相似度计算模型的工作虽然集中在概念特征匹配和语义分析之上,但考虑的要素单一或考虑要素的内容不全,所以计算结果精度不高,不利于概念关系的深层挖掘.该文完善概念的共性匹配,把概念间同时不具备的特征作为共性的一部分,并对概念格中不同层次的语义特征进行加权,从而提出一种具有高精度的面向单本体的概念相似度计算模型.实验数据表明该模型具有较高的精度.  相似文献   

8.
线状地物的化简是地图综合的重要组成部分,Douglas-Peucker算法作为一种经典的化简线状地物的算法,化简时需要进行多次实验才能选取到合适的阈值,得到最终化简结果.为了避免选取阈值繁琐的过程,通过计算不同阈值下化简前后线状地物间的空间相似度,并将绝对阈值转换为相对阈值,利用曲线拟合的方法得到相对阈值和空间相似度之间的关系.基于两者之间的关系,在使用Douglas-Peucker算法化简线状地物时,即可通过空间相似度来选取合适的化简阈值,提高了化简的效率.  相似文献   

9.
球体积的计算在微积分创立之前,是一个十分困难的问题,然而,在古代中国、印度和日本等地都先后导出了正确的球体积计算公式.对这些地区发现和证明球体积公式的方法、思想和途径进行比较分析,为深刻理解不同文明或地区的数学传统,揭示数学在不同地区之间的交流与传播的途径和线索提供参考.  相似文献   

10.
有侧移钢框架考虑剪切变形的计算长度系数   总被引:1,自引:1,他引:0  
通过建立有侧移半刚接钢框架计算模型,推导出了有侧移半刚接钢框架柱考虑剪切变形影响的稳定方程和计算长度系数μ值的计算公式.通过与刚性连接钢框架计算结果进行对比,得出考虑剪切变形对柱计算长度系数有显著影响,二者最大相差29.22%.2层柱计算长度系数增大幅度较之其他2层要大,说明考虑剪切变形影响最显著的是第2层.  相似文献   

11.
评分预测是推荐系统的重要环节,现在大部分的评分预测是利用用户的历史评分记录来推断该用户将给某个项目打多少分.该方法利用了用户历史评分记录,没有充分利用用户或者项目属性,平均绝对误差较大.针对以上问题,构造一种基于用户自画像的评分预测协同过滤推荐算法.该算法通过计算用户之间历史评分记录的相似度和用户自画像之间的相似度,然后计算出两种相似度的权重,把两种相似度乘以各自的权重进行组合.实验结果表明,构造的评分预测算法较好的减少预测评分和实际评分之间的平均绝对误差,提高了评分预测的准确性.  相似文献   

12.
随着Internet的迅速发展,人们面对信息爆炸的现实。因此,需要根据用户的查询意图进行推荐。基于此,提出一种计算查询词相似度的方法,利用K-means对查询词进行聚类并计算聚类簇中心,当用户输入查询词后计算该查询词与每个聚类簇中心的相似度并降序排列,选取相似度最大的两个聚类簇对其进行查询推荐。  相似文献   

13.
随着互联网的迅速发展,XML已经成为互联网中最常用的数据交换与存储语言,如何从大量的XML文档中提取有价值的信息是目前的研究热点之一.本文提出了一种基于SET/BAG模型的改进的相似度计算方法.该方法将XML文档的每个节点转换成一个对象(由对象名、父对象、属性集合以及该对象相对于其父对象的权重组成),能较完整地表达XML文档的结构信息,并且通过调整重复节点的权重来降低其在相似度计算中的影响.在真实数据集与人工数据集上分别进行实验,仿真实验结果表明,本文提出的基于SET/BAG模型下改进的相似度计算方法能得到很好的聚类结果.  相似文献   

14.
利用气相沉积的方法于铜基片表面可控生长形成氧化铜纳米阵列,通过控制反应温度及反应时间,得出不同生长密度、不同长度及不同直径的氧化铜纳米阵列,研究了该种方法所依据的实验条件对生长形成氧化铜纳米阵列的生长密度、平均长度以及平均直径的制约关系.结果表明:温度越高,则氧化铜纳米阵列生长越密且平均直径越小;反应时间越长,则氧化铜纳米阵列平均长度越大.在此基础上分析了该纳米阵列的生长机制,并最终确立实现不同规格铜基氧化铜纳米阵列可控合成的依据.作为对比,该氧化铜纳米阵列进行硫化处理后所形成的特殊云杉式分级结构相比于硫化铜片直接在铜的表面所生长形成的硫化亚铜阵列更有利于与电解液的接触,为其在电化学上的应用创造了可能.  相似文献   

15.
很多实际问题,如求结构振动的固有频率,动力系统稳定性的临界值等常常归结为计算对称矩阵的特征值,而首选的计算方法是先把该矩阵正交相似变换成一个对称三对角矩阵,再对这个对称三对角矩阵用带位移的QR(QL)方法.1968年J.H.Wilkinson给出对称三对角矩阵带位移的QR方法的第一个总体收敛定理,他证明了带Wilkinson位移的QR方法的总体收敛性,这是QR(QL)方法的理论基础,但他的证明太复杂.1978年W.Hoffman和B.N.Parlett又给出一个新证明,这是一个很精彩的证明,但也不是很简单.在此给出一简单而初等的证明,很适宜放在教材中.  相似文献   

16.
采用Xtimate C18(4.6 mm×250 mm,5μm)为色谱柱,乙腈-0.1%磷酸水溶液为流动相梯度洗脱,流速0.8 mL·min~(-1),检测波长226 nm,采用中药色谱指纹图谱相似度评价系统(2004 A版)计算相似度,建立香茅草指纹图谱共有模式,标定了13个共有峰,用指纹图谱相似度评价系统对样品进行模式辨识,12批样品指纹图谱与建立的对照指纹图谱之间的相似度均在0.9以上.因此,指纹图谱是一种有效的评价方法,可为香茅草的质量控制提供依据.  相似文献   

17.
结合图像的形状特征、纹理特征和颜色特征,提出一种面向制造过程的海量图像高效检索算法.算法利用傅立叶描述子法和二维形状分布法描述图像的形状特征,利用灰度共生矩阵描述图像的纹理特征,利用颜色直方图表达图像的颜色特征.在得到图像的形状特征、纹理特征和颜色特征后,分别采用欧式距离、马氏距离和夹角余弦距离计算这三种特征的相似度,最后对三种特征的相似度进行综合,得到图像的整体相似度,实现多特征的联合检索.仿真结果表明,本算法应用于不同类型和格式的海量数字图像,具有较高的检索精度和较快的检索速度.  相似文献   

18.
针对道路交通信息管理系统综合效果评价系统的不足,提出一种基于相似度的评价方法,方法中运用了模糊集综合评价原理,得出某一阶段系统效果指标与标准的相似度,试验说明方法是有效的.  相似文献   

19.
为探讨CFRP加固轴心受压混凝土方柱的承载力计算方法,将其受力截面分为强约束区和弱约束区,承栽力计算简化为2个阶段,并提出了计算公式及其适用条件;与试验结果对比,吻合较好.证明使用该方法对CFRP加固混凝土方柱的受力进行分析,简化了计算过程是合理有效的.  相似文献   

20.
对分块对角矩阵的行列式、可逆性及逆阵计算、乘法、伴随矩阵等性质进行了总结.给出了非零子块矩阵与分块对角矩阵特征值、特征向量、可相似对角化、可正交相似对角化等方面的若干性质,并给出了相应证明.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号