首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
在《知网2002》的基础上,充分利用其层次结构,引入了马尔科夫模型来计算词汇语义相似度,实验证明,算法取得较理想的实验结果.  相似文献   

2.
在对常用的语句相似度计算进行研究的基础上,指出了这些方法存在的不足.为了满足实际应用的需要,基于语句的语义和组成句子的词语在句子中重要性程度,设计出了具有较高准确率的相似度计算方法,通过实验,证明了这种方法的有效性.  相似文献   

3.
针对在文本分类和信息检索中,由于句子之间的同义、近义引起的信息冗余、计算复杂等问题,给出句子语义相似度计算模型.从词和词组语义相似出发,对句子进行语法分析,结果表明,句子的语法与语义是不可分割的,不能完全孤立语法去研究语义,要综合考虑.  相似文献   

4.
通过对句子语义表示的深入分析,提出汉语句义的三维表示模型,并在此基础上提出一种基于句义三维表示模型的句子相似度计算方法.该方法从义面、义原、义境三个侧面来综合描述句子的语义,并通过迭代求解各方的权重,从而使计算结果达到最优.与传统的方法相比,更加全面、准确地衡量句子之间的相似度,取得了较好的实验结果.  相似文献   

5.
为了提高产品评论语句相似度计算的准确率,提出了一种新的基于多特征融合的相似度计算模型。在构建相似度计算模型时,抽取句子的名词、动词和形容词作为关键词构成句子的向量表示,并将关键词的频次信息及其修饰成分信息、句子的主谓结构和动宾结构等特征信息都纳入到向量模型当中,通过各特征要素的重要度来表征这些信息在句子相似度计算中的重要程度。实验结果表明,该计算模型提升了产品评论语句相似度计算的准确率,对提升产品评论语句的聚类分析能力具有重要意义。  相似文献   

6.
语句相似度计算是设计和实现智能答疑系统的关键技术.由于智能答疑系统一般面向受限领域的特点,在构建出其领域本体的基础上,利用本体语义树计算词汇相似度,从而计算出语句的语义相似度.最后,设计了一个实验模型验证了该语句相似度算法的有效性.  相似文献   

7.
目前,在基于HowNet进行语句语义相似度计算的算法中,没有考虑语句中的不同词语对语句之间相似度值的不同贡献程度,以致计算结果不理想.为了更好地解决上述缺陷,提出了一种频率增强语句语义相似度算法.该算法利用HowNet作为词典库,在同时考虑义原距离和义原深度的条件下,进行词语相似度计算;在此基础上算法进一步将词语在语料库中的频率函数作为权重值,引入至语句的语义相似度计算中,以降低高频率词语在语句相似度值中的比重.实验表明,改进的算法在语句相似度计算结果上与人们的主观判断更接近,结果更合理.  相似文献   

8.
基于统计特征的属性相似度计算模型   总被引:7,自引:0,他引:7  
利用统计方法挖掘案例库中案例属性的客观规律,在此基础上建立案例之间相似度计算模型.其实质是通过样本反应出来的属性的分布特征,将传统计算模型中案例属性数值上的距离与空间上几何距离的线性映射关系改进为非线性映射关系,并在此基础上通过传统的最近相邻检索算法计算出更客观的相似度.所提出的计算模型能够更客观地反映属性之间的相似程度,并提高案例检索算法的精度,同时进一步提高了案例推理系统的有效性.  相似文献   

9.
概念相似度研究,是知识表示以及信息检索领域中的一个重要内容.通过对传统相似度计算方法进行分析,提出了一种改进的概念相似度计算模型.该计算模型在计算相似度时不仅改进了语义距离、层次差、语义重合度的计算方法,还考虑了节点密度和有向边类型对相似度计算的影响.实验结果表明,该方法充分利用了本体层次树的结构特点来计算概念之间的相似度,全面地量化了本体概念节点间的语义相似度,提高了概念间相似度计算的准确性.  相似文献   

10.
建立字符串轨迹模型,利用双层结构进行建模,有效减少了表征轨迹时需要使用的字符总数。对LCS进行改进,使之适用于该模型,从而提高了计算轨迹间距离的精度。通过比较,改进的距离计算方法与多维向量组轨迹模型下距离计算方法的计算时间,作为衡量计算速率的标准。利用多维标度技术(MDS)将得到的距离矩阵映射到二维空间中,通过人工标识MIT停车场行人路径数据,计算类间、类内距离的均值和方差,衡量距离计算方法的精度。最后通过路径数据中的四类典型问题,验证本文设计的方法在解决实际问题中的能力。实验表明,改进LCS应用于双层字符串轨迹模型,在时间消耗上最优,精度最高,能很好的解决四类典型问题。  相似文献   

11.
相似性度量在大数据相关应用中具有重要的意义,然而传统余弦相似度遍历计算方法的准确性和时效性较差,具有较大局限性,无法为海量高维数据的质量评估提供有效依据。针对上述问题,利用余切三角函数和数据维度差值构造2种余切相似度公式,提高相似度计算的准确性;借助后向传播(BP)神经网络建立一个能够逼近数据集相似度映射关系的网络模型,降低相似度计算的时间复杂度。实验表明,改进的相似度快速计算方法具有良好的准确性和时效性,而且应用在大规模数据集时的性能提升更显著。  相似文献   

12.
基于向量的相似度计算方案   总被引:15,自引:0,他引:15  
在网络信息检索中,基于文档向量空间的分类、聚类、排序与相关性反馈需要计算相似度。本文就基于向量的相似度计算方案进行探讨,并论述了相似度在文档分类、聚类、排序与相关性反馈中的应用。  相似文献   

13.
基于深度学习的短文本语义相似度度量方法是现代自然语言处理任务的基石,其重要性不言而喻。本文提出一种基于卷积神经网络和双向门控循环单元的文本编码模型,通过卷积层提取重要语义并且通过双向门控循环单元保证语义顺序,采用孪生神经网络结构保证文本编码的一致性。选取传统的卷积神经网络和长短期记忆网络以及BERT模型进行对比验证,在Quora、Sick和MSRP数据集上的验证结果表明,本文模型的精确率和召回率表现优异,且F1值也优于传统模型。  相似文献   

14.
将粗糙集和粒计算理论应用于中文文章相似度计算研究中,通过引入文章相容粒、段落相容粒和段落粒空间信息表等概念构建相容粒计算模型,提出基于相容粒计算模型的中文文章相似度的计算算法。示例和测试结果说明所提出方法有效。  相似文献   

15.
基于事件的文本相似度计算   总被引:2,自引:0,他引:2  
大量研究成果已经表明,事件在很多文本中是客观存在的.从语义的角度理解,诸多文本是由事件组成的,事件是文本表示的最小语义单位.给出了基于事件的文本表示模型,在此模型的基础上,从文本类型相似度计算和文本内容相似度计算两个层面论述了文本相似度计算的方法.  相似文献   

16.
针对现有本体映射过程中相似度计算方法的精度及效率的不足,提出一种新的综合概念相似度算法模型,该算法分别对本体概念的名称、属性和实例相似度进行计算,过程中融合了信息增益和聚类集方法,并最终对三种相似度量结果加权综合。实验表明,算法得出的概念相似度计算结果在合理性和准确率上都有所提高。  相似文献   

17.
针对目前光伏发电预测中实用性较低、预测精度不高、气象条件利用不充分和预测跟踪性能较差等现象,设计出基于气象相似度与五状态马尔科夫链的光伏发电预测方法。该方法利用神经网络建立气象相似度—发电量相似度的过渡模型,用该模型预测可获得预测日发电量的预测结果,最后分别用三状态和五状态的马尔科夫链修正预测结果。实验结果表明:相比不充分利用气象条件的神经网络预测方法,基于气象相似度与五状态马尔科夫链的光伏发电预测方法具有较高的预测精度、实用性和良好的预测跟踪性能。  相似文献   

18.
基于贴近度的本体概念属性相似度计算   总被引:1,自引:0,他引:1  
本体映射是实现异构本体相互操作的有效方法,其关键技术在于概念相似度的计算。属性相似度是衡量两概念相似度的重要依据,而属性间的贴近度反映了概念间的属性相似度。通过改进原有的贴近度计算公式,得到新锅属性贴近度计算方法,从而改进了本体概念间的属性相似度计算模型。实验表明,该方法具有较高的效率。  相似文献   

19.
20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号