首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
综合考虑关键词、词向量及句法结构对句子相似度计算的影响,将平滑逆频率(smooth inverse frequency,SIF)与依存句法相结合以提高句子相似度计算的精准性。SIF的核心思想为利用加权和去除非信息噪音得到的句向量来计算句子相似度。借助哈尔滨工业大学的语言技术平台,将句子的结构信息添加到句子相似度计算中,通过句子中"词语依存关系"三元组的相似性来度量句子间的相似度。实验结果表明,基于SIF和依存句法的句子相似度计算方法所得的反映准确率和召回率平衡度的指标为84. 4%,与同类的句子相似度计算方法相比,能更为有效衡量句子间的相似程度。  相似文献   

2.
现有的句子相似度计算方法仅考虑句子的依存关系或者组成句子的词性、词序、词义等信息,没有考虑到整个句子的语义信息,文章提出了一种基于语义扩展的句子相似度计算方法,解决了句子相似度计算时忽略句子语义的问题。利用搜索引擎对句子语义扩展,从而将简短的句子转化为长文本,然后使用主题模型对长文本进行特征提取,即将句子的相似度计算转化为求两个句子的语义间的差别运算。实验结果表明,基于语义扩展的句子相似度计算准确率能达到87%,而且计算结果符合常识判断。  相似文献   

3.
目的针对当前常用的汉语句子相似度计算方法存在的问题,结合语言习得特点,提出了一种基于动态特征词的中文句子相似度计算方法。方法首先以特征词作为语块切分边界,提取左右语块信息,采用语义向量空间模型;然后计算2个句子对应的左右组块的相似度;最终将各组块的相似度量值加权求和作为2个句子的相似度。结果实验表明,提出的方法计算结果较为理想,与人工判断的相似度较为一致。结论基于动态特征词的中文句子相似度计算方法在常用句式中具有更好的效果。  相似文献   

4.
目的针对当前常用的汉语句子相似度计算方法存在的问题,结合语言习得特点,提出了一种基于动态特征词的中文句子相似度计算方法。方法首先以特征词作为语块切分边界,提取左右语块信息,采用语义向量空间模型;然后计算2个句子对应的左右组块的相似度;最终将各组块的相似度量值加权求和作为2个句子的相似度。结果实验表明,提出的方法计算结果较为理想,与人工判断的相似度较为一致。结论基于动态特征词的中文句子相似度计算方法在常用句式中具有更好的效果。  相似文献   

5.
为了提高产品评论语句相似度计算的准确率,提出了一种新的基于多特征融合的相似度计算模型。在构建相似度计算模型时,抽取句子的名词、动词和形容词作为关键词构成句子的向量表示,并将关键词的频次信息及其修饰成分信息、句子的主谓结构和动宾结构等特征信息都纳入到向量模型当中,通过各特征要素的重要度来表征这些信息在句子相似度计算中的重要程度。实验结果表明,该计算模型提升了产品评论语句相似度计算的准确率,对提升产品评论语句的聚类分析能力具有重要意义。  相似文献   

6.
目的针对常用的向量空间模型忽视了文本中的词序和结构信息,影响文本相似度计算的准确度的缺点,提出新的文本案例相似度计算方法。方法将文本表示粒度由词提高到句子,加入词序信息。结果提出了句子向量空间模型及基于该模型的文本案例相似度计算方法。结论这种方法更符合人类理解的模式,提高了文本案例相似度计算的准确度。  相似文献   

7.
为了解决现有句子相似度算法未考虑句子语义信息的问题,提出了一种基于词法、句法和语义的句子相似度计算方法.将句子相似度分为词法层、句法层、语义层3个层次.在词法层,通过构建句子的词汇相似度矩阵和数字序列相似度矩阵来计算词法相似度;在句法层,使用概念词汇转化成的RDF三元组相似度来计算句法相似度;在语义层,基于本体树状结构中最短路径表示的语义距离来计算语义相似度.然后,提出句子语义相似度计算模型,采集图书领域句子对作为测试集,构建图书领域本体作为知识源.实验结果表明,所提方法具有更高的准确率和召回率,其F-度量值达0.649 9,与余弦相似度算法、基于编辑距离的算法和基于TF-IDF的算法相比分别提高约12%、17%和16%.  相似文献   

8.
提出了改进的文本相似度计算方法,在计算文本的相似度时,赋予不同文本块中的句子不同的权值,同时直接去掉短句子和合并高相似度的句子以精简句子包中句子数量以提高运算速度.改进后的文本相似度计算方法为:先根据句子相似度的计算方法计算句子的相似度,再计算文本块的相似度,最后按照文本块的权值计算整个文本的相似度.经试验证明,改进后的算法在文本召回率、准确率和F1值上都有明显的提高.  相似文献   

9.
句子特征提取与相似度计算是自然语言处理中的重要问题.目前汉语句子相似度计算方法不能全面考虑句子语义,因而导致相似度计算结果不够准确.提出了基于深层稀疏自动编码器的句子语义特征提取及相似度计算算法.首先将句子表示为高维、稀疏向量,进一步利用深度无监督学习句子非线性特征,即将高维、稀疏向量变换到低维、本质特征空间,此过程是一种更为纯粹的端到端的学习,避免了建立停用词表、分词等工作,最终得到可直接用于句子相似度计算的低维特征表示.实验结果表明,提取到的句子特征应用于句子相似度计算,与基于关系向量模型的句子相似度计算方法相比,提高了相似度计算准确率,计算的时间复杂度仅为O(n).  相似文献   

10.
句子相似度计算是智能答疑等应用领域的关键技术之一,当前相似度计算方法大都对语义因素考虑不全,使得计算的结果准确度差,为此提出了一种混合型句子语义相似度计算方法。首先,通过语义资源得到词间语义相似度;其次,以词之间的相似度为基础,结合词的权重和句型的相似度得到了混合的句子间的语义相似度,避免了单一角度度量相似度带来的偏差;最后,通过对比实验验证了本文提出的混合型计算方法相对传统方法获得了更好的测试结果。  相似文献   

11.
李仁  段隆振  周青  李光辉 《江西科学》2008,26(2):295-299
在分析关联规则挖掘Apriori算法时,从信息粒的角度出发,根据二进帝j粒计算的表示方法和Apriori算法中的相似性及交互性,提出了一种用二进制粒计算采表示的Apd槲改进算法,即使用二进制粒计算求出频繁项目集。方法不仅简洁、方便、逻辑性强,而且更适合于计算机运算。  相似文献   

12.
针对常规云计算资源预测算法不能在异常网络环境下做到精准预测的难题,提出一种基于改进蚁群算法的调度策略.该策略融入了信息数的概念,既能快速均衡负载,又能保障用户在多条件下云计算的需要,合理降低能耗,提高云计算性能.实验结果表明,基于改进的蚁群调度算法提高了云计算资源利用率,降低了能量消耗,使单节点处理任务量有较大提升,极大提高了云计算的性能和服务质量.  相似文献   

13.
一种改进的微种群遗传算法   总被引:4,自引:2,他引:2  
 采用种群隔离机制、算术交叉、杰出者保留策略等对微种群遗传算法进行了改进。减少了重启动次数,增强了两次重启动之间遗传优化过程的全局和局部搜索能力,使算法在尽可能保有模式识别信息的前提下进行智能搜索;采用了实数编码,减少了编码和解码过程中的计算开销;引入了自适应随机变异算子,使之在不增加循环次数的前提下,增加了利用现有种群已经获得的遗传信息进行有效搜索的次数;引入了异种机制,有效提高了微种群遗传算法收敛于全局最优解的概率,加快了收敛速度。最后,标准测试函数的测试结果证明了这一改进的微种群遗传算法能够用远低于标准遗传算法的计算代价获得更佳的优化效果。  相似文献   

14.
一个新的差别矩阵及其求核方法   总被引:2,自引:0,他引:2  
作者针对已有的利用差别矩阵来求粗糙集中核的方法存在的不足,将粗糙集的代数观与信息观结合起来研究,给出一个新的差别矩阵的定义和求核方法.  相似文献   

15.
在面向计算部署到数据节点端执行的分布式并行环境下,提出一种基于图着色理论的适用于矢量空间数据的部署方法,将空间数据粒度的部署问题转化为图顶点着色的过程,提高了任意空间区域的信息查询效率.给出基于图着色理论的数据部署方法,并通过节点的任务量进一步改进算法,使得该算法可实现海量空间数据粒度的离散化部署,提高了空间数据检索和查询的并行化程度,充分利用了并行计算资源.  相似文献   

16.
介绍了本体的相关知识和3种不同的领域本体语义相似度算法,针对这3种算法的视角和优缺点提出了改进的基于领域本体的语义相似度计算方法。该方法综合考虑语义距离、概念特征和信息量中多种语义相似度计算影响因素,较真实地反映了概念间的语义关系。  相似文献   

17.
为了提高分布式数据关联中的通信效率,该文对其信息传播方法提出改进。首先,将对领域各节点分别传送消息改为广播一个领域各节点共享的信度,改进了信息形式和传播方法,大大减少了通讯量。其次,引入对数运算,解决了数值计算中的稳定性问题。模拟仿真结果表明,该算法节省了能量资源,增加了网络使用寿命,可方便地实现网络规模的可标度化,与理论分析一致。  相似文献   

18.
一种可伸缩的粒计算知识获取方法   总被引:1,自引:1,他引:0  
粒计算是一种新的智能信息处理理论,它很大程度上模拟了人脑认识和解决问题的过程.通过对信息表分层粒化模型的研究,引入了粒分布链表的概念来生成粒子,并改进了一个粒计算算法.改进算法使用数据库技术对原始数据集进行粒化来生成粒分布链表,能够直接处理海量数据集,同时不影响原算法的有效性.通过试验测试了该方法的有效性及可伸缩性.  相似文献   

19.
将网格技术应用于药物分子对接中,能有效解决药物分子对接中所涉及的搜索空间巨大、时间耗费长、对计算环境要求高等问题.通过应用改进的遗传算法多种群竞争机制的对接演化模型GAsDock,以信息熵控制设计空间的收缩,增强了进化的目的性,显著地提高了对接效率.然后,利用线性、指数平滑和离散马尔可夫3种预测模型,并结合加权系数法,...  相似文献   

20.
当前虚拟资源存储算法针对规模较大的虚拟资源无法实现实时传输,且存储能耗高、负载均衡性较差。为此,提出一种新的基于云计算平台的虚拟资源可扩展存储算法,介绍了云计算平台,其由存储层、基础控制层、应用接口层和访问层构成,给出其系统架构。依据云计算平台,通过采集虚拟资源的高阶累积量信息特征,利用K-L特征压缩法实现虚拟资源的低负荷存储,针对该过程扩展性能低的弊端对其进行改进。通过自适应全域空间搜索找到最佳基函数,对云计算平台的存储空间进行重组,得到改进后的虚拟资源存储空间结构。实验结果表明,所提算法存储空间、时延和能耗均较低,负载均衡性强。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号