首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
基于动态特征词的中文句子相似度计算   总被引:2,自引:0,他引:2  
目的针对当前常用的汉语句子相似度计算方法存在的问题,结合语言习得特点,提出了一种基于动态特征词的中文句子相似度计算方法。方法首先以特征词作为语块切分边界,提取左右语块信息,采用语义向量空间模型;然后计算2个句子对应的左右组块的相似度;最终将各组块的相似度量值加权求和作为2个句子的相似度。结果实验表明,提出的方法计算结果较为理想,与人工判断的相似度较为一致。结论基于动态特征词的中文句子相似度计算方法在常用句式中具有更好的效果。  相似文献   

2.
王小芳 《科技信息》2009,(19):162-162
文章对句子相似度的定义、计算方法、应用领域等问题进行了简单的分析和总结。  相似文献   

3.
一种基于Tree-LSTM的句子相似度计算方法   总被引:2,自引:0,他引:2  
在浅层句法树和依存关系树的基础上, 提出两种结构化特征: 基于短语的浅层句法树NPST和基于短语的依存树NPDT, 并将它们与Tree-LSTM模型相结合, 进行句子相似度计算。实验表明, 使用结构化特征和Tree-LSTM会带来性能的提升。  相似文献   

4.
句子相似度计算是自然语言处理的一项基础任务,其准确性直接影响机器翻译、问题回答等下游任务的性能。传统机器学习方法主要依靠词形、词序及结构等浅层特征计算句子相似度,而深度学习方法能够融入深层语义特征,从而取得了更好效果。深度学习方法如卷积神经网络在提取文本特征时存在提取句子语义特征较浅、长距离依赖信息不足的缺点。因此设计了DCNN(dependency convolutional neural network)模型,该模型利用词语之间的依存关系来解决该不足。DCNN模型首先通过依存句法分析得到句子中词语之间的依存关系,而后根据与当前词存在一跳或者两跳关系的词语形成二元和三元的词语组合,再将这两部分信息作为原句信息的补充,输入到卷积神经网络中,以此来获取词语之间长距离依赖信息。实验结果表明,加入依存句法信息得到的长距离依赖能有效提升模型性能。在MSRP(microsoft research paraphrase corpus)数据集上,模型准确度和F1值分别为80.33%和85.91,在SICK(sentences involving compositional knowledge)数据集...  相似文献   

5.
基于句子相似度的自动文摘评价方法   总被引:1,自引:0,他引:1  
评价是自动文摘研究领域中非常重要的一个环节。针对目前自动文摘内部评价方法存在主观性强,无法体现深层语义的缺陷,提出了一种基于句子相似度的自动文摘评价方法。该方法是利用机器摘要和理想文摘中的句子相似度衡量文摘系统的性能,而不是单纯地利用词频或语句包含关系。实验表明,基于句子相似度的评价方法是一种更接近自然模型的评价方法。  相似文献   

6.
基于多层次句子相似度与向量空间模型的词义消歧   总被引:1,自引:0,他引:1  
介绍和对比了20世纪50年代以来出现的各种主要词义消歧的方法,论述了这些方法取得的成效和存在的局限,着重讨论了基于向量空间模型的消歧方法.在此基础上,通过分析和计算,提出了一种将多层次句子相似度计算应用于向量空间模型的新方法,从而提高机器翻译中的词义消歧的准确度.  相似文献   

7.
首先简单介绍了基于《知网》的词语相似度的计算,指出不足,并对其进行改进,在其计算过程中增加词语褒贬倾向因素.接着给出句子相似度计算步骤:①先分词;②采用匈牙利算法求解最优匹配词语;③用改进的方法计算词语相似度,进而求解句子相似度.最后给出实验结果.结果表明:在词语相似度的计算上考虑其褒贬倾向,将会使计算结果更加合理.  相似文献   

8.
句子相似度计算是智能答疑等应用领域的关键技术之一,当前相似度计算方法大都对语义因素考虑不全,使得计算的结果准确度差,为此提出了一种混合型句子语义相似度计算方法。首先,通过语义资源得到词间语义相似度;其次,以词之间的相似度为基础,结合词的权重和句型的相似度得到了混合的句子间的语义相似度,避免了单一角度度量相似度带来的偏差;最后,通过对比实验验证了本文提出的混合型计算方法相对传统方法获得了更好的测试结果。  相似文献   

9.
提出了一种基于多态融合的句子相似度计算方法,用该方法能得到学生答案与标准答案之间的最佳相似度值,从而可大大提高主观题阅卷的准确率。  相似文献   

10.
通过对句子语义表示的深入分析,提出汉语句义的三维表示模型,并在此基础上提出一种基于句义三维表示模型的句子相似度计算方法.该方法从义面、义原、义境三个侧面来综合描述句子的语义,并通过迭代求解各方的权重,从而使计算结果达到最优.与传统的方法相比,更加全面、准确地衡量句子之间的相似度,取得了较好的实验结果.  相似文献   

11.
在对常用的语句相似度计算进行研究的基础上,指出了这些方法存在的不足.为了满足实际应用的需要,基于语句的语义和组成句子的词语在句子中重要性程度,设计出了具有较高准确率的相似度计算方法,通过实验,证明了这种方法的有效性.  相似文献   

12.
基于相似理论的钢筋混凝土建筑结构振动模态   总被引:2,自引:0,他引:2  
以三层钢筋混凝土建筑结构为研究对象,将其简化为3自由度的弹簧-质量振动系统,用相似理论建立振动系统的实验模型,制作等效的建筑结构实验模型.用传递函数响应方法对实验模型进行动态响应实验研究,测得振动系统的固有频率和振型,掌握振动系统的动态特性,为钢筋混凝土建筑的结构设计和系统减振设计提供动力学的实验测试方法,尤其给安装在建筑物内机械设备的振动控制提供了设计依据.  相似文献   

13.
结合决策分析中的层次分析法,提出了一种基于模糊相似理论的地震易损性分析方法.该方法无须进行结构建模计算即可通过类比分析实现其地震性能评估,极大地提高了结构地震易损性分析的计算效率.以钢筋砼框架结构为例,选取影响结构抗震性能的主要参数,应用层次分析法得到各主要结构参数的权重系数,然后分析其属性函数的斜率值,最后计算两栋结构之间的模糊相似度,由此可通过类比分析实现目标结构的易损性评估.对三组钢筋砼单体结构进行了算例计算,并将其与有限元结果进行比较,验证了所提方法的准确性和可靠性.  相似文献   

14.
截割比能耗是衡量采煤机滚筒设计优劣的重要指标之一.为了改进和完善连续采煤机的滚筒设计,基于相似理论,采用矩阵转换法,推导出模型实验的相似准则,以显著影响比能耗的滚筒参数为参变量,用单因素实验法获取实验数据;采用回归分析法,获得影响比能耗的滚筒参数模型.实验表明:该模型能够较全面地反映滚筒结构参数和运动参数对比能耗的影响关系,为连续采煤机滚筒设计提供了理论依据.  相似文献   

15.
为了提高嵌入式通信网络传输数据的传输质量,提出基于数学图论分析的数据相似度权重调整算法.构建嵌入式通信网络传输数据的模糊信息检测模型,分析数据传输动态模糊特征,采用数学图论分析进行嵌入式通信网络传输数据相似度权重调整过程中的自适应寻优,实现嵌入式通信网络传输数据的优化相似度权重调整.结果表明,在迭代次数分别为100、2...  相似文献   

16.
文章提出一种基于PSO思想的改进量子遗传算法.将PSO中的合作机制和记忆功能引入到QGA中,构造种群个体与当前最优解的距离参量,根据每个个体与当前最优解距离大小智能地控制旋转角的大小,使旋转角能够根据个体的进化差异选择不同旋转角的自适应调整进化过程,从而使算法始终保持合适的搜索网格,加快算法收敛,同时也可以保证能够收敛...  相似文献   

17.
为提高信息检索中检索结果的查准率,提出了基于句法分析以及带权路径长度的句子相似度计算方法。该方法首先对用户问句进行了分词、词性标注以及句法分析处理,并根据处理后的结果对该句进行了关键词提取、加权和同义词近义词扩展处理。然后提出了基于带权路径长度计算的方法,并用该方法计算用户问句与检索信息标题句之间的相似度,即问句的带权路径长度与标题句的带权路径长度的相对比值,以此对检索结果进行二次排序,提高检索结果查准率。实验表明,该句子相似度方法能有效地提高信息检索中检索结果的查准率。  相似文献   

18.
提出一种基于句子相关度的文本自动分类模型(TCSC).该模型利用训练样本增量式地自动更新类别语料库,根据句子的位置权值和语料权值计算句子类别相关度,获得用于文本分类的句子相关度矩阵,通过该矩阵实现文档分类.该模型避免了分类阶段待分类文本特别是中文文本的分词,模糊了词的多义问题,且在文本分类的实验中能够达到86%以上的查全率和查准率;随着语料库的不断训练和调整,分类性能还可以进一步提高,具有简单实现的特点.  相似文献   

19.
在Torres-Vega和Frederick(T-F)量子相空问表象中研究了非简并态的微扰论,在一级修正的基础上,得到了能量本征值和本征波函数的二级、三级近似解.利用谐振子体系在相空间表象下的几率分布图与坐标和动量表象中的几率分布图的对比,显示在量子相空间中研究体系的微扰时,可以得到比坐标或动量表象中更多的信息.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号