首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 359 毫秒
1.
现有的句子相似度计算方法仅考虑句子的依存关系或者组成句子的词性、词序、词义等信息,没有考虑到整个句子的语义信息,文章提出了一种基于语义扩展的句子相似度计算方法,解决了句子相似度计算时忽略句子语义的问题。利用搜索引擎对句子语义扩展,从而将简短的句子转化为长文本,然后使用主题模型对长文本进行特征提取,即将句子的相似度计算转化为求两个句子的语义间的差别运算。实验结果表明,基于语义扩展的句子相似度计算准确率能达到87%,而且计算结果符合常识判断。  相似文献   

2.
提出了一种基于不同语义单元度量的句子相似度计算方法.将句子按词块分割为对应的公共词块和非公共词块,利用外部语义资源进行同义词替换和语义消歧处理.分别用词、词块和字为语义单元度量句子相似度,以不同的权重调节各语义单元对句子相似度的贡献.实验结果表明,该方法综合考虑的因素更加全面,有较高的准确率.  相似文献   

3.
提出了一种基于不同语义单元度量的句子相似度计算方法.将句子按词块分割为对应的公共词块和非公共词块,利用外部语义资源进行同义词替换和语义消歧处理.分别用词、词块和字为语义单元度量句子相似度,以不同的权重调节各语义单元对句子相似度的贡献.实验结果表明,该方法综合考虑的因素更加全面,有较高的准确率.  相似文献   

4.
目前的抽取式单文档摘要方法未考虑原文中句子和原文语义信息相关度,针对该问题,提出一种基于语义空间的抽取式单文档摘要方法.首先,利用Word2Vec训练词向量以获取语义空间,并基于该语义空间表示句子和原文;然后,基于余弦相似度计算句子与原文相似度值,并使用TextRank和词频-逆文本频率指数(TF-IDF)模型计算原文中句子的权重;最后,将相似度值与权重相结合得到句子的最终权重值.实验结果表明,该模型摘要质量优于基于深度学习的基线系统.  相似文献   

5.
为了解决现有句子相似度算法未考虑句子语义信息的问题,提出了一种基于词法、句法和语义的句子相似度计算方法.将句子相似度分为词法层、句法层、语义层3个层次.在词法层,通过构建句子的词汇相似度矩阵和数字序列相似度矩阵来计算词法相似度;在句法层,使用概念词汇转化成的RDF三元组相似度来计算句法相似度;在语义层,基于本体树状结构中最短路径表示的语义距离来计算语义相似度.然后,提出句子语义相似度计算模型,采集图书领域句子对作为测试集,构建图书领域本体作为知识源.实验结果表明,所提方法具有更高的准确率和召回率,其F-度量值达0.649 9,与余弦相似度算法、基于编辑距离的算法和基于TF-IDF的算法相比分别提高约12%、17%和16%.  相似文献   

6.
句子特征提取与相似度计算是自然语言处理中的重要问题.目前汉语句子相似度计算方法不能全面考虑句子语义,因而导致相似度计算结果不够准确.提出了基于深层稀疏自动编码器的句子语义特征提取及相似度计算算法.首先将句子表示为高维、稀疏向量,进一步利用深度无监督学习句子非线性特征,即将高维、稀疏向量变换到低维、本质特征空间,此过程是一种更为纯粹的端到端的学习,避免了建立停用词表、分词等工作,最终得到可直接用于句子相似度计算的低维特征表示.实验结果表明,提取到的句子特征应用于句子相似度计算,与基于关系向量模型的句子相似度计算方法相比,提高了相似度计算准确率,计算的时间复杂度仅为O(n).  相似文献   

7.
综合考虑关键词、词向量及句法结构对句子相似度计算的影响,将平滑逆频率(smooth inverse frequency,SIF)与依存句法相结合以提高句子相似度计算的精准性。SIF的核心思想为利用加权和去除非信息噪音得到的句向量来计算句子相似度。借助哈尔滨工业大学的语言技术平台,将句子的结构信息添加到句子相似度计算中,通过句子中"词语依存关系"三元组的相似性来度量句子间的相似度。实验结果表明,基于SIF和依存句法的句子相似度计算方法所得的反映准确率和召回率平衡度的指标为84. 4%,与同类的句子相似度计算方法相比,能更为有效衡量句子间的相似程度。  相似文献   

8.
目的针对当前常用的汉语句子相似度计算方法存在的问题,结合语言习得特点,提出了一种基于动态特征词的中文句子相似度计算方法。方法首先以特征词作为语块切分边界,提取左右语块信息,采用语义向量空间模型;然后计算2个句子对应的左右组块的相似度;最终将各组块的相似度量值加权求和作为2个句子的相似度。结果实验表明,提出的方法计算结果较为理想,与人工判断的相似度较为一致。结论基于动态特征词的中文句子相似度计算方法在常用句式中具有更好的效果。  相似文献   

9.
目的针对当前常用的汉语句子相似度计算方法存在的问题,结合语言习得特点,提出了一种基于动态特征词的中文句子相似度计算方法。方法首先以特征词作为语块切分边界,提取左右语块信息,采用语义向量空间模型;然后计算2个句子对应的左右组块的相似度;最终将各组块的相似度量值加权求和作为2个句子的相似度。结果实验表明,提出的方法计算结果较为理想,与人工判断的相似度较为一致。结论基于动态特征词的中文句子相似度计算方法在常用句式中具有更好的效果。  相似文献   

10.
传统的TF-IDF算法主要依赖词频,往往忽略词语语义和一些具有重要意义的副词。针对这一问题,提出了一种基于语义分析的改进TF-IDF算法。该方法融入了词语语义来计算词频,改进了反义词语之间的相似度。实验结果表明,该方法在计算句子相似度中能根据语义方向对句中各词语词频进行统计,同时判断整个句子语义方向,与传统算法比较,语句相似度的准确性提高了5. 7%。  相似文献   

11.
通过跨文化的方法,对汉藏族大学生在字形相似性判断方面进行对比,结果发现:(1)藏族大学生对汉字对字形相似性判断平均评定等级数低于汉族大学生平均评定等级数;(2)在高频汉字对中,藏族男大学生对汉字对字形相似性判断平均评定等级数低于汉族及藏族女大学生平均评定等级数;(3)在低频汉字对中,藏族男大学生对汉字对字形相似性判断平均等级数低于汉族男大学生平均评定等级数,其他两两间差异不显著。  相似文献   

12.
提出一种结合LDA及语义相似度的商品评论情感分类方法。该方法首先使用LDA对商品语料库建模,获取文档-主题矩阵;人工选择k对褒义词、贬义词,基于HowNet语义相似度计算主题(评价对象+观点内容)与各个褒义词和贬义词的相似度,达到对观点词极性判断,计算文本观点词情感极性的加权和作为文本的情感极性。实验表明,与基于向量空间的SVM分类方法相比,该情感分类方法在分类指标上表现更好。  相似文献   

13.
属性相似度的准确性是影响实体分辨准确程度的重要因素之一.为提高属性相似度的准确性,分析了属性相似度与函数依赖的关系,给出了属性相似度调整原则,提出了依据函数依赖进行相似度划分、相似度传递调整和计算相似度调整代价的方法,提出了通过属性相似度调整提高属性相似度准确性的属性相似度传递调整算法.实验结果表明,该算法能够更好地区分匹配记录对和不匹配记录对,获得更高的查全率、查准率和F1值.  相似文献   

14.
针对个性化推荐系统中协同过滤算法面临的数据稀疏问题以及用户相似性度量的不准确,提出了一种结合类别信息的协同过滤推荐算法。该算法利用用户评分数据计算用户之间对类别关注的相似性,并将用户对类别关注的相似性和用户评分相似性进行组合,得到用户综合相似性,从而提高了最近邻居搜索的准确度,缓解了数据稀疏性问题。实验结果表明,该方法能够有效地避免传统相似性度量方法存在的问题,使得数据稀疏性对最终推荐结果的负面影响变小,在一定程度上提高系统的推荐精度。  相似文献   

15.
主观题阅卷系统在目前较受人们的关注。主观题评分原则常见的是对比试卷答案与参考答案的相似程度,进而得出分数。利用自然语言处理分词技术将文本切分为词的组合,然后通过改进语义相似度算法,计算句子相似度,进而得到试卷答案和参考答案的相似程度,给出分数。  相似文献   

16.
考虑到目前许多基于颜色直方图图像检索系统的搜索质量往往相当有限,提出一种融合分块小波直方图相似度检索和粒子群优化的新方法.该算法引入小波技术,提高了特征提取的有效性,采用分块技术扩展了图像检索性能,结合微粒群算法进行智能搜索加快了算法的执行速度.实验结果证实,该算法对图像数据库的相似度搜索是切实可行的,为大型图像数据库的智能图像检索问题提供解决方案.  相似文献   

17.
结合项目类别信息的协同过滤推荐算法   总被引:1,自引:0,他引:1  
针对个性化推荐系统中协同过滤算法面临的数据稀疏问题以及用户相似性度量的不准确,提出了一种结合类别信息的协同过滤推荐算法。该算法利用用户评分数据计算用户之间对类别关注的相似性,并将用户对类别关注的相似性和用户评分相似性进行组合,得到用户综合相似性,从而提高了最近邻居搜索的准确度,缓解了数据稀疏性问题。实验结果表明,该方法能够有效地避免传统相似性度量方法存在的问题,使得数据稀疏性对最终推荐结果的负面影响变小,在一定程度上提高系统的推荐精度。  相似文献   

18.
水驱油藏含水率及采出程度相似理论研究   总被引:2,自引:0,他引:2  
为使模拟实验结果更好地应用到油田,为油田开发方案提供理论指导,应用相似定数法导出了水驱油藏相似准则,经相似变换建立了采出程度和含水率相似准则。利用数值模拟方法对各相似准则进行了敏感性分析,利用相似理论函数论对敏感性较强的相似准则进行了研究。结果表明,水驱油藏采出程度及含水率同各相似准则之间满足乘积关系。根据此关系建立了水驱油藏含水率与采出程度的经验关系式。关系式中引入了相渗经验系数以消除模型与原型相渗差异。物理模拟实验与数值模拟结果的对比表明,所建立的经验关系式可以满足油田实际应用。  相似文献   

19.
为进一步提高文本相似度计算的准确性,提出基于句向量的文本相似函数(part of speech and order smooth inverse frequency, PO-SIF),从词性和词序方面优化了平滑反频率(smooth inverse frequency, SIF)计算方法,SIF算法的核心是通过加权和去除噪声得到句向量来计算句子相似度。在具体计算时,一方面通过增加词性消减因子调节SIF句向量计算权重参数,获得带有词性信息的句向量,另一方面通过将词序相似度与SIF句向量相似度算法进行线性加权优化句子相似度得分。实验结果表明,增加词性和词序的方法可以提升算法准确率。  相似文献   

20.
为了根据低分辨率(LR)人脸图像生成高分辨率(HR)图像以提高人脸识别率,设计了四个相似性约束函数,提出了基于相似性约束的面部幻象方法。首先利用LR-LR约束计算出输入的LR人脸图像与训练集中各LR人脸图像之间的相似性;然后利用LR-HR约束描述输入的LR人脸图像与HR训练图像之间的局部结构相似性,同时增强相邻幻象图像块之间的平滑约束;最后利用空间相似性约束减少远离幻象图像块的那些图像块的影响。在FERET、Yale及ORL三大通用人脸数据库上的实验结果表明,相比其它几种较为先进的面部幻想生成方法,所提方法得到的幻想图像分辨率更高,此外,所提方法得到了更高的识别率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号