首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 478 毫秒
1.
针对日汉机器翻译问题,提出一种新的独立于具体机器翻译算法的两层翻译架构。第一层优先利用信息检索和双语语料实现翻译记忆;第二层充分利用日语的自然形态特性,在句法匹配和词汇记忆基础上支撑高级翻译。该架构的效力依赖于大规模日汉语料资源和高效的句法匹配算法。网络语言大数据爆发在一定程度上缓解了日汉语料资源的匮乏,而平假名符号子系统表示的句法框架显式标记可以支持高效句法匹配算法的实现。实验结果表明把日语自然形态特性融入日汉机器翻译,能够创新翻译架构、扩充语料规模、降低训练开销。  相似文献   

2.
一个新的基于细节特征的指纹匹配方法   总被引:3,自引:1,他引:2  
自动指纹识别系统(automaticfingerprintidentificationsystems,AFIS)的精度和效率主要依赖于指纹的匹配算法.指纹匹配涉及的两个关键问题是指纹的对齐和匹配方式.根据同一个指纹的不同采样,其脊线形状保持高度的相似性的特点,利用两条脊线对应点的距离构造了一个判据,用来评价两条脊线形状的相似性,以实现指纹的最优对齐;针对传统指纹匹配算法中伪细节点的混入和真实细节点的遗漏影响指纹匹配精度的问题,提出了一种基于编辑距离原理的指纹细节特征匹配方法,对指纹库Fingdb和FingerDUT进行了测试,等错误率分别为0.62%和2.75%,证明该方法具有较高的可靠性和有效性.  相似文献   

3.
综合考虑关键词、词向量及句法结构对句子相似度计算的影响,将平滑逆频率(smooth inverse frequency,SIF)与依存句法相结合以提高句子相似度计算的精准性。SIF的核心思想为利用加权和去除非信息噪音得到的句向量来计算句子相似度。借助哈尔滨工业大学的语言技术平台,将句子的结构信息添加到句子相似度计算中,通过句子中"词语依存关系"三元组的相似性来度量句子间的相似度。实验结果表明,基于SIF和依存句法的句子相似度计算方法所得的反映准确率和召回率平衡度的指标为84. 4%,与同类的句子相似度计算方法相比,能更为有效衡量句子间的相似程度。  相似文献   

4.
为了解决现有句子相似度算法未考虑句子语义信息的问题,提出了一种基于词法、句法和语义的句子相似度计算方法.将句子相似度分为词法层、句法层、语义层3个层次.在词法层,通过构建句子的词汇相似度矩阵和数字序列相似度矩阵来计算词法相似度;在句法层,使用概念词汇转化成的RDF三元组相似度来计算句法相似度;在语义层,基于本体树状结构中最短路径表示的语义距离来计算语义相似度.然后,提出句子语义相似度计算模型,采集图书领域句子对作为测试集,构建图书领域本体作为知识源.实验结果表明,所提方法具有更高的准确率和召回率,其F-度量值达0.649 9,与余弦相似度算法、基于编辑距离的算法和基于TF-IDF的算法相比分别提高约12%、17%和16%.  相似文献   

5.
提出一种用于哼唱识别精确匹配的线性伸缩动态规划算法。该算法将哼唱旋律切割成句子,对每一句子进行线性伸缩匹配,同时在句子层次进行动态规划获得最优路径。该算法更有效地利用了哼唱语音的分段特性并克服了动态规划在长路径搜索时可能丢失全局最优路径的缺点。在含5 223首M ID I的数据库上同等条件下该算法正确率分别比线性伸缩、动态规划及递归匹配方法提高10.5%、6.0%和2.8%。该算法具有更高的准确率和更小的时间复杂度,是一种更有效的精确匹配算法。  相似文献   

6.
为了解决信号重构性能差的问题,提出了一种基于广义Jaccard系数的广义正交匹配追踪(generalized orthogonal matching pursuit, gOMP)重构算法。该算法利用广义Jaccard系数相似性匹配准则替换gOMP算法中的内积度量准则,优化了通过感知矩阵来选择与残差余量最匹配原子的匹配方式。实验结果表明,该算法的重构成功率不仅高于gOMP算法,同时也高于OMP、StOMP等算法。  相似文献   

7.
提出在基于实例的英汉机译中,一种基于相似性评估的近似实例求解策略·首先,对知识源进行预处理,包括树库、片段库及片段组合库的构建;其次,对输入句子进行预处理,包括句法分析树的建立,合法片段的抽取及片段组合形式的转换;最后,测量片段至句子的相似性,依据相似性阀值获取输入句子的所有近似实例·实验结果表明,各项测试指标都比较令人满意  相似文献   

8.
在计算机视觉中,形状的表示和相似性衡量是重要且复杂的问题,提出了一种改进的SUSAN(最小一致性区域)拐点检测算法并用于形状表示,同时基于Delaunay三角化给出了一个用于形状相似性衡量的有效算法。首先,对形状的拐点进行Delaunay三角形构造,然后从Delaunay三角网中获得Delaunay图矩阵,最后使用矩阵的谱对拐点进行匹配。在含有1 400幅图像的MPEG-7 CE-Shape-1数据库中的检索实验进一步验证了算法的有效性。  相似文献   

9.
为进一步提高压缩感知重构算法的重构成功率和重构精度,从原子匹配准则和预选阶段原子选择方式的角度出发,提出一种基于Dice系数的弱选择回溯匹配追踪(weak-selection backtracking matching pursuit based on Dice coefficient, DWBMP)算法.首先,采用Dice系数匹配准则度量两个向量之间的相似性,选出最匹配的原子,以优化支撑集;然后,结合回溯思想和弱选择思想剔除相似性较小的原子,完成预选阶段原子的二次筛选.MATLAB仿真结果显示,相同条件下,DWBMP算法较经典的压缩感知重构算法具有更优的重构精度和重构成功率.  相似文献   

10.
量子理论所具备的叠加、纠缠、不相容和干涉等特征使其成为优秀的建模框架.研究了量子理论在自然语言理解方面的应用潜力.在自然语言句子匹配任务上,探讨了量子理论作为一种形式化框架捕捉句子、词语的语义和语义建模上的能力:利用量子态构建句子的语义Hilbert空间,计算句子信息变换过程中信息的保真度;与此同时,将量子理论与Word Embedding技术巧妙结合,在高维低秩向量空间中表示单词或概念,求取句子的相似性.在一个真实业务场景中构造的问句匹配数据集上,模拟数据表明,所提出的方法相比于经典方法取得了更好的效果,为以后进行多个句子的相似度研究提供了新的思路,也是计算机科学与量子理论学科交叉研究领域的一个突破,符合当下研究的方向.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号