首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
提出了一种汉-维句子对齐混合算法,它是以基于词典的方法为主、基于长度的方法为辅的一种混合对齐算法.目的在于建立一个以汉文-维文平行语料库及面向政府文献的汉-维机器翻译为应用背景的,实用汉-维句子对齐系统.  相似文献   

2.
分段对齐在双语句子对齐的过程中发挥着重要的作用,文章提出了一种新的基于锚点句对的分段对齐方法,并把它和传统的基于回车符的分段对齐方法相结合,形成了一种多层次的分段对齐方法.  相似文献   

3.
基于统计的汉英法律文献亚句子级对齐   总被引:2,自引:0,他引:2  
基于统计的句子对齐是根据双语句子的长度在所有可能的对齐中找出概率最大的一个·提出两种对齐汉英语料的参数计算方法,使对齐模型中的评价函数满足标准正态分布·参数s2的值是对训练语料中的所有点(l1,(l2-cl1)2)进行线性回归分析所得直线的斜率,s2的另一种求法是直接计算方差·实验结果表明汉英法律文献亚句子级对齐的正确率为98 8%,召回率为99 2%·  相似文献   

4.
汉文-维吾尔文句子对齐模型的XML标记规范   总被引:1,自引:0,他引:1  
近些年来,在语言信息处理研发、双语教学和对比研究以及双语词典编纂研究中,双语语料库的作用日益凸显出来.在双语语料库中,不仅要描述双语文本在句子一级的对齐信息,还要详细描述收入语料库中的双语文本的所有者、领域、时间等方面的属性信息.为便于数据交换和共享,所有语料文本均采用XML编码方式来描述信息.详细阐述了构建的汉文-维吾尔文平行语料库的对齐句子和一些属性信息的XML标记规范和XML标记算法的设计方法.  相似文献   

5.
介绍了藏汉句子自动对齐系统及其对齐方法,详细地分析了基于平行语料的藏汉句子自动对齐问题,提出了利用大规模高效藏汉双语词典进行句子局部对齐的策略,并做了验证.  相似文献   

6.
阐述了汉文-维吾尔文双语对齐语料库构建的一些技巧,通过实践提出了建设汉文-维吾尔文双语对齐语料库的方法.语料库收集汉文-维吾尔文双语句子对齐语1000句左右,可进行汉文和维吾尔文关键词检索,查询语料库中的汉文-维吾尔文对译句子,进行汉文-维吾尔文句子对比分析研究.  相似文献   

7.
网上双语资料的句子自动对齐算法基础分析   总被引:1,自引:0,他引:1  
针对伴随计算与网络技术的发展的网上资料自动对齐项目研究与开发项目中存在的一系列问题 (比如立项、流程分析、数学概要和工程实施等 ) ,进行了比较系统的研讨和总结。在具体步骤中 ,提出了解决项目立项、数学基础概要分析和工程系统性分析等的数学方法 ;还对相关项目的开发进行了阶段总结  相似文献   

8.
主流句子分类算法采用单一词向量表示模型获得文本表示,导致了对文本的映射能力不足.对此,通过融合多种词向量的文本表示以提高分类的准确率.针对多核学习在融合不同核函数时,常规的核函数系数寻优方法存在的训练时间长、难以求得局部最优解等问题,提出了一种新的核函数系数寻优方法,该方法基于参数空间分割与广度优先搜索不断逼近核系数的最优值.以支持向量机(support vector machine,SVM)为分类器,在7个文本数据集上进行了分类实验.实验结果表明,多核学习分类效果明显优于单核学习,并且所提出的寻优方法在训练次数少于常规方法时也能获得了好的分类效果.  相似文献   

9.
句子相似模型和最相似句子查找算法   总被引:25,自引:0,他引:25  
提出一种句子相似模型,用以度量句子的相似程度·句子相似度由词形相似度和词序相似度决定,词形相似度起主要作用,词序相似度起次要作用·该模型可保证当一个句子的分句或短语整体发生长距离移动后,仍与原来的句子很相似·提出一种基于单词倒排索引和句子长度索引的最相似句子查找算法·实验结果表明该查找算法不仅高效,而且平均查找时间受语料库规模影响很小·  相似文献   

10.
在主题深度表示学习的基础上,该文提出了一种融合双语词嵌入的主题对齐模型(topic alignment model,TAM),通过双语词嵌入扩充语义对齐词汇词典,在传统双语主题模型基础上设计辅助分布用于改进不同词分布的语义共享,以此改善跨语言和跨领域情境下的主题对齐效果;提出了2种新的指标,即双语主题相似度(bilingual topic similarity,BTS)和双语对齐相似度(bilingual alignment similarity,BAS),用于评价辅助分布对齐的效果。相比传统的对齐模型MCTA,TAM在跨语言主题对齐任务中双语对齐相似度提升了约1.5%,在跨领域主题对齐任务中F1值提升了约10%。研究结果对于改进跨语言和跨领域信息处理具有重要意义。  相似文献   

11.
为了降低设置检查点的时间和空间开销,提出了一种两级检查点算法,其中组级采用协调检查点算法,系统级采用单阶段检查点算法.该算法基于分布式动态分组策略,通过发送分组来确保分组间不会产生孤儿消息,实现了由传统的两阶段提交算法到单阶段算法的转变.实验结果表明,算法执行时间较低,时间复杂度由通常的O(n2)降低到O(n),具有较...  相似文献   

12.
利用遗传算法进行寻优有时候遗传操作会陷入局部寻优,造成早熟,使遗传操作收敛不到最优解.针对这一问题,提出一种基于分组排挤机制的遗传算法,将种群个体进行分组,引入基于海明距离的排挤机制,不仅可以防止早熟,而且可以加快收敛速度.最后用普通遗传算法与之进行比较,证明其可行性和有效性.  相似文献   

13.
将加密信息与载体图像转换成二进制序列,把加密信息每3个位分为一组,每组的加密信息与待嵌入图像低位的信息进行比较后,修改载体图像,嵌入加密信息;提取加密信息时,找出嵌入的位置,读取标志位,根据标志位取反与否读取隐藏信息.新算法在信息嵌入量不变的情况下,修改嵌入信息位少,载体图像变化小,安全性高.新算法实现简单,嵌入信息量大,隐藏效果好,具有一定的实用价值.  相似文献   

14.
基于遗传算法的智能组卷系统研究   总被引:2,自引:3,他引:2  
通过对智能组卷系统的需求分析,采用遗传算法作为试题搜索工具,实现了将遗传算法应用于智能组卷系统.并针对遗传算法及组卷的特点从程序流程、染色体编码、适应度函数、以及各种遗传算子上都作了探讨和改进,为系统实现作准备.  相似文献   

15.
给出了二重比对SPA算法的一个扩展,把SPA算法推广到蛋白质编码基因的比对中.首先利用经典的密码子进化模型,得到了密码子两两的得分矩阵,并用该矩阵对SPA算法进行了修改,使其更加合理有效地应用于蛋白质编码基因的比对.  相似文献   

16.
为有效解决大尺度基因组序列的比对分析,提出了一种基于遗传算法的序列比对方法。该算法通过对序列比对问题进行编码,将其转换成了搜索空间中的一个优化问题。实验结果表明,这种新的比对算法是有效的,它在占用少量内存的情况下可以获得近似于Need lem an-W unsch算法结果的最优解。  相似文献   

17.
多重序列比对问题是复杂性较高的困难问题.基于蚁群算法的多重序列比对方法能够在合理的时间内找到得分接近参考比对的多序列比对解.但是,随着序列的加长,蚁群算法对于长序列的比对效果并不是很理想.本文提出一种基于遗传算法和蚁群算法的多重序列比对方法.该方法利用遗传算法对长序列分段,利用蚁群算法对分段后的序列进行求解,然后直接将各段的结果进行拼接即可.  相似文献   

18.
张滔  黎敬涛  田文争 《江西科学》2011,29(1):109-112
通过对KMP算法的研究,确定了基于MPI的KMP算法实现的可能性.主要重点是分析了MPI环境下KMP算法中目标串分组2种方式,第1种是把目标串进行平均的不重叠的分组,第2种上把目标串以模式串长度为重叠单位进行分组.并对初步的实验结果进行了分析.  相似文献   

19.
针对MSA问题提出了将遗传算法与模拟退火算法结合在一起的混合算法.该算法充分发挥了遗传算法和模拟退火算法的优越性,可提高求解多序列比对MSA问题的计算精度和计算速度,整个算法模拟了自然界进化的周期性,较好的解决了群体的多样性和收敛深度的矛盾.实验表明,该方法算法是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号