首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
人名识别是自然语言处理中具有挑战性的任务之一。该文实现了基于条件随机场的维吾尔人名识别。首先从对维吾尔语黏着性特点的分析入手,研究总结了维吾尔人名的构成特点,实现了以词形、词性、词干、后缀、首音节、最后一个音节和最近一个动词等为特征,基于条件随机场的维吾尔语人名识别方法,并设计了选取最佳特征模板的贪婪算法。实验结果表明:该方法达到了较高的性能,识别维吾尔人名的准确率、召回率和F-score分别达到了90.03%、82.96%和86.35%。  相似文献   

2.
藏族人名的性别自动识别是自然语言处理中非常重要的基础性问题之一.文章中提出了融合音节特征的SVM模型藏族人名性别识别方法,采用支持向量机(SVM)模型为基本框架,依据藏族人名的构词特征和统计分析,设计了特征模板,使支持向量机模型有效地处理藏族人名性别识别问题.实验结果表明,在包含18 821个藏族人名的103974个句子中,随机抽取3 764个藏族人名作为测试语料,对SVM的高斯核、线性核、多项式核和S型核等4个常用核函数做了实验,性别自动识别的准确率分别达到99.98%、98.81%、96.98%和95.45%.  相似文献   

3.
文本挖掘中命名实体识别是一项重要的研究内容,利用统计学原理进行命名实体识别具有较高的识别率.利用条件随机场(conditional random fields,CRF)方法,研究藏文人名识别技术,重点探讨藏文人名的内部结构特征、上下文特征、特征选择和数据预处理等内容,并通过实验分析了不同特征的有效性.首先给出了基于字(音节)和字位信息的人名识别方法;其次研究了触发词、虚词、人名词典和指人名词后缀为特征的不同特征组合与优化,并细化了不同虚词对人名识别的作用;最后,通过不同组合的实验测试,结果表明:1)触发词和作格助词特征在藏文人名识别上能够起到积极的作用;2)不同特征窗口大小对人名识别有一定影响;3)利用CRF识别藏文人名F1值能够达到80%左右,但由于藏文两字人名的高歧义性,目前还达不到与其他语言相近的识别效果.  相似文献   

4.
本文首先分析了藏文人名的特点以及藏文人名识别的难点,在此基础上,利用条件随机场模型,分别提出了采用基于亚音节标注的藏文人名识别方法和分词与词性标注一体化的藏文人名识别方法.  相似文献   

5.
常规的B样条曲线重构存在散乱数据点的序化、参数化等步骤,采用变形模板的曲线重构方法可有效避免这些繁琐的操作.针对给定的复杂曲面零件的设计轮廓和实测截面数据点,提出了一种基于变形模板的复杂截面轮廓重构新方法,建立了最小模板变形条件下的截面轮廓配准与重构模型.提出的模板与实测点的精确配准与模板约束变形的迭代优化策略,以及基于递归细分的快速距离算法,保证了截面轮廓的重构精度与效率,建立起了设计模板与实际截形的解析关系.最后的实例验证了所提方法的有效性和实用性.  相似文献   

6.
针对表格型票据,提出了一种基于框线检测的多类别票据图像分类方法.准确提取票据图像的框线特征,根据票据框线的拓扑结构建立起模板库;通过基于框线相关性的相似度模型,与标准模板库中模板的框线特征进行匹配,进而确定票据的分组类别.实际的票据分类实验证实了该方法的有效性和鲁棒性,为票据自动处理打下了坚实的基础.  相似文献   

7.
文章就藏文人名本身的特性分析了人名识别的难点,提出了CRF与规则相结合的藏文人名识别方法.该方法首先以CRF作为机器学习模型,充分利用藏文人名的各类特征,然后针对人名不能全面召回的问题,利用规则方法进行后处理,最终建立了一种优势互补的识别模型.实验结果表明,该文提出的方法具有较好的性能,F-值可达91.55.  相似文献   

8.
针对目标跟踪算法在精度和鲁棒性上的要求,提出一种基于改进粒子滤波的视觉目标跟踪算法.首先,建立多种特征来描述目标外观模型,并对各特征分量的加权系数进行自适应调节;然后,利用分类重采样方法解决原始重采样方法中的粒子退化和匮乏问题;最后,提出一种新的模板更新机制,自适应选取运动模板或原始模板.实验结果表明,改进后的算法在具有挑战的跟踪视频序列上实验,具有良好的跟踪精度和鲁棒性,能够应对视频图像分辨率不高、目标转动变化、部分遮挡等复杂条件.  相似文献   

9.
提出了一种基于统计与规则相结合的藏文人名自动识别方法.该方法充分挖掘了人名与上下文信息的关联程度,引入互信息对关联程度进行了定量的描述.根据大规模语料(30.2 M文本语料)的统计数据所建立的规则极大地提高了识别算法的准确率;在处理汉族音译人名情况时,采用姓氏驱动的方法,很好地解决了藏文文本中汉族人名的识别问题.实验结果表明,该方法具有较高的准确率和召回率.  相似文献   

10.
基于监督学习的同义关系自动抽取方法   总被引:1,自引:0,他引:1  
目的 解决从大规模文本中自动获取同义关系.方法 将同义关系抽任务取看成一个二值分类问题,将其分为训练阶段和抽取阶段,共4个处理模块:预处理、特征生成、模型训练和分类.结果 提出并建立了一种新的同义关系抽取模型,并给出了该模型的关键实现算法.结论 提出的方法 比基于模板方法 的F1值高出了24.4%,大幅度提高了同义关系抽取结果 的精度.同时提出的方法 有效地改善了基于模板方法 领域自适应性差的缺点,所定义的特征和特征的权重计算更适合于判定学习算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号