首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 343 毫秒
1.
维吾尔语是属于阿尔泰语系的黏着性语言,构词特点比较复杂,尤其是维吾尔语中的人名,由于来源差别巨大,识别难度很高,到目前为止,还未出现成熟的维吾尔语人名识别工具。大量维吾尔语文本中的人名统计发现,维吾尔族人名和汉族人名共占据了约83%,因此该文分别针对维吾尔语文本中出现的维吾尔族人名和汉族人名提出相应的识别方法。针对维吾尔族人名,提出基于字母的模糊匹配识别方法;针对汉族人名,借助机器翻译思想提出基于音字转换的识别方法。实验结果表明:所提方法识别维吾尔族人名F1值能够达到91.84%,识别汉族人名F1值能够达到95.86%。  相似文献   

2.
充分利用人名的外部特征和内部颗粒特征,提出了一种基于条件随机场的中国人名识别方法.通过建立原子模板和复合模板,将局部特征、关联特征、全局特征以及专家知识相融合,基于条件随机场建立了相应的语言模型,极大地提高了人名识别的准确率和召回率.  相似文献   

3.
本文首先分析了藏文人名的特点以及藏文人名识别的难点,在此基础上,利用条件随机场模型,分别提出了采用基于亚音节标注的藏文人名识别方法和分词与词性标注一体化的藏文人名识别方法.  相似文献   

4.
文本挖掘中命名实体识别是一项重要的研究内容,利用统计学原理进行命名实体识别具有较高的识别率.利用条件随机场(conditional random fields,CRF)方法,研究藏文人名识别技术,重点探讨藏文人名的内部结构特征、上下文特征、特征选择和数据预处理等内容,并通过实验分析了不同特征的有效性.首先给出了基于字(音节)和字位信息的人名识别方法;其次研究了触发词、虚词、人名词典和指人名词后缀为特征的不同特征组合与优化,并细化了不同虚词对人名识别的作用;最后,通过不同组合的实验测试,结果表明:1)触发词和作格助词特征在藏文人名识别上能够起到积极的作用;2)不同特征窗口大小对人名识别有一定影响;3)利用CRF识别藏文人名F1值能够达到80%左右,但由于藏文两字人名的高歧义性,目前还达不到与其他语言相近的识别效果.  相似文献   

5.
针对手写汉字中相似汉字的识别问题,构建了一种卷积神经网络(CNN)模型,并给出了其网络拓扑结构,通过随机弹性形变对样本集进行扩展,以提高模型的泛化性能.相似手写汉字的识别实验结果表明:相对于常规的CNN模型,文中CNN模型的手写汉字识别正确率提高1.66%,特别是对于变形的手写汉字,识别正确率提高12.85%;相对于传统的手写汉字识别方法,文中方法的识别错误率降低36.47%,从而验证了文中识别方法的有效性.  相似文献   

6.
最近几年,随着深度学习理论和行人再识别方法的发展和成熟,行人再识别技术取得了很大的突破,在理想条件下取得了很高的识别精度。但是,当前行人再识别算法在非可控环境的识别精度还比较低,距离实际可用还有很长的距离。非可控环境行人再识别面临许多挑战,包括训练样本不足、光照剧烈变化、行人遮挡和开集测试等,严重降低了行人再识别算法的性能。文章对非可控行人再识别技术,尤其是对小样本、可见光-红外、遮挡和开集行人再识别技术的近期进展、使用的数据库进行阐述,并分析了相关技术存在的问题和未来的发展趋势。  相似文献   

7.
文章就藏文人名本身的特性分析了人名识别的难点,提出了CRF与规则相结合的藏文人名识别方法.该方法首先以CRF作为机器学习模型,充分利用藏文人名的各类特征,然后针对人名不能全面召回的问题,利用规则方法进行后处理,最终建立了一种优势互补的识别模型.实验结果表明,该文提出的方法具有较好的性能,F-值可达91.55.  相似文献   

8.
基于统计和规则混合策略的中国人名识别研究   总被引:2,自引:0,他引:2  
采用统计与规则相结合的混合策略,提出一种中国人名的自动识别方法.该方法利用知识库中的统计信息,对中国人名作初步的提取,分析中国人名构成的内部特征和外部特征,提取出特征集,并总结出相应的识别规则,对候选人名进行识别,在此基础上构建了一个中国人名识别系统,并对系统进行了测试,实验表明了算法的可行性和有效性.  相似文献   

9.
步态识别是一种新兴的生物特征识别技术,具有远距离识别、非侵犯性、难于隐藏等优势。文章针对人体运动的特点,将步态看成是钟摆运动和平移运动的复合,提出了一种基于移动钟摆的步态识别方法。实验证明,该方法简单有效,并在CASIA数据集上取得90%以上的识别率。  相似文献   

10.
人名识别是自然语言处理中具有挑战性的任务之一。该文实现了基于条件随机场的维吾尔人名识别。首先从对维吾尔语黏着性特点的分析入手,研究总结了维吾尔人名的构成特点,实现了以词形、词性、词干、后缀、首音节、最后一个音节和最近一个动词等为特征,基于条件随机场的维吾尔语人名识别方法,并设计了选取最佳特征模板的贪婪算法。实验结果表明:该方法达到了较高的性能,识别维吾尔人名的准确率、召回率和F-score分别达到了90.03%、82.96%和86.35%。  相似文献   

11.
利用局部线性嵌入的模态识别   总被引:3,自引:0,他引:3  
提出了一种新的利用局部线性嵌入的模态识别方法。该方法以流形学习为理论基础,从提取结构的几何或固有特征出发,以系统结构的响应数据为分析对象,可识别出结构的模态参数。该方法的基本思想是,将结构的响应看作一个高维数据集,将系统的模态看作高维数据集的本质结构与固有特征,然后通过求解数据的低维嵌入进行模态参数识别。圆柱壳仿真结果表明:提出的利用局部线性嵌入的模态识别方法能够有效地进行模态参数识别;随着阻尼系数的增加,对于贡献量较大的模态,利用局部线性嵌入的识别效果优于基于主成分分析的识别效果。  相似文献   

12.
目前我国人名英译比较混乱,译名混乱现象不仅存在于大众媒体,即使学术性刊物也是问题种种。本文探讨了中国人名外译的历史遗留问题以及所应遵循的规范要求和变通形式,意在促进作为专名的人名翻译规范。  相似文献   

13.
针对信道编码的盲识别问题,首次提出了扩展Golay码的盲识别方法。与前有的盲识别算法比较,该算法的识别概率有明显的提高,这是一个全新的研究课题,在智能通信、信息截获、密码分析等领域有重要的应用。仿真实验表明文中提出的方法在误码率为8×10-2的情况下,对于扩展Golay码的识别概率高于99%,比原有算法提高了44%。  相似文献   

14.
建立了边界非完整约束悬臂裂纹梁边界支承柔度和裂纹损伤程度的静力参数识别方法.首先,将悬臂裂纹梁边界非完整约束等效为竖向和扭转弹簧,梁中开裂纹等效为内部扭转弹簧,得到了弹性支承边界悬臂Euler-Bernoulli裂纹梁静力弯曲的显式闭合通解;其次,根据弹性支承悬臂裂纹梁的损伤诱导挠度函数和裂纹诱导弦挠度函数是分段线性函数等性质,给出了边界弹性支承柔度和裂纹损伤程度的计算公式;最后,通过数值试验验证了该悬臂裂纹梁边界弹性支承柔度及裂纹损伤程度识别方法的适用性和可靠性,考察了挠度测量噪声和裂纹深度等对参数识别的影响.试验结果表明,随着挠度测量误差的增大,参数识别误差总体随之增大,但识别结果仍在可接受的范围内,因此该方法可用于实际工程中的边界非完整约束悬臂裂纹梁的参数识别.  相似文献   

15.
<正>世界上各个民族姓名的书写都各有特征,如欧美人名"名在前姓在后"、中国人名"姓在前名在后"等,这是由各民族自己的历史和文化背景决定的。正确书写人名,体现了民族的尊严。因此,一个民族在涉及别的民族人名时,应遵循"名从主人"的原则,即在本民族的书面语言中正确地表现那个民族的人名。1974年《中国人名汉语拼音字母拼写法》公布以前,中国人名的罗马字母拼写十分混乱。1974年  相似文献   

16.
为了整合多种已有的端到端(P2P)流识别方法,支持对新识别方法的迅速扩展,提高分布式环境中的远程管理能力,提出了一种可扩展在线识别P2P流的架构(EAIOPF).首先,提出了识别程序最优序列的思想,即通过优化多个识别程序的运行顺序,提高系统的运行效率;然后,提出了在线更新识别方法的机制,根据该机制,无需重新编译程序就能扩展P2P流的识别功能;最后,设计了一种远程管理机制,实现对识别程序的远程更新、启动与停止.针对原型系统的测试结果表明,EAIOPF能有效提高识别系统的性能,支持在线更新识别方法和远程管理,为高速网络环境中整合多种P2P流识别方法提供了可行方案.  相似文献   

17.
针对目前中文医疗机构名识别问题,提出一种基于层叠条件随机场模型的中文医疗机构名识别方法;该方法第一层条件随机场(CRF)模型基于词粒度,结合自定义词典,实现人名、地名以及简单机构名识别,将最终的结果传递到第二层CRF模型;第二层CRF模型通过词性、词界以及上下文等特征最终完成对复合嵌套的医疗机构名实体的识别。结果表明:在封闭实验中,该方法识别正确率达到94.6%,召回率达到96.2%;在开放实验中,该方法识别正确率达到92.3%,召回率达到90.2%。本文模型相比于结合规则的单层CRF模型,F值分别提高1.99%、2.8%,总体结果得到显著改善。  相似文献   

18.
针对传统传感器需要在特定的空间区域内才能进行人机交互,极易受到外部环境因素干扰的问题,提出一种新的基于长短时记忆神经网络(LSTM)的智能手机3D空间手写识别方法,用于非特定三维空间中实现的人机交互.首先,利用智能手机内置三轴加速度传感器,采集手部运动数据,并将采集的数据进行预处理操作,构建3D手写识别数据集;然后,基于LSTM构建3D手写识别模型,并利用构建的数据集进行训练;最后,利用训练后的模型实现智能手机的3D手写分类识别.通过在本文自建的非依赖用户数据集上进行测试,实验结果表明,该识别方法可以实现86.4%的准确率,88.1%的召回率,88.4%的精准率和88.0%的F1分数.  相似文献   

19.
基于MARXAN模型改进了源的识别方法,在生态基础设施的概念下扩展了源的功能分类,认为源是多类型多斑块的整体最优选择集,识别的源同时具备高生物多样性和生态系统服务能力的双重属性。以攀枝花市为例,应用改进的源的识别方法研究其景观生态安全格局。发现攀枝花景观生态安全水平最高的区域是米易县,和盐边县境内二滩鸟类自然保护区以东的区域,局部地区存在阻力值的凸起区域。研究结果表明,本文改进的源的识别方法具有更强的景观生态学现实依据。  相似文献   

20.
为了实现准确的动作识别效果,我们通常需要提取能够充分代表运动特征的信息。近年来,基于高密度轨迹的动作识别方法因为能够提供丰富的时空信息而受到研究者们的广泛关注。但高密度轨迹类的动作识别算法通常都要面临背景冗余信息干扰的问题,为了解决这一问题,本文在高密度轨迹的动作识别方法基础上引入了目标检测算法,通过可变形块模型方法检测运动主体位置后计算其周围的高密度轨迹,有效地排除了背景冗余信息的干扰。而目标检测算法通常要面临丢帧问题,为了应对这一情况,本文采用了词袋模型和支持向量机进行动作特征表述和分类,词袋模型根据大量数据词频构建特征描述符的工作原理,使得目标检测偶有丢帧的情况并不影响动作识别的最终效果,结合高密度轨迹算法后有效地提高了传统高密度轨迹算法的效率,也获得了更为准确的识别效果。本文算法在KTH,UCF YouTube和UCF Sports数据集上较当前算法都取得了更高的动作识别准确率,尤其在复杂背景数据集UCF YouTube和UCF Sports上识别准确率分别可达89.2%和90.2%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号