首页 | 本学科首页   官方微博 | 高级检索  
     

融合藏族人名音节特征的性别自动识别
作者单位:;1.青海师范大学藏文信息处理教育部重点实验室;2.青海师范大学民族师范学院
摘    要:
藏族人名的性别自动识别是自然语言处理中非常重要的基础性问题之一.文章中提出了融合音节特征的SVM模型藏族人名性别识别方法,采用支持向量机(SVM)模型为基本框架,依据藏族人名的构词特征和统计分析,设计了特征模板,使支持向量机模型有效地处理藏族人名性别识别问题.实验结果表明,在包含18 821个藏族人名的103974个句子中,随机抽取3 764个藏族人名作为测试语料,对SVM的高斯核、线性核、多项式核和S型核等4个常用核函数做了实验,性别自动识别的准确率分别达到99.98%、98.81%、96.98%和95.45%.

关 键 词:藏族人名  性别识别  音节特征  支持向量机(SVM)

Automatic Gender Identification of the Syllabic Characteristics Fused of Tibetan People's Name
Abstract:
Keywords:
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号