首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于构词法的网络新词自动识别初探
引用本文:郑家恒,李文花.基于构词法的网络新词自动识别初探[J].山西大学学报(自然科学版),2002,25(2):115-119.
作者姓名:郑家恒  李文花
作者单位:山西大学计算机科学系,山西太原030006
基金项目:国家 8 6 3项目 (2 0 0 1AA1140 31)
摘    要:网络新词语的自动识别是中文信息处理中的一个热点研究课题。文章在对加工过的网上文本语料统计的基础上 ,根据汉语构词法建立规则库 ,通过调用“互斥性字串”过滤规则和构词规则来确定新词语。设计并实现了网络新词语的自动识别实验系统 ,经封闭测试 ,准确率为 91.2 % ,召回率为 95 %。

关 键 词:网络词语  汉语构词法  新词语自动识别
文章编号:0253-2395(2002)02-0115-05
修稿时间:2002年1月10日

A Study on Automatic Identification for Internet New Words According to Word-Building Rule
ZHENG Jia-heng,LI Wen-hua.A Study on Automatic Identification for Internet New Words According to Word-Building Rule[J].Journal of Shanxi University (Natural Science Edition),2002,25(2):115-119.
Authors:ZHENG Jia-heng  LI Wen-hua
Abstract:The automatic identification to Internet new words is one of the hot topics recently in the Chinese information processing.This article bases on the statistics to the process words net corpus,according to the ruler databases of Chinese word-building,applies filter ruler and found ruler of words exclusive to recognize new Internet words.Based on the above ideology,we also design and achieve the Internet new words automatic identification system.Close testing,correct rate;91.2%,recall rate:95%.
Keywords:internet words  Chinese word-building  new words automatic identification
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号