首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于混合模型的中文命名实体抽取系统
引用本文:王睿,张洁,张由仪,于禛,姚天昉.基于混合模型的中文命名实体抽取系统[J].清华大学学报(自然科学版),2005,45(9):1908-1914.
作者姓名:王睿  张洁  张由仪  于禛  姚天昉
作者单位:上海交通大学,计算机科学与工程系,上海,200030;上海交通大学,计算机科学与工程系,上海,200030;上海交通大学,计算机科学与工程系,上海,200030;上海交通大学,计算机科学与工程系,上海,200030;上海交通大学,计算机科学与工程系,上海,200030
摘    要:中文命名实体抽取的研究,存在分词、领域和方法三个方面的问题需要解决.解决方案是利用规则,对机器分词后的文本进行修正;提出"群山"模型,对不同领域制定不同的语言学规则;以统计学方法和语言学方法结合,对不同命名实体采用不同的方法等.根据实验结果,得出以下结论分词的错误将严重影响到最终的抽取结果;领域规则的应用可以提升抽取效果;不同方法的有机结合比采用单一方法有效.

关 键 词:分词  领域  统计学方法  语言学方法
文章编号:1000-0054(2005)S1-1908-07
修稿时间:2005年5月20日

Chinese name entity extraction system based on a hybrid model
WANG Rui,ZHANG Jie,ZHANG Youyi,YU Zhen,YAO Tianfang.Chinese name entity extraction system based on a hybrid model[J].Journal of Tsinghua University(Science and Technology),2005,45(9):1908-1914.
Authors:WANG Rui  ZHANG Jie  ZHANG Youyi  YU Zhen  YAO Tianfang
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号