首页 | 本学科首页   官方微博 | 高级检索  
     

利用统计量和语言学规则提取多字词表达
引用本文:刘荣,王奕凯. 利用统计量和语言学规则提取多字词表达[J]. 太原理工大学学报, 2011, 42(2): 133-137
作者姓名:刘荣  王奕凯
作者单位:太原理工大学,外国语学院,太原,030424
基金项目:国家自然科学基金项目,山西省出国留学人员项目,太原理工大学青年基金项目
摘    要:基于特定领域的语料库,利用统计和语言学规则相结合的方法提取多字词表达(Multiword expressions)。首先利用领域高频词作为种子词提取候选串,进一步利用各种统计量、多字词表达边界过滤规则对候选串进行噪声剔除,得到多字词表达。实验结果表明,该方法对于处理大规模真实文本效率很高,可以有效提高多字词表达的获取,可以更有针对性地在特定领域提取多字词表达。

关 键 词:多字词表达  互信息    语言学规则

Extracting Multiword Expressions with Statistics and Linguistic Rules
LIU Rong,WANG Yi-kai. Extracting Multiword Expressions with Statistics and Linguistic Rules[J]. Journal of Taiyuan University of Technology, 2011, 42(2): 133-137
Authors:LIU Rong  WANG Yi-kai
Affiliation:(College of Foreign Languages,TUT,Taiyuan 030024,China)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号