首页 | 本学科首页   官方微博 | 高级检索  
     检索      

词义演化的计算方法
引用本文:王洪俊,施水才,俞士汶,吕学强.词义演化的计算方法[J].广西师范大学学报(自然科学版),2006,24(4):183-186.
作者姓名:王洪俊  施水才  俞士汶  吕学强
作者单位:1. 北京大学,计算语言学研究所,北京,100080;北京信息工程学院,中文信息处理研究中心,北京,100101
2. 北京信息工程学院,中文信息处理研究中心,北京,100101
3. 北京大学,计算语言学研究所,北京,100080
基金项目:国家重点基础研究发展计划(973计划) , 国家高技术研究发展计划(863计划) , 国家自然科学基金 , 北京市教委科技发展计划项目 , 北京市教委科研项目
摘    要:从大规模真实文本中挖掘词义关系是自然语言学习的一项艰巨任务。词义不是静态、一成不变的,随着时代的发展,词义也在不断变迁。如何从错综复杂的词义变迁中,挖掘词义演化的基本规律,准确发现词义的各种变化,并给出量化的分析和建立数学模型,是一个急待解决的问题。根据词语的上下文搭配词分布情况来定义该词的词义,提出一种基于动态语料库的词义演化计算方法统计词义在23年《人民日报》中的分布信息,计算词义在各个时段的变化值,构造词义的演化曲线,并提出一种基于X2分析的方法来挖掘词语的搭配词与时间之间的相关关系。

关 键 词:词义演化  词义计算  动态语料库
文章编号:1001-6600(2006)04-0183-04
收稿时间:2006-05-31
修稿时间:2006年5月31日

Computational Method for Word Sense Evolution
WANG Hong-jun,SHI Shui-cai,YU Shi-wen,LXue-qiang.Computational Method for Word Sense Evolution[J].Journal of Guangxi Normal University(Natural Science Edition),2006,24(4):183-186.
Authors:WANG Hong-jun  SHI Shui-cai  YU Shi-wen  LXue-qiang
Institution:1. Institute of Computational Linguistics ,Peking University,Beijing 100080,China ; 2. Chinese Information Processing Center,Beijing Information Technology Institute,Beijing 100101,China
Abstract:Mining word sense from text is a challenge task in NLP.Word senses are not static and unchanged.As the time changed,word sense changed.How to find,detect the change of word sense,and make a model for word sense evolution is the main task of this paper.A computational method for word sense evolution based on monitor corpus is proposed to define the meaning of collocation words,indexe a large-scale monitor corpus of people daily news,get the distribution of collocation of each word and define the computation method for word sense evolution.The word sense changing curves,and a method using X2 to mining the relevance between collocation words and special time periods is proposed.
Keywords:word sense evolution  word sense computation  monitor corpus
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号