首页 | 本学科首页   官方微博 | 高级检索  
     

利用词汇分布相似度的中文词汇语义倾向性计算
引用本文:赵煜,蔡皖东,樊娜,李慧贤. 利用词汇分布相似度的中文词汇语义倾向性计算[J]. 西安交通大学学报, 2009, 43(6)
作者姓名:赵煜  蔡皖东  樊娜  李慧贤
作者单位:西北工业大学计算机学院,710072,西安
摘    要:针对现有中文词汇语义倾向性计算方法存在较少考虑深层语义影响因素的问题,提出了一种利用词汇分布相似度的中文语义倾向性计算方法.该方法分2个步骤完成:①利用依存句法分析和统计工具获取词汇在语料库中的分布相似度,并综合知网(HowNet)和汉语连词特征信息优化语料库统计结果,计算中文词汇间的语义相似度;②采用无向带权图划分的聚类方法来实现中文词汇语义倾向推断.由于获取最优聚类结果是一个NP难问题,所以采用贪心算法求解近似最优值.通过在自建的语料库上进行测试,并与利用语料库统计信息、利用HowNet等2个词汇语义倾向性计算系统进行比较,结果是所提方法的准确率达到了80%,表明在提高中文词汇语义倾向性计算的准确性方面是可行、有效的.

关 键 词:中文信息处理  词汇分布相似度  语义倾向  依存句法分析  知网

Computing Chinese Semantic Orientation Via Distributional Similarity
ZHAO Yu,CAI Wandong,FAN Na,LI Huixian. Computing Chinese Semantic Orientation Via Distributional Similarity[J]. Journal of Xi'an Jiaotong University, 2009, 43(6)
Authors:ZHAO Yu  CAI Wandong  FAN Na  LI Huixian
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号