一种反映词语相关度语义库的构建方法 |
| |
引用本文: | 徐南轩,邹恒明.一种反映词语相关度语义库的构建方法[J].上海交通大学学报,2008,42(7). |
| |
作者姓名: | 徐南轩 邹恒明 |
| |
作者单位: | 上海交通大学,软件学院,上海,200240 |
| |
基金项目: | 日立-交大软件学院数字家电实验室合作研究项目 |
| |
摘 要: | 为了反映词语间的语义相关程度.提出了一种基于向量空间模型的构建语义库的新方法.在构建语义库时,对大量语料文本进行迭代式学习,在学习过程中引入淘汰算法,并综合考虑了诸如共同出现次数、平均出现距离、信息熵以及单字语义信息等多种对词语间语义关系产生影响的因素.实验证明,用该方法得到的相关语义库能够较好地反映现实世界中词语之间的相关程度.
|
关 键 词: | 语义库 向量空间 语义相关度 信息熵 语料训练 |
Constructing Semantic Library to Reflect Word Interrelationship |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 维普 万方数据 等数据库收录! |
|