句子相似模型和最相似句子查找算法 |
| |
引用本文: | 吕学强,任飞亮,黄志丹,姚天顺. 句子相似模型和最相似句子查找算法[J]. 东北大学学报(自然科学版), 2003, 24(6): 531-534 |
| |
作者姓名: | 吕学强 任飞亮 黄志丹 姚天顺 |
| |
作者单位: | 东北大学,信息科学与工程学院,辽宁,沈阳,110004;沈阳师范大学,计算中心,辽宁,沈阳,110034 |
| |
基金项目: | 国家自然科学基金资助项目(60083006),国家重点基础研究发展规划项目(G19980305011) |
| |
摘 要: | 提出一种句子相似模型,用以度量句子的相似程度·句子相似度由词形相似度和词序相似度决定,词形相似度起主要作用,词序相似度起次要作用·该模型可保证当一个句子的分句或短语整体发生长距离移动后,仍与原来的句子很相似·提出一种基于单词倒排索引和句子长度索引的最相似句子查找算法·实验结果表明该查找算法不仅高效,而且平均查找时间受语料库规模影响很小·
|
关 键 词: | 自然语言处理 基于实例 机器翻译 句子相似度 倒排索引 语料库 |
文章编号: | 1005-3026(2003)06-0531-04 |
修稿时间: | 2002-09-19 |
Sentence Similarity Model and the Most Similar Sentence Search Algorithm |
| |
Abstract: | |
| |
Keywords: | natural language processing example-based machine translation sentence simil arity inverted index corpora |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|