首页 | 本学科首页   官方微博 | 高级检索  
     

句子相似模型和最相似句子查找算法
引用本文:吕学强,任飞亮,黄志丹,姚天顺. 句子相似模型和最相似句子查找算法[J]. 东北大学学报(自然科学版), 2003, 24(6): 531-534
作者姓名:吕学强  任飞亮  黄志丹  姚天顺
作者单位:东北大学,信息科学与工程学院,辽宁,沈阳,110004;沈阳师范大学,计算中心,辽宁,沈阳,110034
基金项目:国家自然科学基金资助项目(60083006),国家重点基础研究发展规划项目(G19980305011)
摘    要:提出一种句子相似模型,用以度量句子的相似程度·句子相似度由词形相似度和词序相似度决定,词形相似度起主要作用,词序相似度起次要作用·该模型可保证当一个句子的分句或短语整体发生长距离移动后,仍与原来的句子很相似·提出一种基于单词倒排索引和句子长度索引的最相似句子查找算法·实验结果表明该查找算法不仅高效,而且平均查找时间受语料库规模影响很小·

关 键 词:自然语言处理  基于实例  机器翻译  句子相似度  倒排索引  语料库
文章编号:1005-3026(2003)06-0531-04
修稿时间:2002-09-19

Sentence Similarity Model and the Most Similar Sentence Search Algorithm
Abstract:
Keywords:natural language processing  example-based  machine translation  sentence simil arity  inverted index  corpora
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号