首页 | 本学科首页   官方微博 | 高级检索  
     

基于最长次长匹配的汉语自动分词
引用本文:黄德根 朱和合. 基于最长次长匹配的汉语自动分词[J]. 大连理工大学学报, 1999, 39(6): 831-835
作者姓名:黄德根 朱和合
作者单位:[1]大连理工大学工程力学研究所 [2]大连理工大学计算机科学与工程系
摘    要:汉语自动分词是中文信息处理领域所特有的一个重要研究课题,机器翻译(MT),自然语言理解(NLU),情报检索(IR)等都需以自动分词作为基础。为解决分词中的歧义问题,针对歧义切分字段的分布特点,提出一种基于最长匹配原则的汉语自动分词方法,分词效果较好。

关 键 词:语言处理 自动分词 机器翻译 最长匹配法 汉语

Chinese automatic words segmentation based on maximum matching and second|maximum matching
HUANG De|gen ,,ZHU He|he ,WANG Kun|lun ,YANG Yuan|sheng ,ZHONG Wan|xie. Chinese automatic words segmentation based on maximum matching and second|maximum matching[J]. Journal of Dalian University of Technology, 1999, 39(6): 831-835
Authors:HUANG De|gen     ZHU He|he   WANG Kun|lun   YANG Yuan|sheng   ZHONG Wan|xie
Affiliation:HUANG De|gen 1,2,ZHU He|he 2,WANG Kun|lun 2,YANG Yuan|sheng 2,ZHONG Wan|xie 1
Abstract:Computer automatic words segmentation is a particular research subject in Chinese information processing. It is the foundational work of machine translation, natural language understanding and information retrieval. According to the feature of Chinese, the paper presents a kind of new Chinese words segmentation model based on maximum and second|maximum matching method mainly to resolve intrinsic ambiguous correction.
Keywords:speech processing/automatic words segmentation  machine translation  maximum matching method  ambiguity partition
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号