最少分词问题及其解法 |
| |
引用本文: | 王晓龙.最少分词问题及其解法[J].科学通报,1989,34(13):1030-1030. |
| |
作者姓名: | 王晓龙 |
| |
作者单位: | 哈尔滨工业大学
(王晓龙,王开铸,李仲荣),哈尔滨电工仪表研究所(白小华) |
| |
摘 要: | 一、最少分词问题 由于汉语中词与词之间没有空格,在中文信息处理中会遇到词的确认或切分这一问题。 人们理解自然语言的过程可分为下面几个层次:组字成诃,组词成短语,组短语成语句……。由于后面的处理层次所需考虑的因素多、难度大,尽可能在第一层次即分词层做较多的信息处理,有助于减少整个语言理解过程的开销。换句话说,对字符串分词后得到的词数越少越易于对该字符串的理解。这称为最少分词原则。如何分词使分词后得到的词数最少这一问题
|
关 键 词: | 信息处理 算法分析 汉语分词 |
本文献已被 CNKI 维普 等数据库收录! |
| 点击此处可从《科学通报》浏览原始摘要信息 |
| 点击此处可从《科学通报》下载免费的PDF全文 |
|