数据清洗中中文地址分词技术研究 |
| |
引用本文: | 郭文龙. 数据清洗中中文地址分词技术研究[J]. 齐齐哈尔大学学报(自然科学版), 2012, 28(5) |
| |
作者姓名: | 郭文龙 |
| |
作者单位: | 福建江夏学院电子信息科学系,福州,350108 |
| |
摘 要: | 数据清洗中,中文地址类信息对于重复记录的检测起着非常重要的作用。中文地址按照行政归属可划分为五级,通过组建地址信息数据库对中文地址进行匹配,提出基于地址树的中文地址分词技术,构建了中文地址的分词算法流程并设计了算法。
|
关 键 词: | 中文地址 分词 算法 匹配 |
Study of Chinese address word segmentation technology in data cleaning |
| |
Abstract: | |
| |
Keywords: | chinese address word segmentation algorithm match |
本文献已被 万方数据 等数据库收录! |
|