首页 | 本学科首页   官方微博 | 高级检索  
     检索      

数据清洗中中文地址分词技术研究
引用本文:郭文龙.数据清洗中中文地址分词技术研究[J].齐齐哈尔大学学报(自然科学版),2012,28(5).
作者姓名:郭文龙
作者单位:福建江夏学院电子信息科学系,福州,350108
摘    要:数据清洗中,中文地址类信息对于重复记录的检测起着非常重要的作用。中文地址按照行政归属可划分为五级,通过组建地址信息数据库对中文地址进行匹配,提出基于地址树的中文地址分词技术,构建了中文地址的分词算法流程并设计了算法。

关 键 词:中文地址  分词  算法  匹配

Study of Chinese address word segmentation technology in data cleaning
Abstract:
Keywords:chinese address  word segmentation  algorithm  match
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号