Web文本挖掘中的一种中文分词算法研究及其实现 The research and implementation on a Chinese automatic word - segment algorithm in Web text mining期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

Web文本挖掘中的一种中文分词算法研究及其实现

引用本文：	苏芳仲,林世平. Web文本挖掘中的一种中文分词算法研究及其实现[J]. 福州大学学报(自然科学版), 2004, 32(Z1): 67-71

作者姓名：	苏芳仲林世平

作者单位：	福州大学数学与计算机科学学院,福建,福州,350002

基金项目：	福建省自然科学基金资助项目(A0110009);福州大学科技发展基金资助项目(2002-XQ-21)

摘要：	针对Web文本挖掘中的中文信息处理的问题,介绍了将超文本格式(Html格式)的文档转化为纯文本格式(Txt格式)文档的方法.利用改进的最大匹配法来实现对文档的汉语自动分词,同时,加强消除歧义方面的处理,分词精度有所提高.
关键词：	文本挖掘字典索引文档格式转化消歧
文章编号：	1000-2243(2004)增刊-0067-05
修稿时间：	2004-10-15
The research and implementation on a Chinese automatic word - segment algorithm in Web text mining

Abstract:

Keywords:
本文献已被万方数据等数据库收录！
	点击此处可从《福州大学学报(自然科学版)》浏览原始摘要信息
	点击此处可从《福州大学学报(自然科学版)》下载免费的PDF全文