期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	1篇
免费	0篇

专业分类

综合类

1篇

出版年

2007年

1篇

排序方式： 共有1条查询结果，搜索用时 328 毫秒

一种基于关键重复语义的最大熵文本分类

屈志毅李一伟张延堂杨曙光张菲菲《广西师范大学学报(自然科学版)》2007,25(4):204-207

文本分类做为Web文本挖掘的重要手段和搜索引擎的重要组成部分而被广泛研究。现有的分类系统大都依赖于中文分词,尽管达到分类目的,但随着Web文档数量的增加和网络新词汇的不断出现,面临着特征维数急遽增高带来的时空开销问题,严重影响了系统的性能。在此抛开中文分词而尝试使用基于关键子串的特征提取并结合最大熵模型给出了一种分类系统的实现。实验表明,与现有的分类系统相比,具有较好的问题求解效率和适应性。相似文献