首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种新的数据分类方法-PSS算法
引用本文:李光琪,张兆功,张艳秋,李建中.一种新的数据分类方法-PSS算法[J].黑龙江大学自然科学学报,2003,20(1):62-66.
作者姓名:李光琪  张兆功  张艳秋  李建中
作者单位:1. 黑龙江大学科技开发总公司,黑龙江,哈尔滨,150080
2. 黑龙江大学理学院,黑龙江,哈尔滨,150080;哈尔滨工业大学计算机科学与工程学院,黑龙江,哈尔滨,150001
3. 哈尔滨工业大学计算机科学与工程学院,黑龙江,哈尔滨,150001
4. 黑龙江大学计算机科学技术学院,黑龙江,哈尔滨,150080;哈尔滨工业大学计算机科学与工程学院,黑龙江,哈尔滨,150001
基金项目:国家自然科学基金资助项目(69873014),国家973计划资助项目(G1999032704),国家863计划资助项目(2001-AA-415-410),黑龙江省自然科学基金资助项目(F00-11)
摘    要:在数据量很大时,原有的数据分类方法变得失效。因此提出一种新的基于抽样的数据分类算法PSS,并提出三种PSS并行化算法AS,HS和VS算法。在相同的数据量下,PSS算法比传统的sPRINT算法具有更好的性能。实验结果表明,PSS算法及其并行化算法是一种高效的数据分类算法,尤其适用于解决海量数据库中的数据分类问题。

关 键 词:数据分类  海量数据  PSS算法  并行
文章编号:1001-7011(2003)01-0062-05
修稿时间:2002年7月21日

A new data classification method-PSS algorithm
LI Guang-qi,ZHANG Zhao-gong,ZHANG Yan-qiu,LI Jian -zhong.A new data classification method-PSS algorithm[J].Journal of Natural Science of Heilongjiang University,2003,20(1):62-66.
Authors:LI Guang-qi  ZHANG Zhao-gong  ZHANG Yan-qiu  LI Jian -zhong
Abstract:When massive data is involved, traditional classification algorithms become inefficient. So, a new sample-based classification algorithm, PSS, is proposed. AS, HS and VS algorithms which are parallel algorithms of PSS are presented also. Applied to the same situation, PSS algorithm has better performance than traditional SPRINT algorithm. The test results show that the PSS algorithm as well as its parallel algorithms are high efficient when they are used in classification of massive database.
Keywords:classification  massive data  PSS algorithm  parallel
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号