摘 要: | 目前,中国国家统计局发布的消费者价格指数不包含网购部分。随着电子商务的快速发展,网购价格指数的发布已经成为亟待解决的问题。互联网环境下,网购交易数据能够实时获取,因此网购价格指数应当更为准确可靠。然而,由于企业对商品分类标准不同,分类价格指数的计算需要首先解决基本价格指数的分类问题。该文提出一种基于层次分裂算法的价格指数序列聚类方法,选择基于相关系数的距离和Manhattan距离作为距离度量,分两步对价格指数序列进行聚类。算法通过设置不同的终止条件停止分裂,不需要事先设置簇数。引用实例对算法进行验证,有效划分了226组价格指数序列中的219组,取得了较好的聚类效果。
|