共查询到20条相似文献,搜索用时 703 毫秒
1.
一、引言
空间数据库存储了大量与空间有关的数据,有许多与关系数据库不同的特性,比如含有拓扑和距离的信息,通常以复杂的多维空间索引结构组织数据,经常需要进行几何计算和空间推理等复杂操作.这些特性使得从空间数据中挖掘信息面临着很大挑战.由于空间数据不同于传统数据挖掘技术所处理的数字、分类和符号等数据,使得空间数据的处理方法成为空间数据挖掘中最重要的部分. 相似文献
2.
根据高分辨率影像的特点提出一种采用面向对象的建筑物提取方法. 该方法以影像对象为处理单元,利用其丰富的光谱、形状以及隐含在影像中的深层空间语义关系等信息进行分类,然后结合空间关系特征对分类结果进行优化,并使用均值滤波对类别边缘进行修正. 实验表明,基于面向对象的方法能比较完整地提取出建筑物对象,且空间关系辅助能进一步提高建筑物提取的精度. 相似文献
3.
提出了一种基于多分类-关联规则的快速分类算法——FCMAR,该算法在建立频繁模式树(FP-tree)时裁减掉不能生成频繁规则的项目,因而可减少FP-tree的节点数目,有效地降低时间和空间复杂度,实验结果表明该算法是有效可行的. 相似文献
4.
将alman滤波算法与BP算法相结合,提出一种用于模式分类的多层感知机模型和学习算法,并对计算实例进行了计算机模拟实验,实验结果表明,这种算法适用于非线性模式分类,且具有较快的收敛速度。 相似文献
5.
6.
分类算法是数据挖掘中的最重要的技术之一.通过对当前提出的最新的具有代表性的分类算法,从预测精度、学习效率、健壮性等方面进行深入的分析和比较,总结每类算法的各方面特性,从而便于研究者对已有的算法进行改进,提出具有更好性能的新的分类算法,同时方便使用者在应用时对算法的选择和使用. 相似文献
7.
KNN算法通过近邻样本的个数分类,Entropy-KNN算法给出新的相似度定义,而且投票时综合待测样本与近邻样本的个数和各类近邻的平均距离,但两种算法均未考虑近邻样本间的相似.提出的基于层次聚类法的Entropy-KNN算法,首先对训练集按类别进行层次聚类,接着在与待测样本最相似的子类中选取近邻样本,使得近邻样本具有较高的相似度,最后结合Entropy-KNN算法进行分类.在蘑菇数据集上的实验结果表明,该算法的分类准确率高于Entropy-KNN算法. 相似文献
8.
9.
10.
<正>地理信息系统(Geographic Information System,简称GIS)是一项以计算机为基础的新兴学科,是管理和研究空间数据的技术系统。在计算机软硬件支持下,它可以对空间数据按照地理坐标或空间位置进行各种处理、对数据进行有效管理,研究各种空间实体及其相互关系。通过对多因素的综合分析,它可以迅速地获取满 相似文献
11.
文本自动分类技术是随着网络信息化而发展起来的。它的作用是将各地海量的电子资源通过网络联系在一起,实现资源共享。本文通过对自动分类技术的类型及基本概念的概述,提出了自动分类中两种重要的算法技术。 相似文献
12.
针对遗传算法无法利用系统中的反馈信息,求解到一定范围时出现的冗余迭代,求精确解效率低,局部搜索能力弱、易出现"早熟"现象等缺点,提出了采用蚁群信息素对均匀划分子空间进行标定,利用留存的信息素控制选择操作,采用双重选择算子、基于"杂交优势"思想的交叉算子和自适应变异算子的混合遗传算法.实验表明,采用该算法的分类系统的分类准确率、算法运行时间、算法收敛性等方面性能均有明显提高. 相似文献
13.
针对标记重要性不同,且这种不同可能会为多标记学习提供一定的信息,该文提出了基于标记重要性的多标记特征选择算法.该算法首先引入核函数将特征空间映射到一个新的可分性强的特征空间,在映射后的特征空间中利用标记对样本的可分性对标记赋以权重;其次,在每个新映射的特征空间计算样本的分类间隔,并将该间隔作为特征权重来衡量特征的重要性;最后,联合标记权重和特征权重,对特征进行排序,得到一组新的特征重要性排序.实验结果表明:该算法优于一些当前流行的多标记特征选择算法. 相似文献
14.
针对在联盟链中实用拜占庭容错(practical Byzantine fault tolerance, PBFT)算法所存在的通信开销过大、节点信誉度无法保证、算法无法动态地增删节点等问题,提出了基于决策树改进的PBFT(decision tree Byzantine fault tolerance, DTBFT)算法。首先,针对联盟链的应用场景,简化了PBFT算法的一致性协议,降低了通信开销;其次,考虑到系统安全性的问题,引入信誉积分机制,增加决策树分类算法,在每轮共识完成后,统计节点行为,对节点分类,使得系统可以动态地剔除拜占庭节点,提高系统的安全性;最后,为了防止拜占庭节点当选主节点,视图频繁切换,导致系统运行效率低的问题,改进了视图切换协议,将主节点的选取范围缩小到节点信誉好的高级节点,保证主节点的可信度。实验表明,DTBFT算法在吞吐量、算法安全性等方面较PBFT算法具有一定的提升。 相似文献
15.
懒散关联分类针对每个待分类实例的特征进行分类关联规则的挖掘,通常能取得较高的准确率。然而,由于某些数据集中存在一些质量不好的特征,将影响懒散关联分类的准确率。此外,分类耗时较长是懒散关联分类另一个缺点。针对上述问题,提出了一种基于信息熵的懒散关联分类算法。该算法以信息熵度量属性值的质量,仅选取每个待分类实例中最好的k个属性值,将得到规模较小且与待分类实例紧密相关的训练子集,从中高效挖掘到高质量的规则。实验表明,与懒散关联分类相比,基于信息熵的懒散关联分类方法提高了分类准确率,并极大减少了运行时间。 相似文献
16.
在数据量很大时,原有的数据分类方法变得失效。因此提出一种新的基于抽样的数据分类算法PSS,并提出三种PSS并行化算法AS,HS和VS算法。在相同的数据量下,PSS算法比传统的sPRINT算法具有更好的性能。实验结果表明,PSS算法及其并行化算法是一种高效的数据分类算法,尤其适用于解决海量数据库中的数据分类问题。 相似文献
17.
针对如何减少关联分类方法中冗余规则,增加FOIL算法的规则数,以提高分类准确率,提出了一种结合关联与FOIL算法的分类方法,并称之为ACFA.首先,以类支持度和自信度为度量提取长度为1和2的规则,其次,利用Apriori算法挖掘出频繁2-项集F2,然后在频繁2-项集F2申挑选满足条件的频繁项建立候选集,最后在候选集上运用FOIL算法来产生分类规则.实验表明算法ACFA不但有效减少了关联分类方法中冗余的规则,并大大增加了FOIL算法的规则数,提高了分类的准确率. 相似文献
18.
DBSCAN算法是一种基于密度的空间数据聚类方法,聚类速度快,且能够有效处理噪声点和发现任意形状的空间聚类.但是数据量大时要求较大的内存支持和IO消耗,当空间聚类的密度不均匀,聚类间距离相差很大时,聚类质量较差.本文在DBSCAN算法的基础上提出一个划分不同密度分别聚类的算法.测试结果表明可以改善聚类效果. 相似文献