共查询到18条相似文献,搜索用时 51 毫秒
1.
自适应特征熵权模糊C均值聚类算法的研究 总被引:1,自引:0,他引:1
特征权重算法对聚类效果有很大的影响,而传统的特征权重算法忽略了特征项在类间和类内的分布情况.因此,研究聚类后样本特征属性表现的有序性程度对聚类结果的影响,分析聚类后样本特征属性的分布情况,提出了一种自适应特征熵权模糊C均值聚类算法.该算法以聚类后的特征熵和信息增益作为准则调整特征权值,通过聚类与权重更新逐步迭代优化,直至获得最优的特征权值.实验表明,自适应特征熵权模糊C均值聚类算法能够有效地区分各个特征属性对聚类效果的重要程度;较于其它加权模糊C均值聚类算法,该算法能够得到更高的聚类准确率. 相似文献
2.
基于模式聚类的过程数据预处理方法及应用 总被引:2,自引:0,他引:2
在分析工业过程数据测量误差源的基础上 ,提出了一种基于模式聚类的数据预处理方法。该方法只依赖于领域的定性知识和半定量知识 ,能处理不同的误差干扰 ,预处理后的数据保留了原始测量数据的有用信息 ,剔除了过失数据 ,从而防止了矛盾数据的出现。将该方法用于制浆蒸煮过程的数据预处理中 ,收到了良好的效果 相似文献
3.
本文提出一种针对网络型数据的聚类动态面板引力模型,用于国际贸易流量网络的研究.该模型假设各贸易国分属于不同的潜在类别,各国间贸易流量对应的模型系数由出口国和进口国所属的类别决定.提出使用马尔可夫链蒙特卡罗方法对模型参数以及各贸易国所属的潜在类别进行贝叶斯估计.对2001-2015年60个国家间的贸易流量数据进行了实证分析.结果表明,所提出的模型能够对贸易国进行聚类,有效地提高贸易流量预测的精度.所提出的聚类动态面板引力模型可以被广泛的应用于其他动态网络型数据的研究. 相似文献
4.
5.
基于离差最大化的灰色聚类方法 总被引:3,自引:0,他引:3
针对灰色聚类分析中指标权重的确定存在的问题, 利用离差最大化的原理,提出了一种基于指标白化权函数值离差最大化的灰色聚类指标权重确定方法,从而建立了指标白化权函数值离差最大化的灰色聚类模型并对模型进行求解.该方法体现了用聚类指标的离差程度来反映指标信息的重要程度这一思想.最后通过实例应用, 验证了该方法的客观性与有效性. 相似文献
6.
基于客观信息熵的多因素权重分配方法 总被引:9,自引:0,他引:9
多因素问题研究中各因素的权重分配始终是多因素问题研究的一个重点。借助模糊聚类技术和粗糙集理论提出了一个基于客观信息熵的多因素权重分配方法。该方法首先将大量数据进行模糊聚类,然后应用粗糙集理论中的信息熵知识客观地从实际数据中确定各因素的权重。 相似文献
7.
基于模糊聚类的竞争者识别 总被引:4,自引:0,他引:4
从企业战略的角度确定识别竞争者的指标,并采用AHP方法确定权重,在此基础上应用模糊聚类分析法对同一行业的企业进行分类,进而识别企业的竞争者,最后对某企业的竞争者进行了实例分析。 相似文献
8.
针对具有参数跳变的非线性系统,联合聚类算法和神经网络提出新的多模型自适应控制方法。首先对系统的输入输出数据进行模糊聚类,然后基于递推最小二乘法建立多个固定模型。为提高系统的暂态性能,同时建立两个自适应模型,并在此基础上设计鲁棒自适应控制器。此外,为了补偿系统的非线性部分,建立非线性预测模型,并设计非线性神经网络自适应控制器。所提方法可使控制切换系统具有稳定性保证。最后,通过性能指标对控制器进行平滑切换。仿真结果表明,所提方法能够保证系统具有良好的控制性能。 相似文献
9.
10.
郭均鹏王梅南高成菊戴晖 《系统管理学报》2015,(6):814-820
函数型数据能够反映数据的内在规律,利用该特点可以挖掘数据更多的潜在信息。在对传统聚类算法研究的基础上,首次提出将导函数距离引入函数型数据的聚类中,设计了函数型数据的分步系统聚类算法,给出了算法的具体步骤。利用随机模拟对算法的有效性进行了检验,并针对40个国家41年的人均GDP数据进行了实例研究,结果表明,该算法能够对函数型数据进行有效聚类。此外,基于此算法提出了一种函数型数据的数据补齐方法,实例研究结果表明,该预测方法能够对函数型数据进行有效地补齐。 相似文献
11.
本文首先对三维空间中面板数据的曲面几何特征进行了描述,并从"绝对数量"、"增长速度"、"几何相似性"和"空间绝对距离"等几个方面对曲面相似性指标进行了定义和构建,对模糊C均值聚类方法进行了优化.在此基础上,对2000-2010年中国31个省市专利产出活动的类型特征及其地域分异规律进行了探索.实证研究结果表明聚类效果良好,中国专利产出无论数量、绩效还是增速在总体上均呈上升趋势并存在空间异质性和自相关性.创新能力较强的省区虽集中在东部,但正在向中西部地区扩散.同时,创新总体上仍主要来自于政府推动尤其是研发资金投入,并且研发资源投入总量以及研发人员可支配资金的区域配置极不均衡.此外,财政拨款对于东、西部地区创新效率的作用也存在很大差异.因此,政府可根据区域研发能力和资源现状的不同,制定合理的区域科技发展战略与相关政策工具,从而挖掘区域创新动力,提升区域专利创新能力. 相似文献
12.
基于面板数据的灰色网格关联度模型 总被引:1,自引:0,他引:1
针对面板数据灰色关联模型中存在的一些问题. 首先提出了面板数据的初始化方法,用网格法描述面板数据在三维空间中的几何特性. 然后将网格拆分为线段,利用线段在空间中的斜率,构建网格关联系数. 进而根据算数平均得到灰色网格关联度模型,并讨论了该模型的性质. 最后通过算例验证了该方法的可行性与有效性,结果表明灰色网格关联度模型具有良好效果. 相似文献
13.
针对文献中将时间序列模型的EG两步法直接应用到面板数据模型这一现象,推导了面板数据中使用EG两步法的极限分布,进而指出在面板数据中直接使用时间序列EG两步法存在的问题,并通过MonteCarlo模拟展示了这一错误应用所存在的过度拒绝零假设的后果.同时,模拟结果还表明,当前实证研究中常用的两种基于EG两步法的面板协整检验,Kao协整检验和Pedroni协整检验均有其适用范围,对于不同的样本容量组合,两者有限样本表现不尽相同,因此,实证研究应根据样本数据的实际情况选用合适的检验统计量.此外,本文的实证结果表明,弱PPP定理在OECD国家并不成立. 相似文献
14.
技术集成理论的产生和可供选择的先进制造技术(AMT)资源的增多为我国企业进行自主创新和技术跨越提供了客观条件, 同时技术市场的不断多元化发展也使技术选择成为亟待解决的问题. 针对目前AMT选择方法的不完善, 利用二元离散Logit选择原理, 构建一种多项AMT选择的二元带趋势面板数据选择模型, 给出了模型的随机效用结构, 同时给出并分析效用模型随机趋势扰动项的概率分布. 讨论了随机效用模型的估计问题, 给出并证明消除效用模型随机意外项和随机扰动项的两个定理, 进一步给出模型面板数据处理的方法, 将模型中的随机偏好变量进行模糊处理, 最终将一个多期面板数据模型转化成一个可以估计的截面数据模型, 为多项技术集成AMT资源的选择提供理论工具. 最后通过一个算例, 验证了理论方法的有效性和可行性. 相似文献
15.
基于决策者偏好及赋权法一致性的组合赋权法 总被引:32,自引:1,他引:32
属性权重的确定是多属性决策中的一个关键而又难以解决的问题,针对现有主观赋权法和客观赋权法的不足,提出了一种新的组合赋权法。该方法同时考虑决策者对赋权方法的偏好及赋权方法的一致性程度,将这两个因素通过凸组合的方式反映在组合权重计算公式的加权系数中,其中反映决策者对某种赋权方法偏好度的加权系数可用AHP法来确定,反映一种赋权方法与其它赋权方法一致性程度的加权系数用Spearman等级相关系数来计算。给出了这种组合赋权法的具体步骤,并通过应用实例说明了该方法的合理性。 相似文献
16.
现代作战条件下反坦克导弹武器系统的作战效能评估是该类武器装备作战使用的关键,传统的评估方法主要针对该系统中某一作战分系统的效能开展研究,不能充分反映武器系统作战能力的真实性和全面性.基于此,本文针对反坦克导弹武器系统的作战效能的评估方法进行研究首先构建反坦克导弹武器效能评估指标体系,包括了指标集与评估集,并根据不同专家的意见和建议优化该指标体系;然后结合组合赋权的思想,将熵权算法与分层赋权算法所得权值加权组合构成最终权值并赋予各评价指标,从而降低评估时由于主观因素造成的误差;最后在自寻的反坦克导弹半实物仿真平台下对算法进行验证,实验结果表明了该算法的可行性. 相似文献
17.
高维数据聚类是数据挖掘领域的重要研究课题,大规模高维数据聚类研究非常具有挑战性.针对高效的CABOSFV高维数据聚类算法,采用并行计算模式提高其大规模数据的处理能力,提出基于稀疏指数排序的高维数据并行聚类算法P-CABOSFV.该算法根据高维数据稀疏指数排序进行分割点选择实现数据划分,将数据分配到多个计算节点同时处理聚类任务,再基于集合稀疏特征差异度聚类结果合并策略将各计算节点的聚类结果合并得到最终聚类结果.UCI数据集和计算机合成数据集实验表明:高维数据并行聚类算法P-CABOSFV聚类质量良好,具有很强的数据规模和数据维度可扩展性,是有效可行的. 相似文献
18.
Lǖ Zonglei 《系统工程与电子技术(英文版)》2009,20(5):1132-1143
A new incremental clustering framework is presented, the basis of which is the induction as inverted deduction. Induction is inherently risky because it is not truth-preserving. If the clustering is considered as an induction process, the key to build a valid clustering is to minimize the risk of clustering. From the viewpoint of modal logic, the clustering can be described as Kripke frames and Kripke models which are reflexive and symmetric. Based on the theory of modal logic, its properties can be described by system B in syntax. Thus, the risk of clustering can be calculated by the deduction relation of system B and proximity induction theorem described. Since the new proposed framework imposes no additional restrictive conditions of clustering algorithm, it is therefore a universal framework. An incremental clustering algorithm can be easily constructed by this framework from any given nonincremental clustering algorithm. The experiments show that the lower the a priori risk is, the more effective this framework is. It can be demonstrated that this framework is generally valid. 相似文献