首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 908 毫秒
1.
针对传统数据挖掘方法存在挖掘精度低、速度慢、占用内存多而不适于实际应用等缺点,提出一种属性受限状态下低维冗余聚类数据挖掘方法。通过计算低维冗余聚类数据的支持度,把低维冗余聚类数据挖掘问题转变成频繁项集挖掘问题;利用支持度与可信度对关联规则产生结果进行评价,并添加属性对其进行限制,以减少无用规则的产生。通过属性位复用方法建立候选区域,产生关联规则集,对符合关联规则集的低维冗余数据进行聚类,实现对其挖掘。实验结果表明,通过所提方法对属性受限状态下低维冗余数据进行挖掘,挖掘速度快,结果可靠。  相似文献   

2.
针对传统数据挖掘方法存在挖掘精度低、速度慢、占用内存多而不适于实际应用等缺点,提出一种属性受限状态下低维冗余聚类数据挖掘方法。通过计算低维冗余聚类数据的支持度,把低维冗余聚类数据挖掘问题转变成频繁项集挖掘问题;利用支持度与可信度对关联规则产生结果进行评价,并添加属性对其进行限制,以减少无用规则的产生。通过属性位复用方法建立候选区域,产生关联规则集,对符合关联规则集的低维冗余数据进行聚类,实现对其挖掘。实验结果表明,通过所提方法对属性受限状态下低维冗余数据进行挖掘,挖掘速度快,结果可靠。  相似文献   

3.
针对当前数据挖掘方法挖掘精度低、抗干扰能力差,挖掘效率低等问题,提出一种新的体操运动员平衡木直体后空翻动作数据抗干扰挖掘方法。给出体操运动员平衡木直体后空翻动作完成过程,利用体操运动员平衡木动作数据的预测值和实际值间的误差去除干扰数据。依据关联系数矩阵与差异性系数矩阵求出体操运动员平衡木直体后空翻动作数据集之间的关联映射,结合关联映射确定数据集间的关联规则,计算出同一空间下平衡木直体后空翻动作数据集之间的关联因子,获取两个数据集的挖掘公式,从而实现数据的抗干扰挖掘。实验结果表明,所提方法具有很高的挖掘精度和挖掘效率。  相似文献   

4.
基于模糊集和粗糙集的关联规则挖掘策略   总被引:3,自引:0,他引:3  
提出了一种对原始数据先进行模糊聚类,再提取规则的基于模糊集和粗糙集技术的关联规则挖掘策略,可以在一定程度内减少噪声数据的干扰,消除数据对象中的冗余属性,有利于提高规则挖掘的有效性.  相似文献   

5.
基于模糊关联迭代分区的挖掘优化方法研究   总被引:2,自引:2,他引:0  
由于数据库存在数据量大、多维性的特点,传统挖掘方法在对数据进行处理时,无法构建精准的数学模型,容易出现部分信息丢失、分区过硬的问题。提出一种基于模糊关联迭代分区的挖掘优化方法,通过模糊C均值聚类算法对原始数据集进行预处理,过滤冗余数据,获取原始数据集的模糊分区;利用模糊关联挖掘算法获取感兴趣规则,实现数据的优化挖掘。实验结果表明,针对不同的数据集,改进的方法均具有很好的分区性能,且时间复杂性低,挖掘精度高。  相似文献   

6.
基于仿真的调度规则组合决策研究   总被引:3,自引:0,他引:3  
针对车间调度规则组合的多目标优化问题,提出了一种基于仿真的评估决策模型. 通过仿真获得不同调度规则组合下的方案集合,在利用层次分析法获得性能指标权重的基础上,采用灰关联理论计算各结果方案对于单项指标的关联系数,实现了基于灰色关联度的方案评估,并导出了最优的调度规则组合. 调度规则组合决策体现了用户对系统性能指标的要求,解决了传统依靠经验进行调度规则选取的问题,优化了制造系统的运行.  相似文献   

7.
传统方法实现过程复杂、历史复杂时态数据的片面性,导致其无法全面地描述时态数据;且相似性计算无法准确匹配具有动态性与复杂性的时态数据,造成提取精度低。为此,提出一种新的分布式多空间数据库复杂时态数据提取技术。设计动态RBF神经网络,对分布式多空间数据库中未知动态进行识别和建模;通过建模结果完成对复杂时态数据的描述。依据加权关联规则与时态关联规则对支持度和置信度的定义,获取T-FS-tree加权时态关联规则中支持度和置信度。将复杂时态数据描述序列、最小支持度、最小置信度作为输入,将加权时态关联规则作为输出,建立T-FS-tree加权时态关联规则挖掘算法。按照向量计算获取加权时态频繁1项集以及频繁2项集,依据获取的加权时态频繁项集建立初始频繁项集树;依据初始频繁项集树获取全部时态频繁项集;通过获取的频繁项集产生加权时态关联规则。从所有关联规则中选择优先度高的规则,构建的复杂时态数据提取器,实现复杂时态数据提取。实验结果表明,所提方法复杂性低,提取结果更加全面、可靠,有很高的准确性。  相似文献   

8.
针对使用传统关联规则算法挖掘大数据集时,挖掘过程中效率不高,挖掘出大量冗余规则的问题,提出了基于关联规则和相似度的数据挖掘算法(U-APR):首先,一次性读入数据并构建矩阵,并利用关联规则支持度度量的特性来增加判断属性,以加快结束迭代过程,从而改进了Apriori算法频繁扫描数据库问题;然后,使用相似度算法去除冗余的关联规则;最后,结合置信度、支持度和用户目标匹配度对挖掘结果进行排序输出,从而得到用户感兴趣的关联规则. 同时,应用该算法与目前常用的2种关联规则算法对广东某高校学生财务数据进行数据挖掘. 实验结果表明:与2种常用的关联规则算法相比,U-APR算法缩短了运算时间和提高了存储空间利用率,对用户分析挖掘结果有较好的优化效果.  相似文献   

9.
为了提高英语教学质量评估的有效性,采用决策树建立教学质量评估指标分类规则,同时采用关联规则分析对评估结果进行验证.提取英语教学质量评估的有效指标,对指标属性进行量化和泛化处理;根据待评估样本计算各指标属性的熵增益并对熵增益率降序排序,分别获得根节点和分支节点,结合节点属性值得到分支个数,构建完整的教学质量评估决策树;采用关联规则分析方法求解各指标属性的支持度和置信度,根据关联分析结果验证决策树评估的有效性.结果表明,科学设置评估指标参数,并合理选择评估指标属性分段区间.通过本文方法可以较好地评估分析影响英语教学质量关键要素及内在联系.  相似文献   

10.
当前基于机器学习的材料属性预测研究中,通常采用数据库获取的所有数据样本,通过计算其高维向量表示来训练预测模型。然而材料数据库样本的高冗余性导致了训练的模型具有很强的偏向性和过拟合的现象。为此,提出一种剔除数据集中冗余性样本的算法,从数据集中选择具有代表性样本;通过使用多种机器学习算法预测材料属性并进行比较,结果表明如果没有实行基准数据集的冗余控制,即使是随机原始数据集也可以由于高冗余样本而得到很好的预测性能指标;研究还发现使用具有代表性样本进行训练实际可以帮助训练出具有更高泛化能力和更具预测性的模型。因此,提出降低冗余度是评估材料性能预测模型的必要步骤。  相似文献   

11.
针对传统数据库检索中检索速度较慢、 检索结果不完整、 检索结果排列无序等问题, 基于全文检索工具Lucene索引的结构, 设计一种基于Lucene的数据库索引结构, 并提出记录倒排索引链表的概念, 使网站不用再按照传统顺序查找方式进行检索, 而是以索引库中的关键词进行检索, 提高了检索效率. 实验结果表明, 基于
Lucene的数据库全文检索具有查全率高、 检索结果排列有序等优点.  相似文献   

12.
以山西和盛煤矿井田范围为研究对象,遥感解译采用中巴资源卫星为数据源(2010年6月),得到5类植被景观要素,并对其景观要素多样性进行分析,结果表明:该地区均匀度指数和丰富度指数较低,导致其多样性指数较低;该地区景观组分较少,各景观要素面积所占比例差异较大,优势度较高,表明有少量植被景观要素居主导地位.  相似文献   

13.
连通图G的Balaban指标(也叫J指标)的定义是■连通图G的Sum-Balaban指标定义为■其中m,n分别是图G的边数和点数,σ_G(u)表示G中从顶点u到其它各个顶点的距离之和. Balaban指标和Sum-Balaban指标被广泛应用于QSAR和QSPR的研究.证明了:经过圈收缩后,一类单圈图的Balaban指标和Sum-Balaban指标是增大的.观察Balaban指标和Sum-Balaban指标在圈收缩操作中的变化规律,对这两类拓扑指标提出了一种新的比较方法.  相似文献   

14.
基于海南省历年统计数据与旅游景区、星级酒店及旅行社等旅游要素的空间位置关系,选用Hefindahl指数、区位熵系数、最临近点指数、空间联系指数及地理集中指数,对海南省旅游业空间集聚程度进行测算,进而分析海南旅游业总体、旅游要素、区域内部、城市集聚现状及差异.结果表明:海南省旅游业总体上呈集聚增长趋势;东部旅游集聚程度最大,西部次之,中部最小;琼北经济圈及三亚旅游圈构成海南岛南北各具特色并具较强竞争力的两大旅游集聚区;三亚、海口为海南省大尺度的旅游集聚区.在此基础上分析海南省旅游业空间集聚的影响因素,包括旅游资源禀赋、旅游业自身属性、区位条件、政府政策及经济发展水平,并探讨海南省旅游空间集聚模式.  相似文献   

15.
使用Kier指数的0阶项(^0X^v)、1阶项(^1X^u)分别与15种酚类化合物的色谱保留指数(I)关联,其相关系数分别为0.9765,0.9582,均优于Wiener指数的0.9491;I与^1X^v及取代基距离指数S相似合的复相关系数R为0.9912,优于文献的研究结果。  相似文献   

16.
针对股指期货套期保值比率的选择问题,运用我国沪深300现货指数和沪深300股指期货数据进行了实证研究。研究中,把交易成本这一因素考虑进来,通过HE指标和修正的HE指标得出的不同结果作对比,得出交易成本角度下的最优套期保值比率。因此建议股指期货套期保值者根据自身的交易成本情况选择不同的套期保值比率。  相似文献   

17.
昆明市旅游气候适宜度分析与评估   总被引:1,自引:0,他引:1  
通过整理分析1991年—2009年昆明市气象资料,对昆明市的温湿指数、风效指数、降雨指数进行分析,进而对昆明市月旅游气候适宜度进行评估。探讨各月在降雨条件影响下昆明市的月旅游气候适宜度。  相似文献   

18.
详细描述了索引的概念,优缺点,重点介绍了4种索引的特征与注意事项,索引的创建原则,语法及重要选项说明,并对索引的性能优化进行了全面的阐述,最后介绍了索引调整向导以及全文索引,这对深入地认识,理解和使用索引有一定的理论价值和实践意义。  相似文献   

19.
针对基于位置的web搜索需要将网页中位置信息和文本信息相结合进行索引的应用需求,提出了先倒排表再R-tree索引和先R-tree再倒排表索引两种混合索引结构,同时处理文本和位置信息.大规模真实数据集上的实验表明,这两种方法在查询效率上明显优于已有的倒排表和R-tree相互独立的索引模式.  相似文献   

20.
均匀θ-图边距离和的求解   总被引:1,自引:1,他引:0  
给出了边距离和以及均匀θ-图的定义,介绍了几个关于边距离和的结论,算出了均匀θ-图的边距离和,且得出几个推论.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号