共查询到20条相似文献,搜索用时 109 毫秒
1.
大数据技术的迅猛发展对计算效率提出了更高的要求.由于量子系统的独特性质,量子计算具有经典计算不具有的量子超并行计算能力,能够对某些重要的经典算法进行加速.人们发现,除了大数分解算法,量子计算的更多用途是对量子体系的仿真计算和在数据分析领域的应用.近年来,大数据和量子计算开始融合.虽然实际使用的量子计算机尚未建成,量子计算在大数据的应用在理论上已经取得了一些重要的进展.实验上也有了一些发展.本文首先介绍量子计算的基本原理和Grover量子算法.随后以量子机器学习作为切入点,介绍了量子计算在数据挖掘领域的应用. 相似文献
2.
许道云 《贵州大学学报(自然科学版)》2016,(4):1-11
在经典计算中,对前端输入数据的复杂性不做分析。在大数据计算中,前端输入数据的复杂性分析反而成为大数据计算和分析的重点。本文讨论大数据计算的基础理论问题,将大数据计算问题分为目标任务型和内容认知型。大数据计算形式上依赖于一个外部信息源,从计算的有效性,将大数据计算的讨论限制在对数空间复杂类,涵盖了并行计算复杂类。基于带Oracle的图灵计算模型,限制在对数空间内图灵可计算,并且外部信息源能够用一个对数空间可计算的递归函数枚举,引入了大数据可计算的计算模型和大数据可计算性、可判定问题等概念。 相似文献
3.
4.
5.
针对传统遗传算法交叉、变异过程过于繁琐和神经网络在极值判断及收敛速度受限等问题,提出了一种并行的量子遗传算法优化神经网络权值的算法.首先引入了量子计算的概念,在量子计算的过程中使用量子旋门实现染色体的训练,然后引入量子交叉克服了早熟收敛现象,避免了遗传算法中繁琐的交叉、变异过程.最后设计实现了并行的卷积神经网络,使用并行量子遗传算法优化了卷积神经网络权值,实现了并行量子遗传神经网络人脸识别系统.实验结果表明,相对于原来的遗传算法,该算法在鲁棒性和实验速度上都有明显的提高. 相似文献
6.
7.
介绍了并行遗传算法的思想及四种并行模型:主从式模型、粗粒度模型、细粒度模型及混合模型,讨论了并行遗传算法在关联规则挖掘中的应用。 相似文献
8.
为解决多数据源挖掘隐私保护问题,文章采取按相似度分类多源数据库及其增量数据库,利用原始数据库挖掘结果和增量数据库分析结果进行敏感序列模式匹配,以有效减少数据库扫描次数的方法,设计实现隐私保护的增量式的高投票率序列模式挖掘算法。实验结果表明,给出的算法既能够准确挖掘出多数据源中全局高投票率模式,又能有效地隐藏保护敏感模式,且显著缩短了挖掘时间。 相似文献
9.
针对传统供应链共享挖掘技术存在投入和产出效率偏低的问题,提出基于改进数据包络分析(Data Envelopment Analysis,DEA)算法的供应链大数据可信共享挖掘技术.采用基于改进DEA算法的供应链可信评价方法,将评价结果存放为数据集合形式.利用DEA算法优化计算供应链共享的投入和产出效率,并结合遗传算法避免DEA算法局部最优问题.采用供应链大数据流式处理方法处理数据集合数据,并提供给具有认证资格的共享信息发布层中的各主体访问使用,实现供应链大数据可信共享挖掘.实验结果表明:该技术具有较优异的大数据可信共享挖掘效果,能有效调整供应链投入与产出,提升供应链整体绩效. 相似文献
10.
序列模式挖掘是数据挖掘中的研究热点之一。在挖掘过程中需要用户的参与日益显得重要。为了提高挖掘过程中的交互性,本文提出了一个基于规则表达式约束的序列模式增量式挖掘算法RE_IncUp。该算法首先利用约束对已经挖掘出的频繁序列模式进行预处理,缩小了搜索范围;然后采用模式扩展方法把规则表达式约束和增量挖掘过程融为一体,并且采用先修剪后计算支持度的方法进一步缩小了搜索范围,降低了支持度的计算量。该算法允许用户不断改变约束条件,实现交互式挖掘而且可将挖掘的目标仅仅聚焦到用户感兴趣的模式上。实验表明该算法对序列模式的维护和满足用户的需求都是十分有效的。 相似文献
11.
一种网络日志挖掘的高效算法 总被引:1,自引:1,他引:0
张兵 《广西师范大学学报(自然科学版)》2006,24(1):26-29
提出了一种网络日志挖掘算法PWU,其采用了异构树结构。通过对异构树叶子节点进行编号,使得对候选集计数时只需对具有相同编号的叶子节点进行计数,极大地简化了候选集计数过程。在此基础上,算法还具有增量挖掘功能。最后,从理论分析和实验两方面证明了算法的高效性以及增量挖掘功能的高效性和完备性。 相似文献
12.
数据挖掘中并行离散化数据准备优化 总被引:2,自引:0,他引:2
在海量数据挖掘中,针对元数据的离散化数据准备处理能有效提高数据挖掘效率.本文提出了一种并行比较并获得最优离散化的数据准备算法(AOA),针对不同数据集,先进行数据集的特性检测以获得数据集分布特性,按照分布特性进行数据集的异常值检测和剔除,并行完成与分布特性适配的离散化方法处理,通过比较不同离散化方法的熵、方差指数、稳定性参数的最小欧氏距离,根据三个参数自动化比选,获得最优离散化的预处理成果.仿真表明,对不同样本数据库进行关联规则挖掘结果中,比较四种固定的离散化数据预处理方法,在使用AOA数据准备算法并行比选出最优的离散化来数据预处理后,在不同最小支持度阈值情况下,挖掘得到关联规则数都更少,因此效率得到提高. 相似文献
13.
数据仓库技术(Data Warehousing)和数据发掘(Data Mining)是信息领域中近年来迅速兴起的计算机技术。本文探讨了在银行信贷管理中的数据仓库的建模方法,及其在数据仓库基础上的数据发掘的计算智能方法的应用. 相似文献
14.
15.
16.
针对传统决策树SPRINT(Scalable Parallelizable Induction of Decision Trees)算法不能处理海量地学数据挖掘的问题, 设计实现了基于G4ICCS(Geology Geography Geochemistry Geophysics Information Cloud Computing System)的决策树并行分类算法PSPRINT。该算法使用哈希表存储连续属性分割点两侧的数据记录, 为并行节点的分割提供依据, 在MapReduce架构下解决了海量地学数据挖掘问题。实验结果表明, 在模拟的云计算环境下, 决策树并行算法可以处理海量地学数据分类问题, 并获得较好的稳定性和较高的处理速度。 相似文献
17.
马洁 《重庆工商大学学报(自然科学版)》2012,29(11):36-39
在海量数据的关联规则数据挖掘中,采用并行计算是非常必要的;针对当前的关联规则算法,运用并行算法的思想,结合云计算环境下的Hadoop架构,提出了Hadoop下的并行关联规则算法的设计,最后实验表明,该算法能处理节点失效,并且能实现节点负载均衡。 相似文献
18.
在面向计算部署到数据节点端执行的分布式并行环境下,提出一种基于图着色理论的适用于矢量空间数据的部署方法,将空间数据粒度的部署问题转化为图顶点着色的过程,提高了任意空间区域的信息查询效率.给出基于图着色理论的数据部署方法,并通过节点的任务量进一步改进算法,使得该算法可实现海量空间数据粒度的离散化部署,提高了空间数据检索和查询的并行化程度,充分利用了并行计算资源. 相似文献
19.
邱慧丽 《西昌学院学报(自然科学版)》2017,31(3):32-35
随着商业银行计算机与信息技术、客户群体以及各类产品的不断发展,商业银行积累了海量的珍贵数据,这些数据所蕴藏的巨大价值也越来越被决策层重视起来。在深入分析商业银行数据应用现状及现有的信息管理系统中的基础数据平台系统存在问题的基础上,提出了可靠和高效率的2种商业银行数据分析系统模型,并对挖掘出来的数据如何进行使用及如何转化成效益进行了详细的研究,对商业银行的发展具有重要的现实意义。 相似文献
20.
数据挖掘具有计算密集型和存储密集型的特点,中间件技术能够较好的解决这两个问题.研究并实现了典型的分类、聚类、关联规则算法及其增量算法的中间件和数据挖掘企业应用平台,能够处理100 Mbit量级的数据,适应的数据增量在10~100 Mbit量级,并且能够根据不同的挖掘任务实现相应的模式展现与可视化.平台上对某网球训练基地运动员体能训练数据集执行增量聚类挖掘任务,结果表明该平台能较好地满足可靠性、扩展性、易用性等业务需要. 相似文献