共查询到20条相似文献,搜索用时 31 毫秒
1.
<正>经过数十年的发展,数据挖掘领域产生了众多的算法和挖掘系统。挖掘系统作为研究的有形成果,在展示数据挖掘技术的威力、利用数据挖掘技术产生经济效益方面起着至关重要的作用。目前,各大软件厂商及研究单位都忙着推出了各自的数据挖掘系统。有的作为商业产品,功能强大,集成了数量众多的挖掘算法;有的作为科研试验软件,仅集成了一两个新颖的算 相似文献
2.
关联规则挖掘可以发现大量数据中项集之间相关联系的知识,隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果.提出了关联规则挖掘形式化定义以及它的基本算法,从关联规则挖掘角度对当前流行的隐私保护关联规则挖掘算法进行了深入浅出的分析和介绍,最后系统回顾了目前人们在数据挖掘领域中对隐私保护关联规则研究的现状,阐述了隐私保护在未来数据挖掘中的发展方向. 相似文献
3.
中医肾病治疗信息中关联规则的挖掘算法 总被引:9,自引:0,他引:9
数据挖掘是数据库研究领域的一个热门话题,数据挖掘和中医药相结合,将会为中医药治疗数据的深入研究提供一个热门研究方向与挑战。讨论了中医药方剂规律挖掘技术所涉及到的问题,提出了一种肾病中医治疗信息的关联规则挖掘算法,实验结果证明算法是实用而有效的。 相似文献
4.
关联规则是数据挖掘中的重要研究内容之一,国内现有的关联规则算法大多是研究挖掘数据库不变的限定条件下,发现挖掘数据的各属性间的所有关联型知识.而事实上大多数挖掘数据会随时间的变化不断变化.针对数据库中追加数据时,如何有效地更新关联规则的问题,提出了一种新算法———IUAMAR算法.该算法可以有效地利用知识数据库中保留的最小非高频繁项目集产生新的候选项目集,避免了候选项目集的数量太庞大的问题. 相似文献
5.
在概述Web挖掘以及Web日志挖掘的相关领域的发展和技术及其理论基础上,详细研究了Web日志挖掘的预处理技术,Web日志挖掘利用数据挖掘技术分析和挖掘网络日志,获取网站使用情况的有价值模式,应用于个性化服务、网站设计和商业决策等方面.通过将日志挖掘的结果与最优路径算法将结合,进一步优化网站,设计出拥有最优路径拓扑结构的网站,使优化后的网站更具优势,在同类网站中能够脱颖而出. 相似文献
6.
分类算法是数据挖掘、机器学习和模式识别中一个重要的研究领域.单一的分类算法一般会得到不同的分类结果,多分类器融合算法可以将各分类器的结果进行集成来提高系统的分类性能.该文提出一种多分类器融合算法进行分类分析,结果证明该算法在解决目标分类中具有优越性. 相似文献
7.
讨论如何通过面向Web的数据挖掘技术———XML技术从众多的Web站点进行数据抽取,使得这些有用的数据可以得到共享并集成. 相似文献
8.
9.
《哈尔滨师范大学自然科学学报》2017,(1)
实际应用、大数据、挖掘算法和处理平台4个要素的紧密结合构成了大数据挖掘的核心.根据大数据的特征,分析相关案例,指出实际应用的真实需求才是大数据挖掘的目标.大数据挖掘的价值体现必须结合应用数据和与应用匹配的算法,在数据处理平台的支持下,将挖掘到的知识或模型去指导实践. 相似文献
10.
采用数据挖掘技术中的决策树方法,进行收视数据分析.收集大量的调查问卷作为待挖掘的样本,利用决策树经典算法C4.5,对样本集中的样本进行 学习,构造出一棵决策树.对决策树进行分析,得出电视收视分析相关的知识和规律,作为节目编制等的决策依据. 相似文献
11.
在Fp-growth算法的基础上,提出了一种新颖的关联规则挖掘算法.该算法将大型数据库分解成频繁1-项集的项总数个子集,然后对分解得到的各个数据库子集用Fp-growth算法进行约束项数据挖掘,待所有数据库子集的约束项数据挖掘进行完毕后,再合并这些约束频繁项得到大型数据库的频繁项集.实验结果表明新算法所采用的数据库划分策略克服了FP-growth算法对大型数据库进行挖掘时,占用内存大,运行速度慢的不足,是一种适合于大型数据库的关联规则挖掘算法. 相似文献
12.
13.
一、引言
当前,各相关学科的飞速发展,使得对计算机速度、系统可靠性和成本实效性的要求提高,这必将促使发展另外的计算机模型来取代传统结构的计算机.另外,随着计算机网络的出现以及实际应用中的要求,数据挖掘系统必须具有更好的可扩展性.分布式数据挖掘算法正是在这一背景下产生的,它是数据挖掘技术与分布式计算的有机结合. 相似文献
14.
韩成勇 《哈尔滨师范大学自然科学学报》2013,(4):51-54
ID3算法在分类数据挖掘中应用广泛,但其在对大规模训练样本集进行挖掘时,占用主存空间较大,且执行效率不高.运用属性约简和分组计数方法对训练样本集进行数据缩减,得到数据规模较小的新训练样本集,然后再运用ID3算法对新训练样本集进行分类挖掘.整个执行过程全部使用现代数据库技术和存储过程编程加以实现.实验表明,通过改进设计提高了ID3算法的执行效率,增强了算法的扩展性. 相似文献
15.
一种文本分类数据挖掘的技术 总被引:7,自引:0,他引:7
挖掘的理论和应用研究是数据挖掘领域一个新的重要分支,介绍了一种文本数据挖掘方法. 首先,论述了文本挖掘的意义和重要性,探讨了文本挖掘的定义和文本分类的一些形式,然后讨论了一个以数据预处理、特征提取、特征表示和特征匹配等文本分类的一些关键理论问题,并给出了一个基于该方法的文本分类系统的实验结果,实验结果表明了该方法的可行性. 相似文献
16.
17.
日新月异的数据库研究领域--数据库技术的回顾与展望 总被引:2,自引:0,他引:2
李建中 《黑龙江大学自然科学学报》2002,19(2):43-52
回顾十年来数据库技术的进展和主要成就,包括面向对象的和对象关系的数据库系统、多媒体数据的支持、并行数据库、Web数据集成与检索、三级存储器技术、数据仓库、数据挖掘、数据可视化技术.还讨论了影响数据库研究的三个重要趋势,即Internet/Web技术、程序逻辑和数据的统一管理技术、迅速发展的计算机硬件技术.最后,探讨了微型数据库系统、未来的联邦数据库系统、未来数据库系统的体系结构、程序逻辑和数据统一管理技术、结构化和半结构化数据的集成技术等几个主要数据库研究新方向. 相似文献
18.
数据聚类是将数据对象划分到不同的类或簇中,是数据挖掘中的一项重要技术.教育领域拥有海量的学生信息数据,把数据挖掘中的聚类技术引入其中,具有很强的实际价值.阐述了运用数据挖掘中改进的引入权重的聚类技术对成绩数据进行选择、预处理和挖掘分析等,展示了3个Matlab实验使成绩数据如何通过K-means算法进行聚类分析,并对3种运行结果的意义各自进行了显示与分析,同时指出了运行结果的不足及意义.针对学生实验中的分类原因进行了研究并在学生成绩分析中发现很多隐含着的不易发现的有价值信息,利用这些聚类结果提出了相应的教学措施及建议,从而有针对性地提高教学质量. 相似文献
19.