首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
过滤特征基因选择及演化硬件急性白血病分型   总被引:1,自引:0,他引:1  
提出一种基于虚拟可重构结构的内部演化硬件癌症分子分型方法. 为有效处理DNA微阵列数据和便于硬件实现,对比研究了5 种基于过滤模式的信息基因选择方法. 演化硬件通过系统学习和系统分类两个阶段对经过特征选择的信息基因进行处理. 对急性白血病数据集的实验结果表明,基于信噪比信息基因选择方法的演化硬件分类器识别率最高. 演化硬件具有和其他传统模式识别方法可比的识别率,识别时间仅需0.12 ms.  相似文献   

2.
针对常用的文本数据挖掘系统在处理海量文本数据时时间效率较低的问题,论文提出了一种基于改进Hadoop云平台的海量文本数据挖掘方法.该方法首先将传统Hadoop云平台进行改进以适应海量文本数据挖掘的需要,然后将海量文本数据集和挖掘任务分解到该改进平台上的多台计算机上并行处理,从而实现了一个基于改进Hadoop云平台的海量文本数据挖掘平台,并通过对10 000篇新闻材料组成的实验数据集进行挖掘验证了该平台的有效性和高效性.  相似文献   

3.
为实现火电厂环境信息的智能化远程监测,设计了一套火电厂环境智能监测系统.给出了该系统的4层架构,阐述了该系统功能模块的设计.通过基于STM32的智能采集终端采集到相应环境信息,将采集的数据汇集并通过WiFi网关结合工业以太网将数据上传到数据库服务器中进行存储及分析,并在应用服务器下通过基于JavaEE的Web显示技术将...  相似文献   

4.
为了更好地保留数据之间的同质性,提出了一种整合鲁棒结构化非负矩阵分解(integrated robust structured non-negative matrix factorization, iRSNMF)模型,并在该模型中引入一个结构化项.将该模型用于癌症样本聚类实验和基因共表达网络分析,以验证其有效性.根据现有文献对相关基因和通路进行生物学解释.实验结果表明,iRSNMF模型聚类性能较好并且能够挖掘到的关键基因更多.用iRSNMF模型获得的基因和通路在癌症的发病机制中起着重要作用,并为癌症诊断、治疗和预后提供了新的思路.  相似文献   

5.
随着计算机和网络在人们工作和生活中的广泛普及,图片数据也成几何倍地急剧膨胀。面对日益增多的海量图像数据,如何进行有效的存储及图像信息数据的快速挖掘,是目前需要解决的主要问题。本文借助云平台Hadoop的分布式文件系统(HDFS)和分布式并行计算框架(MapReduce),进行海量数字图像的数据挖掘。构建基于Hadoop云平台的海量数字图像数据挖掘系统,实现海量数字图像信息数据挖掘。  相似文献   

6.
为了汇总、归类和整合网络上杂乱无章的职位信息,设计基于Python的职位画像系统,该系统将招聘网站的招聘页面进行划分.利用Python使用Encode、Xpath和正则表达式的爬取规则设计网页爬取器,获得职位信息.利用My SQL数据库存储爬取的数据,并进行数据清洗及分析,使用Flask和Echarts实现数据可视化.该系统通过图表直观展现职位画像,帮助用户了解目前各个领域职位的需求情况,为用户提供参考,同时从各个维度搭建职位检索功能.测试结果表明,该系统具有高效的爬取效率.  相似文献   

7.
在电子商务中的信息流、物流和资金流三大平台中,每天将产生海量的大数据,而电子商务信息系统最核心的能力是对大数据进行处理、分析和挖掘。本文重点介绍电子商务大数据分析的指标体系。通过电子商务大数据分析的指标体系的研究,可以使大数据驱动电子商务运营精细化,提升运营效果和业绩。  相似文献   

8.
针对目标用户所感兴趣的图书具体特征,开发了一种基于意见挖掘技术结合图分类器的图书推荐系统.首先,基于图的分类器技术对图书条目进行分类;然后,挖掘出图书条目的评价信息,并根据评价内容判定评价的正反面;最后,结合两组技术实现图书的个性化推荐.通过实际案例的数据进行计算,以精确率和召回率评价依据进行综合评价,结果证明了提出的推荐系统的可行性和实用性.  相似文献   

9.
为全面了解汉氏葡糖醋杆菌(Komagataeibacter hansenii,K.hansenii)HDM1-3的发酵特性,为提高纤维素产量提供基因组信息,对其基因组数据进行测序分析。采用PacBio RSⅡ平台对该菌株进行全基因组测序,基因组由1个3 659 612 bp染色体和2个质粒组成,编码3 820个蛋白质,含有7个纤维素合成酶基因。基于16S rRNA的系统发育分析表明了K.hansenii HDM1-3相对于醋酸杆菌科菌株的进化地位。在基因组中,共注释到碳水化合物活性酶88个。通过KEGG注释到代谢通路相关基因共3 132个,其中碳水化合物代谢相关基因287个。通过基因组测序获得了K.hansenii HDM1-3完整的基因组信息,为改造该菌株提供了基因组学基础。  相似文献   

10.
为打破传统孤立、分散的系统形成的"信息孤岛"效应,确保异构联盟系统中用户相关信息的可信性和安全性,针对异构联盟系统中提出了一种基于二层区块链的用户信任协商模型.该模型借助区块链技术对用户行为数据进行防篡改保护,形成用户行为数据区块链(第1层区块链);以这些行为数据为基础,计算出用户的信任值,形成用户信任区块链(第2层区块链).通过仿真实验及安全性分析可知,区块链的特征能够识别出恶意用户和恶意联盟系统.表明该模型能实现用户行为、信任值不可篡改及信任信息在联盟系统成员间协商.  相似文献   

11.
一种文本分类数据挖掘的技术   总被引:7,自引:0,他引:7  
挖掘的理论和应用研究是数据挖掘领域一个新的重要分支,介绍了一种文本数据挖掘方法. 首先,论述了文本挖掘的意义和重要性,探讨了文本挖掘的定义和文本分类的一些形式,然后讨论了一个以数据预处理、特征提取、特征表示和特征匹配等文本分类的一些关键理论问题,并给出了一个基于该方法的文本分类系统的实验结果,实验结果表明了该方法的可行性.  相似文献   

12.
在数据采掘中,运用传统的粗略集模型能对完整的数据库进行所需的规则抽取。在此基础上研究了广义粗略集模型对不完整数据库的数据采掘问题。  相似文献   

13.
Web文本分类是Web数据挖掘的一个重要研究方向,它是在通过经验数据训练得到的分类体系下,根据网页的文本内容自动判别网页类别的过程,本文提出一种综合粗糙集与支持向量机的Web文本分类模型,利用粗糙集的属性约简方法,减少支持向量机训练数据的维数,提高Web文本分类的性能与效率.  相似文献   

14.
结合数据流的特点,提出了一种面向数据流挖掘的过程模型PM-DSM。针对目前数据流挖掘过程中存在算法众多但利用率低的问题,提出了一种基于Web服务的数据流挖掘过程模型算法管理框架PMAMF-DSM,描述了该框架的体系结构和运行机制,并用UML活动图给出了框架的实现语义。在Eclipse上基于该框架实现了一个数据流挖掘算法管理系统,实验结果表明了该框架的灵活性与自适应性。  相似文献   

15.
董贺  荣光怡 《松辽学刊》2008,29(4):107-108
分类算法是数据挖掘中的最重要的技术之一.通过对当前提出的最新的具有代表性的分类算法,从预测精度、学习效率、健壮性等方面进行深入的分析和比较,总结每类算法的各方面特性,从而便于研究者对已有的算法进行改进,提出具有更好性能的新的分类算法,同时方便使用者在应用时对算法的选择和使用.  相似文献   

16.
分类算法是数据挖掘、机器学习和模式识别中一个重要的研究领域.单一的分类算法一般会得到不同的分类结果,多分类器融合算法可以将各分类器的结果进行集成来提高系统的分类性能.该文提出一种多分类器融合算法进行分类分析,结果证明该算法在解决目标分类中具有优越性.  相似文献   

17.
摘要: 机场应急救援工作的规模决策对于抢救生命财产至关重要. 针对目前救援规模决策缺乏合理规则指导的问题, 提出了一种基于满意度控制的数据挖掘方法. 该方法将满意度理论中的选择函数和拒绝函数植入数据挖掘关联规则算法 中,在保持样本完好性的同时识别异样数据,控制挖掘进程,建立有效的机场应急救援辅助决策规则库,用以辅助决策 者作出更为科学合理的决策. 实验结果表明,该算法能挖掘出合理的应急救援规模决策规则,提高挖掘的准确性和效率.  相似文献   

18.
数据挖掘中数据预处理技术综述   总被引:17,自引:0,他引:17  
数据挖掘是数据库系统和信息决策领域的前沿研究方向。论述了数据预处理在数据挖掘中的重要地位,介绍了数据预处理所包含的内容和采用的方法。  相似文献   

19.
基于相似性的数据挖掘模型,主要是用于发现分布式资源之间的相似性,利用相似性,融合分布式数据库,减小数据挖掘的规模.本文主要介绍以关联规则中最大频繁项集为基础的一个相似性的度量方法,并根据对得到的相似性值的判断,来决定数据挖掘的数据源的引用规模.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号