共查询到20条相似文献,搜索用时 62 毫秒
1.
后基因组时代的显著特点是大规模基因组和蛋白质组实验平台所产生的大量高通量数据,整合并利用基因组和蛋白组信息成为这一时代的主要挑战之一. 因此,基因-基因相互作用将有助于理解细胞内基因之间的相互作用以及信号传导通路研究提供有价值的参考. 为预测酵母基因组中基因-基因相互作用,我们利用高通量数据中的蛋白-蛋白相互作用、遗传表型数据、基因微阵列表达数据以及功能基因注释数据等来分析酵母中的基因-基因相互作用. 本文建立的预测方法为在系统水平上理解酵母基因组中的基因功能提供了依据,也为揭示酵母基因组中的基因-基因相互作用网络奠定理论基础. 相似文献
2.
Hadoop平台下MapReduce模型的数据分配策略研究 总被引:2,自引:0,他引:2
针对Hadoop开源云计算平台下MapReduce并行编程模型中间数据分配不均衡的问题,提出基于抽样的改进型MapReduce模型,即SMR(Sample MapReduce)模型.SMR模型采用MapReduce作业方式对各分块数据集进行并行抽样,基于抽样结果,利用LAB(leen and balance)均衡算法对Map端输出的中间数据进行均衡分配,以改善Reduce端处理数据负载不均衡问题.实验结果表明:改进型MapReduce模型可以有效减少作业运行时间,Reduce端输入数据达到负载均衡. 相似文献
3.
针对海量数据的存储问题,传统方法一般是通过购置更多数量的服务器来提升计算和存储能力,存在硬件成本高,存储效率低等缺点。通过对Hadoop框架和MapReduce编程模型等云计算核心技术的分析和研究,提出了一种基于Hadoop框架的海量数据存储模型,并在此模型的基础上,设计并实现了基于Hadoop的校园云存储系统。经过实验验证,该系统有效地解决了在校园办公、教学和科研过程中遇到的海量数据存储管理问题,具有开发成本低、处理速度较快、运行稳定、易于扩展等特点。 相似文献
4.
云环境中基于金字塔模型的影像数据存储方法 总被引:1,自引:0,他引:1
随着卫星遥感获取技术的发展,影像数据量呈几何式增长,传统数据存储技术已经无法适应海量影像数据的处理要求.结合金字塔模型和MapReduce架构提出了一种适用于云计算环境的分布式并行存储方法—BMLStorage(storage based on MapReduce and local file system),该方法基于金字塔模型对影像数据进行分层分块处理,并对所得瓦片重新编码.定义了一种新的存储规则,使得所有瓦片可以按照此规则利用Hadoop中的MapReduce框架实现并行存储.实验表明,该方法与现有方法相比,在海量影像数据存储性能方面有一定的提高. 相似文献
5.
随着云计算环境中数据量的激增,人们急需研究在云环境下如何对大量数据进行快速有效的分析与处理。在云环境下对大量数据进行高效地排序是其中一个重要问题。基于Hadoop平台研究并实现了几种高效的排序算法,包括:Radix sort,Quicksort和Sample sort算法。对各个排序算法的执行效率、CPU资源的消耗,内存的消耗,以及处理机间的通信量进行了研究和比较分析。通过大量运行在Hadoop上的实验,发现Hadoop平台上的Sample sort相较于Radix sort和Quicksort具有排序速度快,负载均衡度高,CPU消耗低等优势。这一结果为云计算环境下设计更高效、节能的算法提供了有效的依据和基础。 相似文献
6.
针对云计算环境下海量数据面临易泄露、非法篡改等安全问题以及RSA(Rivest-Shamir-Adle-man)等通用加密算法安全级别低、计算复杂的缺点,提出了一种云环境下基于椭圆曲线的数据加密方案.该方案基于椭圆曲线集成加密模式(Elliptic Curve Integrated Encryption Scheme,... 相似文献
7.
基因相互作用是生物信息学中的重要课题,主要研究在非等位基因缺失条件下基因之间的功能联系,为细胞信号通路分析和药物重定位等提供了新的方向.经典的基因相互作用定义方式采用确定的预期中立函数,但是这种固定的中立函数往往不能反映具体实验数据的特征,而基于机器学习定义基因相互作用的方法可以较好地解决这个问题.首先,通过回归分析方... 相似文献
8.
基于MapReduce实现的Apriori简单并行算法,产生了大量值为1的键/值对,影响了算法效率.提出一种分组统计策略的Apriori并行算法,有效地减少了键/值对的产生.实验结果表明,改进的基于MapReduce并行的Apriori算法在时间性能上有了很大的提升,并且随着集群节点的增加,算法的加速比线性提高. 相似文献
9.
Hadoop利用统一的备份机制来确保数据的可用性和容错性.然而对于重要的文件块,只能通过修改配置文件来设置副本数量.通过分析电信业数据仓库文件的访问情况,提出文件备份与存放动态调整算法(BPDA)来提高数据局部性,以减少数据传输带来的I/O和网络消耗,提高查询效率.运用多副本一致性哈希算法,概率采样和竞争力弱化算法,得到每一个文件的最佳备份数和备份位置.实验结果验证了该算法可以提高查询关联效率. 相似文献
10.
利用序列的频谱曲线和信噪比曲线,建立基因识别的简化算法.提出可变窗宽的DFT算法,代数推导出Voss映射和Z-curve映射下频谱和信噪比的函数关系.运用Bootstrap算法,在精度指标下比较四组具有代表性的基因序列的阈值. 相似文献
11.
基于Hadoop建立云计算系统 总被引:1,自引:0,他引:1
云计算是2007年底正式提出的一个新概念,本文分析了云计算的特征和Hadoop的作用地位.针对Hadoop这样一个在集群上运行大型数据库处理应用程序的开放式源代码框架进行了云计算平台的实现,并进行了实验验证. 相似文献
12.
肖茵 《科技情报开发与经济》2014,(1):143-146
介绍了云计算的基本原理,提出了GFS的改进模型,并将云计算运用于实际工作中,设计了基于云计算的图书管理平台,讨论了实现图书管理平台的主要技术。 相似文献
13.
杜晓娟 《浙江万里学院学报》2014,(2):28-31,35
云物流是吸收了云计算和电子商务平台的基本理念,形成独特的“平台开放,资源共享,服务集成,终端无限”的一种新型商业模式,不同于传统的物流与快递企业商业模式。文章对云物流的概念及特征进行了阐述,进而对云物流应用于快递行业的依据做出详细的解析。 相似文献
14.
龙文 《科技情报开发与经济》2012,22(9):50-53
云计算的出现为构建现代数字图书馆体系提供了全新的思维方式,极大地促进了数字图书馆的发展和应用。在对现有数字图书馆存在的问题进行分析和研究的基础上,探讨了一个基于云计算的数字图书馆平台架构,希望能够有效发挥云计算分布式计算以及网络存储的优势,促进资源共享,为用户提供快捷、方便、高效的服务,提高数字图书馆的服务效率和水平。 相似文献
15.
MapReduce is a very popular parallel programming model for cloud computing platforms, and has become an effective method for processing massive data by using a cluster of computers. X-to-MapReduce (X is a program language) translator is a possible solution to help traditional programmers easily deploy an application to cloud systems through translating sequential codes to MapReduce codes. Recently, some SQL-to-MapReduce translators emerge to translate SQL-like queries to MapReduce codes and have good performance in cloud systems. However, SQL-to-MapReduce translators mainly focus on SQL-like queries, but not on numerical computation. Matlab is a high-level language and interactive environment for numerical computation, visualization, and programming, which is very popular in engineering. We propose and develop a simple Matlab-to-MapReduce translator for cloud computing, called M2M, for basic numerical computations. M2M can translate a Matlab code with up to 100 commands to MapReduce code in few seconds, which may cost a proficient Hadoop MapReduce programmer some days on coding so many commands. In addition, M2M can also recognize the dependency between complex commands, which is always confusing during hand coding. We implemented M2M with evaluation for Matlab commands on a cluster. Several common commands are used in our experiments. The results show that M2M is comparable in performance with hand-coded programs. 相似文献
16.
为了对大规模的数据访问和海量海洋信息的处理提供可靠实时的云计算服务, 结合工作流与软件即服务(software-as-a-service, SaaS)的思想, 提出软件服务流的概念, 并构建基于云平台的软件服务流体系结构的系统. 服务流引擎在整个系统中处于底层, 与Hadoop平台进行交互, 运行自行设计的服务流解析与重组算法处理用户请求, 并交付下层执行, 且为上层提供资源表述性转移(representational state transfer, REST)架构风格的服务流监控和资源管理的透明接口, 降低了开发的复杂性, 提高系统的可伸缩性. 用户能够通过Web端访问, 定制个性化软件服务, 并且能实时监控云平台. 在该平台上, 大规模数据访问、高并发以及高密度的访问也是一种常态. 通过构建初步的原型系统, 证明平台体系结构的可用性和高效性. 相似文献
17.
宋智玲 《青岛大学学报(自然科学版)》2010,23(2):52-56,81
给出了一个云计算的在线交易平台架构设计,利用云计算提供的无限虚拟计算能力使高复杂度的在线交易平台成为可能,并利用分层思想将异构、分布式的数据集成,实现了数据集的共享和算法模块的复用与集成,为搭建一个统一开放的、分布式、并行在线交易平台提供了理论基础与架构支持。 相似文献
18.
张媛 《甘肃教育学院学报(自然科学版)》2013,(5):82-84
Hadoop是一套开放的云计算平台,使用Map Reduce处理数据的分割与合并,简单的设置就可使用云计算的强大功能.但随之而来的是个人数据在没有任何保护的情况下随时可能遭受攻击,因此云平台上的个人信息安全问题就显得格外重要.本研究提出了一种具备安全数据传输的Hadoop云平台规则来增加云数据分割与合并的安全度.实验结果证明,本安全方案确实提高了云平台数据传输的安全性. 相似文献
19.
李慧慧 《太原师范学院学报(自然科学版)》2013,(4):109-112
文章针对云计算技术的发展现状,分析了云管理平台的重要性及在资源池中的位置,构建了一种云管理平台的设计方案,研究了该方案的实现方法,测试了该系统的可行性.通过对云管理平台的研究,为云计算的构建提供了参考性. 相似文献
20.
设计了一种基于云计算技术的流媒体服务平台体系结构,针对此服务平台提出了一种面向云计算资源的自适应负载均衡方法,以提高平台的资源利用率以及减少服务拒绝率.测试结果表明:此方法适用于流媒体云服务平台的负载均衡调度. 相似文献