首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
大数据时代,以数据驱动的药物研发(data-driven drug research and development)方式有望显著提高药物研发成功率、缩短药物研发周期以及降低药物研发成本.本文简短综述了近年来药物设计和药物信息相关数据整合和数据挖掘的最新研究概况,并对大数据时代的药物设计与药物信息研究提出了展望.  相似文献   

2.
近红外光谱分析技术作为一种绿色分析技术,在许多领域中已得到广泛应用.随着应用的深入和拓展,近红外光谱的数据类型逐渐从传统数据变成近红外光谱大数据.本文总结了近红外光谱的预处理、奇异样本筛选、多元校正和模型转移等技术及其在相关领域的应用.对近红外光谱大数据分析技术的初步研究,包括近红外光谱在工业品在线检测、不同批次产品鉴别中的应用以及近红外光谱物联网系统等也进行了综述.此外,对于近红外光谱大数据未来的发展及近红外光谱大数据云平台的基本功能、软硬件的设计与开发、建设过程中需要解决的问题等进行了详细阐述.  相似文献   

3.
陈国良  毛睿  陆克中 《科学通报》2015,(Z1):566-569
大数据是当前IT信息技术研究和应用的热点,但目前的研究多集中在系统和应用层面,而理论基础研究方面相对较少.本文以计算复杂性理论为基础,针对大数据量大、快速和多样性等挑战,着重研究大数据的可计算性及其计算原理.首先将多种类型的大数据抽象到度量空间进行统一化表示以解决多样性问题,其次在度量空间中基于距离对大数据进行划分,最后运用NC类计算理论等并行计算理论和方法对大数据问题进行并行求解,以解决量大和快速等问题.本文从更广的视角,根据大数据的特性和大数据整个生命周期,提出处理大数据的策略和技术以及需要变革思维方法研究大数据.  相似文献   

4.
大数据时代的数据素养教育   总被引:1,自引:0,他引:1  
正数据素养是大数据时代对科研人员所提出的要求。国外各大学已在广泛开展数据素养教育。在中国,如何提高下一代科学家的数据素养,使他们具备在大数据时代开展科学活动的能力,是一项紧迫的重要任务。随着信息技术和网络技术的迅速发展,科学研究数据呈现爆炸性增长的态势。利用各种各样的研究工具和实验设备,通过模拟、仿真、计算和观察,在科学研究过程中不断产生和创造出大量"原生态数字信息",形成特定科学领域的数据集和数据场。如美国大规模科学项目"泛星计划"(全景式巡天望远镜和快速反应系统),每年在运行中可捕获2.5PB(1PB=10~(15)字节)的数据;国际上高能物理学研究领域的LHC(大型强子对撞机)每年能产生50~100PB的数据;小规模研究  相似文献   

5.
我国天然气管道建设在过去的10年取得了巨大的发展,目前中国的长输管道总数量已达到12.5×104 km.随着管道系统的运行时间增长和材料性能的老化,由管道腐蚀、失效泄漏引起的事故频发,并且由于管径的增大和运行压力的提高,事故后果严重性也随之提高,特别是对高后果区的影响更为严重.油气管道的安全问题越来越受到重视.因此,提取管道腐蚀性影响因素、发现风险演变规律对于预测预防管道泄漏尤为重要.由于数字化管道已经逐步建立,设计、施工、运行过程中产生大量的数据得以保存,内检测数据信号总量也达到TB级别,这些均为腐蚀分析提供了信息基础.本文基于大数据的方法,融合管道系统在设计、施工、运行过程中产生的结构化和非结构化数据,基于互信息理论方法,建立腐蚀等级与多因素之间的关联模型.通过现场数据验证模型的有效性,确定影响管道腐蚀的关键因素,为管道寿命预测奠定基础.结论表明,利用管道"大数据"挖掘管道各数据集之间的关联关系,可用于获取管道腐蚀信息,为事故预防提供依据.除此之外,该方法还可以在确定主要因素之后缩小管段范围,研究其中某一种因素,如进一步确定腐蚀与哪一种土壤的相关性更强.  相似文献   

6.
科学大数据与数字地球   总被引:9,自引:0,他引:9  
郭华东  王力哲  陈方  梁栋 《科学通报》2014,(12):1047-1054
大数据研究正发展为科技、经济、社会等各领域的关注焦点,诸多国家已将大数据研究上升至国家战略层面.本文从时空角度论述了大数据的缘起、内涵与发展势态,分析了科学大数据成为科学研究新途径的历程——科学范式开始从模型驱动向数据驱动发生转变.给出了科学大数据的定义及科学大数据计算的应对策略.进一步地论述了数字地球学科的基本理论框架和数字地球中的数据系统,指出了数字地球学科具有大数据的鲜明特点.最后以"胡焕庸线"形成机理的空间认知研究为例,具体阐述了数字地球学科中的大数据研究的理论和方法.  相似文献   

7.
由于XML有易用、可理解、跨平台的优点,可有效地解决跨平台数据的交换问题,以此设计一种安全的、能有效访问和快速更新的XML访问控制新方案。该方案利用多种授权实现了权限不同的多个用户灵活、安全访问XML文档数据,根据操作类型区分不同的数据传输请求,过滤掉不具权限的请求,以节省验证以及标记过程所耗费的内存等系统资源,实现了数据传输的优化。  相似文献   

8.
赵岑  李梦然  金日峰 《科学通报》2015,(Z1):450-452
针对中美两国在大数据时代对隐私保护的现状进行了对比,从法律保护和社会保护两个角度分别进行了分析,指出在美国大数据的发展与隐私保护的冲突已经呈现出较为激烈的态势.在我国大数据发展暂时还没有威胁到社会公众的隐私意识,但及早关注大数据发展,并科学合理地设计与制定隐私与大数据权衡的法律与政策已经迫在眉睫.  相似文献   

9.
1.什么是原子分子数据所谓“原子分子数据”,是有关单个原子、分子的各种性质以及有关原子分子之间或者原子、分子与电子、光子之间相互作用的各种数据的总称,它包括原子能级、分子构造方面的数据,以及原子分子的光吸收几率、由电子碰撞引起的原子分子的电离截面等等数据。另外,在化学反应速度方面,特别是比较简单的分子在气相反应中的数据,也属于原子分子数据的范畴。  相似文献   

10.
陈刚 《科学通报》2015,(Z1):439-444
现代科学研究的一个重要模式就是大科学项目,其特点是大科学装置和合作,并产生海量的科研数据.数据密集型的大科学项目对数据的采集、存储、分发和处理有着巨大的需求.本文以大科学项目为案例讨论了科研大数据在数据采集、处理、存储以及网络等方面的挑战,以及相应的应对方法.其中,国际上的高能物理实验每年产生数十拍字节(PB)的数据,这些数据需要妥善地记录和保存下来,并高效地分发到世界各地进行分析处理.高能物理学家基于网格技术合作建立了大数据处理的WLCG网格平台,该平台成功地支持了大型强子对撞机实验数据的处理和分析,同时也支持了其他大科学项目,取得很好的效果.另外,为了解决对数据的高效存储和访问,新的存储技术和网络技术,如软件定义网络和云存储等,被开发应用到科学大数据中.最后还介绍了云计算技术在科研大数据中的应用.  相似文献   

11.
李淹博  江俊  罗毅 《科学通报》2023,(17):2184-2196
分子科学是化学的核心,也是生物、材料、药学等学科的基础.传统的分子科学研究通过实验或理论手段进行,研究成本高、周期长,难以处理高复杂度体系.随着大数据时代的到来,数据驱动的人工智能研究已成为继实验、理论和模拟之后的第4种科学研究范式.数据驱动的机器学习凭借其快速高效的数据处理能力,在分子科学领域展现出巨大的发展潜力.尤其是在分子性质预测、分子设计、化学反应预测及逆合成、量子化学计算、自动化合成等领域获得了广泛应用.本文首先介绍面向分子科学数据智能研究过程中的3个关键部分,即分子科学开放数据集、分子描述符和机器学习算法;然后,列举机器学习在不同分子科学研究方向中的重要应用案例;最后,分析讨论该研究领域可能存在的挑战及潜在发展方向.  相似文献   

12.
地质科学大数据及其利用的若干问题探讨   总被引:2,自引:0,他引:2  
地质科学大数据是一种时空大数据,其特征与一般大数据有相似之处,也有显著差别.为了应对挑战,需要引进大数据理论、方法和技术,开展对地质科学大数据的统合和利用.采用大数据技术直接在海量时空数据和文本数据中挖掘知识,能突破采样随机性和样本空间狭小、仅凭少量观测数据和固有模式进行判断,以及传统数据分析方法的限制,有可能取得地质科学的新发现.目前常用的一系列数学地质方法和一般空间数据挖掘方法,经改造可用于地质科学时空大数据挖掘.大数据时代地质科学发展所涉及的关键科学技术问题,包括结构化数据与半结构化非结构化数据、大数据与小数据、混杂性数据与精确性数据、模型与数据、静态勘查模型与动态监测模型等的一体化存储管理和处理,数据挖掘与数据分析的结合、相关关系与因果关系的统一,地质科学大数据的深度挖掘和可视化."玻璃地球"是地质科学大数据的有效载体,开展"玻璃地球"建设是解决上述各种科学技术问题的最佳途径之一.  相似文献   

13.
大规模蛋白质相互作用数据的分析与应用   总被引:10,自引:2,他引:8  
孙景春  徐晋麟  李亦学  石铁流 《科学通报》2005,50(19):2055-2060
蛋白质相互作用在生命活动中起着重要的作用. 目前已开发出几种实验和计算方法能够得到大规模蛋白质相互作用数据. 但是, 与传统的实验结果相比, 蛋白质相互作用大规模数据中存在着比例较高的假阳性. 为了能够充分利用这些数据, 需要建立生物信息学方法对这些数据进行系统的评价, 进而提高数据的可信度, 并从中挖掘出有价值的生物信息. 本文对目前蛋白质相互作用大规模数据的计算分析和应用进行了总结, 包括蛋白质相互作用数据评估方法、与蛋白质其他信息的关系以及在生物学研究中的应用, 并提出了开发分析和挖掘蛋白质相互作用数据工具的主要方向, 以期有助于这些数据的研究和应用.  相似文献   

14.
随着科学技术的不断发展进步,日文操作系统的研发成为新兴产业.日文系统下,数据交换和储存尤为重要,由于数据格式不同,容易造成数据的破损和丢失.根据以上问题,设计出日本系统下的文本数据实时监测,并将其转换成XML文档的模块,便于数据的储存,已解决日文环境下数据破损和丢失的问题.  相似文献   

15.
张云泉  徐葳  龙桂鲁 《科学通报》2015,(Z1):425-426
<正>在大数据应用技术需求的推动下,大数据科学研究和应用已经成为科技领域中的热点.同时人们开始从这些工程实践中提炼出一些共性的思路、方法和工具,开启了一门新科学——数据科学.从思想方法上,数据科学研究继承了统计学的一些思想,例如在大量数据上做统计性的搜索、比较、聚类或分类等分析归纳,其结论是一种相关性,而并非一定是某种因果关系.虽然都依赖大量的计算,但数据科学与计算机模拟不同,并非是基于一个已知的数学模型,而是用大量数据的相关性取代了因果关系和严格  相似文献   

16.
挖掘大数据     
数据是无处不在的,只要人类的活动依旧,且观测行为始终存在,那么数据就会不断产生.一旦数据被记录下来,它就会成为历史的一个投影,被保存在各种各样的信息媒介中.不过在互联网时代,数据早已挣脱了简单的数字束缚,它不仅可以是符号、文字、语音,更可以是图像或视频.  相似文献   

17.
李曼丽  黄振中 《科学通报》2015,(Z1):570-580
随着大数据技术和大规模在线开放课程(MOOCs)的不断发展,基于MOOCs平台数据的教育研究也日益涌现.然而,相关研究在研究问题、理论基础和研究方法等方面还有待进一步探索.MOOCs平台大数据将为教育问题的研究提供不同类型的数据,有助于打破以往的一些限制.目前来看,基于MOOCs平台大数据的教育实证研究可能会出现聚焦MOOCs本身的研究、大规模在线开放式研究和应用于经典教育研究框架内的研究3种类型.  相似文献   

18.
生物医学大数据的现状与展望   总被引:1,自引:0,他引:1  
宁康  陈挺 《科学通报》2015,(Z1):534-546
生物医学是一门新兴的前沿交叉学科,它综合了医学、生命科学和生物学的理论和方法而发展起来.近年来随着先进仪器装备与信息技术等越来越广泛和深入的整合到生物技术中来,生物医学研究中越来越频繁的涉及到大数据存储和分析等信息技术.大数据时代的来临对生物医学研究产生了重大影响.其中,一个重要发展趋势就是由假设驱动向数据驱动的转变.数十年来分子生物学水平上的实验目的是获得结论或者是提出一种新的假设,而现在基于海量生物医学大数据,可以对海量数据的研究来探索其中的规律,直接提出假设或得出可靠的结论.随着先进的生物分析技术的不断推出和更新,生物医学数据迅速积累.基于此类大数据一些以往不能解决的问题将有望解决,同时相关生物医学研究的新问题也层出不穷.生物医学相关的大数据技术和相关应用主要包括:基于高通量测序的个性化基因组、转录组和蛋白组研究,单细胞水平基因型和表型研究,人类健康相关微生物群落研究,生物医学图像研究等.相关生物医学大数据分析任务均具有着数据密集和计算密集的双密集性特点.要充分地利用这些大数据解决一系列生物医学问题,迫切需要高通量、高效率、高准确性的生物信息存储和分析策略.本文总结和回顾生物医学大数据的生成、管理和分析相关的一系列问题,其中重点讨论人体微生物群落、单细胞表型和基因型、生物医学图像等新近出现的生物医学大数据形式,以及相关数据分析和应用前景等.基于目前生物医学大数据的现状我们可以发现,生物医学大数据的研究正处于蓄势待发状态:适应于生物医学大数据的软硬件平台、大数据存储、大数据分析挖掘等方法等还不成熟,制约着生物大数据的研究.然而一旦相关研究获得突破并有所优化和应用,将会全方位地支撑生物医学大数据的深入解构;进而有助于对医学现象的趋势分析和预测,服务于相关的遗传疾病研究、公共卫生监控、医疗与医药开发等广泛生物医学应用.  相似文献   

19.
张平  崔琪楣  侯延昭  徐瑨 《科学通报》2015,(Z1):433-438
随着移动互联网、云计算、物联网、机器类型通信等新兴信息通信技术的飞速发展,信息社会进入了网络化的大数据时代.快速普及的智能化移动终端应用助推了全球移动数据流量的大幅度增长.在移动大数据时代,海量数据、业务类型演进、数据多样化、数据空-时域分布不均匀等特征给无线网络带来了严峻的挑战.为了应对挑战,一方面,无线网络从新频谱拓展、传输技术、智能立体化组网等多维度进行演进以满足大数据传输与应用的需求;另一方面,移动大数据作为一种新的生产要素改变着人们认知网络的方法,无线网络可以充分借鉴互联网数据挖掘的理论与方法,实现网络的灵活部署、无线资源的优化配置和低能耗绿色通信.  相似文献   

20.
当本期刊物出版之时,大数据在商界(特别是电子商务)和技术圈内(不仅是信息技术人士)肯定已经不再是一个新鲜话题.人们现在乐观地预计,就像计算机改变20世纪那样,大数据将能改变21世纪,虽然大数据的现实和潜在影响可能极为广泛,然而目前专业人士最关注的是大数据可能带来的巨大商业价值,我看到证券公司发的报告居然成为国内大数据研究的先驱(虽然对其质量无法恭维).而本刊这次组织的一组文章,涉及美国政府和地区的大数据计划、在科研领域的新发展,还包括大数据对你我日常生活可能产生的影响,从那些议题看,这组文章来得还不算太迟.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号