首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 296 毫秒
1.
陈刚 《科学通报》2015,(Z1):439-444
现代科学研究的一个重要模式就是大科学项目,其特点是大科学装置和合作,并产生海量的科研数据.数据密集型的大科学项目对数据的采集、存储、分发和处理有着巨大的需求.本文以大科学项目为案例讨论了科研大数据在数据采集、处理、存储以及网络等方面的挑战,以及相应的应对方法.其中,国际上的高能物理实验每年产生数十拍字节(PB)的数据,这些数据需要妥善地记录和保存下来,并高效地分发到世界各地进行分析处理.高能物理学家基于网格技术合作建立了大数据处理的WLCG网格平台,该平台成功地支持了大型强子对撞机实验数据的处理和分析,同时也支持了其他大科学项目,取得很好的效果.另外,为了解决对数据的高效存储和访问,新的存储技术和网络技术,如软件定义网络和云存储等,被开发应用到科学大数据中.最后还介绍了云计算技术在科研大数据中的应用.  相似文献   

2.
钟雷鸣 《科学通报》1993,38(1):68-68
自从1962年,美国Norris等人发表第一篇近红外光谱分析应用文章以来,近红外光谱技术在许多领域得到越来越广泛的应用。近红外漫反射光谱(NIRDRS)用作农作物品质分析因其简便、快速、无化学污染等优点而受到重视。已有的光谱定量分析方法,如多元线性回归(MLR)、主成分分析(PCA)、偏最小二乘(PLS)、卡尔曼滤波(KF)等,都是假定样品吸光度A与浓度C呈线性关系,但实际上由于仪器的或物理、化学的原因,A与C只是一种近似的线性关系。文献[2]从理论上推导了近红外漫  相似文献   

3.
数据是重要的战略资源,大数据挖掘技术已成为学术界、企业界甚至各国政府关注的热点.本文介绍了大数据的基本概念及发展现状,综述了与化学研究有关的大数据研究状况,讨论了大数据在基础理论与关键技术2个层面上的主要问题以及大数据挖掘技术在化学各领域中的应用,并对大数据发展的未来及其在化学学科中的应用前景进行了展望.  相似文献   

4.
李武军  周志华 《科学通报》2015,(Z1):485-490
随着信息技术的迅速发展,各行各业积累的数据都呈现出爆炸式增长趋势,我们已经进入大数据时代.大数据在很多领域都具有广阔的应用前景,已经成为国家重要的战略资源,对大数据的存储、管理和分析也已经成为学术界和工业界高度关注的热点.收集、存储、传输、处理大数据的目的是为了利用大数据,而要有效地利用大数据,机器学习技术必不可少.因此,大数据机器学习(简称大数据学习)是大数据研究的关键内容之一.哈希学习通过将数据表示成二进制码的形式,不仅能显著减少数据的存储和通信开销,还能降低数据维度,从而显著提高大数据学习系统的效率.因此,哈希学习近年来成为大数据学习中的一个研究热点.本文对这方面的工作进行介绍.  相似文献   

5.
申学易  买晓琴  刘超 《科学通报》2015,(11):986-993
基于互联网的大数据收集是社会认知领域的新兴研究手段.本文主要介绍了基于以MTurk,Micro Turk等为代表的、具有交易功能的大型行为数据网络收集平台进行的社会认知领域的研究,从网络平台大数据采样的数据质量和大数据对社会认知领域新方向的启发两方面进行阐述,总结了网络大数据在样本范围和数量、分析方法和实验情境上相比传统实验室数据采集的优势和不足.虽然互联网平台的大数据收集还有无法完全控制被试完成任务、存在难以通过大量样本平衡的变量等一系列问题,但这一研究方式的社会性生态效度佳,且在纵向研究和社会行为的网络化分析等方面表现出独有优势,在社会认知领域的研究中具有广阔的应用前景.  相似文献   

6.
科学大数据与数字地球   总被引:9,自引:0,他引:9  
郭华东  王力哲  陈方  梁栋 《科学通报》2014,(12):1047-1054
大数据研究正发展为科技、经济、社会等各领域的关注焦点,诸多国家已将大数据研究上升至国家战略层面.本文从时空角度论述了大数据的缘起、内涵与发展势态,分析了科学大数据成为科学研究新途径的历程——科学范式开始从模型驱动向数据驱动发生转变.给出了科学大数据的定义及科学大数据计算的应对策略.进一步地论述了数字地球学科的基本理论框架和数字地球中的数据系统,指出了数字地球学科具有大数据的鲜明特点.最后以"胡焕庸线"形成机理的空间认知研究为例,具体阐述了数字地球学科中的大数据研究的理论和方法.  相似文献   

7.
周琳  孔雷  赵方庆 《科学通报》2015,(Z1):547-557
在过去的10年中,以基因组学、医学遗传学和神经信息学等为代表的生命科学各研究领域,以前所未有的增长趋势,积累了海量的数据信息.这些数据类型复杂、数量庞大,其中蕴含的价值更是不可估量.通过传统的处理手段,难以理清海量原始数据中错综复杂的关联信息.而针对生物大数据的可视化研究,将有利于科研人员对复杂数据进行多角度观察并获取有效信息.生物数据量越大,复杂性越高,可视化在生物有效信息挖掘方面发挥的作用就越大.本文通过例举若干生物机构中心现存的数据规模和数据增长速率,说明生物研究领域已进入大数据时代,然后由生物数据的组成特征及可视化的特点引出生物大数据可视化的重要性和必要性.本文总结了生命科学研究领域中不同类型生物大数据的可视化研究进展,最后讨论了目前生物大数据可视化所面临的挑战,并提出可能的解决方案.  相似文献   

8.
王书浩  龙桂鲁 《科学通报》2015,(Z1):499-508
大数据技术的迅猛发展对计算效率提出了更高的要求.由于量子系统的独特性质,量子计算具有经典计算不具有的量子超并行计算能力,能够对某些重要的经典算法进行加速.人们发现,除了大数分解算法,量子计算的更多用途是对量子体系的仿真计算和在数据分析领域的应用.近年来,大数据和量子计算开始融合.虽然实际使用的量子计算机尚未建成,量子计算在大数据的应用在理论上已经取得了一些重要的进展.实验上也有了一些发展.本文首先介绍量子计算的基本原理和Grover量子算法.随后以量子机器学习作为切入点,介绍了量子计算在数据挖掘领域的应用.  相似文献   

9.
王辉  刘娜  逄仁波  孙晓宇 《科学通报》2015,(Z1):479-484
全球海洋预报是当前国内外海洋预报领域的前沿方向之一,与实施海洋强国战略、维护国家海洋权益,以及开发深远海资源等各类海洋活动日益走向深海大洋的迫切需求有着密切的关系.全球海洋预报的突出特点是使用并生成海量的数据,充分体现了大数据的基本特征.本文从论述大数据的起源、概念和本质开始,介绍了全球海洋预报的基本理论,进一步结合数据同化、模式数据和产品分发等3个方面具体阐述了全球海洋预报中使用的观测数据和生成的模式数据等大数据.最后展望了全球海洋预报以及海洋大数据未来发展中面临的挑战和亟需解决的关键科学问题.  相似文献   

10.
继互联网、物联网、云计算之后,大数据已成为当今信息技术领域的发展热点.大数据在带来"大"价值的同时,也存在"大"安全问题.大数据的基本特征对计算设施、存储、网络、信息资源等提出了更高的安全要求,传统的信息安全手段和管理机制已经跟不上大数据时代的信息安全形势发展.本文在研究大数据安全新特点的基础上,分析了我国大数据发展面临的信息基础设施自主可控程度低、安全防护技术和手段不足等问题;阐述了自主可控对大数据安全的重要性和意义,明确了解决大数据安全的根本之道在于实现我国主要信息产品、设备和技术的自主设计制造,并总结了我国在大数据安全领域自主可控产品的发展现状.大数据安全事关国家安全,本文最后从加强大数据战略规划和安全体系建设、构建中国特色自主可控的发展路线、强化大数据技术在信息安全领域的创新应用等3个方面,探讨提出了解决我国大数据安全的策略和办法,以确保我国大数据时代的信息安全逐步朝着体系化、规范化和技术自主可控的方向发展.  相似文献   

11.
生物医学大数据的现状与展望   总被引:1,自引:0,他引:1  
宁康  陈挺 《科学通报》2015,(Z1):534-546
生物医学是一门新兴的前沿交叉学科,它综合了医学、生命科学和生物学的理论和方法而发展起来.近年来随着先进仪器装备与信息技术等越来越广泛和深入的整合到生物技术中来,生物医学研究中越来越频繁的涉及到大数据存储和分析等信息技术.大数据时代的来临对生物医学研究产生了重大影响.其中,一个重要发展趋势就是由假设驱动向数据驱动的转变.数十年来分子生物学水平上的实验目的是获得结论或者是提出一种新的假设,而现在基于海量生物医学大数据,可以对海量数据的研究来探索其中的规律,直接提出假设或得出可靠的结论.随着先进的生物分析技术的不断推出和更新,生物医学数据迅速积累.基于此类大数据一些以往不能解决的问题将有望解决,同时相关生物医学研究的新问题也层出不穷.生物医学相关的大数据技术和相关应用主要包括:基于高通量测序的个性化基因组、转录组和蛋白组研究,单细胞水平基因型和表型研究,人类健康相关微生物群落研究,生物医学图像研究等.相关生物医学大数据分析任务均具有着数据密集和计算密集的双密集性特点.要充分地利用这些大数据解决一系列生物医学问题,迫切需要高通量、高效率、高准确性的生物信息存储和分析策略.本文总结和回顾生物医学大数据的生成、管理和分析相关的一系列问题,其中重点讨论人体微生物群落、单细胞表型和基因型、生物医学图像等新近出现的生物医学大数据形式,以及相关数据分析和应用前景等.基于目前生物医学大数据的现状我们可以发现,生物医学大数据的研究正处于蓄势待发状态:适应于生物医学大数据的软硬件平台、大数据存储、大数据分析挖掘等方法等还不成熟,制约着生物大数据的研究.然而一旦相关研究获得突破并有所优化和应用,将会全方位地支撑生物医学大数据的深入解构;进而有助于对医学现象的趋势分析和预测,服务于相关的遗传疾病研究、公共卫生监控、医疗与医药开发等广泛生物医学应用.  相似文献   

12.
张梦霖  盛国平  俞汉青 《科学通报》2009,54(8):1089-1092
利用近红外光谱技术对废水厌氧发酵处理过程进行分析监测. 主要通过正交信号校正法(OSC)对监测厌氧反应器的近红外光谱数据进行预处理, 并分别结合蒽酮法和气相色谱法对底物-蔗糖浓度和液相产物-挥发性脂肪酸浓度的测定结果, 建立了厌氧发酵过程中蔗糖和挥发性脂肪酸浓度的预测模型. 在预测集中蔗糖的预测浓度与实测浓度吻合较好, 而挥发性脂肪酸的各组分以及总挥发性脂肪酸的预测结果也同样令人满意. 研究结果表明, 通过与化学计量学的结合, 近红外方法可以快速、准确地测定厌氧发酵过程中液相中各组分的浓度变化, 为厌氧发酵过程的在线监测提供了新的思路.  相似文献   

13.
大数据时代的数据素养教育   总被引:1,自引:0,他引:1  
正数据素养是大数据时代对科研人员所提出的要求。国外各大学已在广泛开展数据素养教育。在中国,如何提高下一代科学家的数据素养,使他们具备在大数据时代开展科学活动的能力,是一项紧迫的重要任务。随着信息技术和网络技术的迅速发展,科学研究数据呈现爆炸性增长的态势。利用各种各样的研究工具和实验设备,通过模拟、仿真、计算和观察,在科学研究过程中不断产生和创造出大量"原生态数字信息",形成特定科学领域的数据集和数据场。如美国大规模科学项目"泛星计划"(全景式巡天望远镜和快速反应系统),每年在运行中可捕获2.5PB(1PB=10~(15)字节)的数据;国际上高能物理学研究领域的LHC(大型强子对撞机)每年能产生50~100PB的数据;小规模研究  相似文献   

14.
对肿瘤登记和大数据的发展、大数据对肿瘤登记的作用和影响进行了系统回顾,大数据和肿瘤登记近年发展快速,大数据的发展促进了肿瘤登记的发展,而肿瘤登记发展又推动了大数据的进步.在大数据的影响下,肿瘤登记将向以下几个方向发展:(ⅰ)肿瘤登记自动化;(ⅱ)及时收集、整合和更新不同来源的肿瘤数据,提高肿瘤资料的质量、可用性和易用性,推动肿瘤资料的开放和共享,扩展肿瘤资料的应用;(ⅲ)各级医疗卫生信息中心的出现将彻底改变肿瘤登记模式;(ⅳ)采用大数据的技术和方法建立各级肿瘤数据中心;(ⅴ)医院肿瘤登记逐步开展,人群肿瘤登记覆盖率大幅提高,部分省将全民开展肿瘤登记.肿瘤登记自动化的理念和技术,迎合了大数据和肿瘤登记发展的趋势,并可借鉴应用到其他疾病的监测和研究.  相似文献   

15.
陈国良  毛睿  陆克中 《科学通报》2015,(Z1):566-569
大数据是当前IT信息技术研究和应用的热点,但目前的研究多集中在系统和应用层面,而理论基础研究方面相对较少.本文以计算复杂性理论为基础,针对大数据量大、快速和多样性等挑战,着重研究大数据的可计算性及其计算原理.首先将多种类型的大数据抽象到度量空间进行统一化表示以解决多样性问题,其次在度量空间中基于距离对大数据进行划分,最后运用NC类计算理论等并行计算理论和方法对大数据问题进行并行求解,以解决量大和快速等问题.本文从更广的视角,根据大数据的特性和大数据整个生命周期,提出处理大数据的策略和技术以及需要变革思维方法研究大数据.  相似文献   

16.
在大数据时代,数据已经渗透至各个行业,并且呈现出数量大、动态性、类型复杂等显著特征,尤其是互联网金融等为代表的典型行业.本文简要阐述了大数据的研究现状与重大意义,探讨了大型数据资源服务平台架构及其3个主要组成部分:数据资源识别和获取、数据资源存储和分析、服务支撑平台,并介绍了项目组在面向可信网络金融交易的大型数据分析研究与应用方面所开展的工作.具体来讲,围绕软件行为认证等关键技术,研究并开发了以行为认证为核心的可信网络金融交易系统,支持在线交易过程中产生的用户行为数据与软件行为数据的实时监控和动态展示.  相似文献   

17.
严鑫  丁鹏  刘志红  王领  廖晨钟  顾琼  徐峻 《科学通报》2015,(Z1):558-565
药物创新领域的大数据主要来源于高通量实验、高效能模拟计算、信息化、科技出版物和专利文献4个方面.这些大数据使我们有可能在系统层面上看到药物分子与许多靶标相互作用的新现象、新规律,提高药物创新的效率,也带来新的挑战,如存储、标引/标注和质控、可视化、数据挖掘和计算复杂度等问题.这些问题可以通过在超算和云服务技术的支持下发展并行计算方法而逐渐得到解决.从离散、不完备且信噪比低的大数据中难以找到物质活性与结构之间的连续函数关系,贝叶斯学习机及其与支持向量机、决策树技术的组合是大数据挖掘的发展方向.大数据既是科学实验通量化和社会信息化的结果又是原因,正确解决大数据挖掘问题是提高药物创新效率的核心.  相似文献   

18.
赵岑  李梦然  金日峰 《科学通报》2015,(Z1):450-452
针对中美两国在大数据时代对隐私保护的现状进行了对比,从法律保护和社会保护两个角度分别进行了分析,指出在美国大数据的发展与隐私保护的冲突已经呈现出较为激烈的态势.在我国大数据发展暂时还没有威胁到社会公众的隐私意识,但及早关注大数据发展,并科学合理地设计与制定隐私与大数据权衡的法律与政策已经迫在眉睫.  相似文献   

19.
张平  崔琪楣  侯延昭  徐瑨 《科学通报》2015,(Z1):433-438
随着移动互联网、云计算、物联网、机器类型通信等新兴信息通信技术的飞速发展,信息社会进入了网络化的大数据时代.快速普及的智能化移动终端应用助推了全球移动数据流量的大幅度增长.在移动大数据时代,海量数据、业务类型演进、数据多样化、数据空-时域分布不均匀等特征给无线网络带来了严峻的挑战.为了应对挑战,一方面,无线网络从新频谱拓展、传输技术、智能立体化组网等多维度进行演进以满足大数据传输与应用的需求;另一方面,移动大数据作为一种新的生产要素改变着人们认知网络的方法,无线网络可以充分借鉴互联网数据挖掘的理论与方法,实现网络的灵活部署、无线资源的优化配置和低能耗绿色通信.  相似文献   

20.
基于光谱分析快速、简便的优点,利用光谱标准谱库与未知样品光谱图进行比对,是未知样品定性分析的重要手段.随着"大数据时代"的来临,互联网的发展使得全球各存储端的光谱数据库都可以调用,数据量显著增加,这给需要进行逐一比对的传统方法的分析速度带来了巨大压力.本文就此问题进行探讨,提出一种基于正交基光谱的新型比对算法,用于大数据背景下的光谱快速比对.该方法基于不同结构化合物具有典型特征光谱这一基本化学规律,通过提取各类化合物有代表性的特征光谱信息构建正交基光谱,称为基谱,利用基谱与未知样品谱图进行比对,参照提出的判断原则综合比较以得到正确的比对结果.构建的基谱具有明确的化学意义,表征了其对应光谱的特征光谱信息.同时,由于基谱具有正交性,原始光谱的特征不能在其对应的基谱中完全体现出来,但可以利用基谱进行构建,不丢失有用信息.以标准拉曼光谱数据库Aldrich Raman库为例进行方法验证,完成了5种烃类化合物的比对,正判率为93.94%.本方法可以进一步应用于其他结构(如不同取代基数目)化合物的细分比对,并有望推广到其他光谱数据库.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号