共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
随着Internet/Web技术的快速普及和迅猛发展,使各种信息可以以非常低的成本在网络上获得,如何在这个全球最大的数据集合中发现有用信息成为数据挖掘研究的热点.Web数据挖掘是目前数据挖掘领域中的一个很重要的研究领域,文章介绍了Web数据挖掘研究领域的现状及发展. 相似文献
3.
药物创新领域的大数据主要来源于高通量实验、高效能模拟计算、信息化、科技出版物和专利文献4个方面.这些大数据使我们有可能在系统层面上看到药物分子与许多靶标相互作用的新现象、新规律,提高药物创新的效率,也带来新的挑战,如存储、标引/标注和质控、可视化、数据挖掘和计算复杂度等问题.这些问题可以通过在超算和云服务技术的支持下发展并行计算方法而逐渐得到解决.从离散、不完备且信噪比低的大数据中难以找到物质活性与结构之间的连续函数关系,贝叶斯学习机及其与支持向量机、决策树技术的组合是大数据挖掘的发展方向.大数据既是科学实验通量化和社会信息化的结果又是原因,正确解决大数据挖掘问题是提高药物创新效率的核心. 相似文献
4.
地质科学大数据及其利用的若干问题探讨 总被引:2,自引:0,他引:2
《科学通报》2016,(16)
地质科学大数据是一种时空大数据,其特征与一般大数据有相似之处,也有显著差别.为了应对挑战,需要引进大数据理论、方法和技术,开展对地质科学大数据的统合和利用.采用大数据技术直接在海量时空数据和文本数据中挖掘知识,能突破采样随机性和样本空间狭小、仅凭少量观测数据和固有模式进行判断,以及传统数据分析方法的限制,有可能取得地质科学的新发现.目前常用的一系列数学地质方法和一般空间数据挖掘方法,经改造可用于地质科学时空大数据挖掘.大数据时代地质科学发展所涉及的关键科学技术问题,包括结构化数据与半结构化非结构化数据、大数据与小数据、混杂性数据与精确性数据、模型与数据、静态勘查模型与动态监测模型等的一体化存储管理和处理,数据挖掘与数据分析的结合、相关关系与因果关系的统一,地质科学大数据的深度挖掘和可视化."玻璃地球"是地质科学大数据的有效载体,开展"玻璃地球"建设是解决上述各种科学技术问题的最佳途径之一. 相似文献
5.
Web数据挖掘现状分析 总被引:1,自引:0,他引:1
随着Internet/Web技术的快速普及和迅猛发展,使各种信息可以以非常低的成本在网络上获得,如何在这个全球最大的数据集合中发现有用信息成为数据挖掘研究的热点。Web数据挖掘是目前数据挖掘领域中的一个很重要的研究领域,文章介绍了Web数据挖掘研究领域的现状及发展。 相似文献
6.
遗传进化理论由美国密歇根大学J.Holland教授提出,它借鉴生物遗传机制,以群体方法进行自适应搜索,受到广泛关注,并在科学研究中得到广泛应用。数据挖掘从大量数据中提取信息与知识,遗传算法具有群体搜索策略和简单的遗传算子,可以实现整个数据空间上的分布式信息搜索和采集,在数据挖掘领域得到广泛应用。本文综述了遗传算法的起源、基本原理和特点,介绍了数据挖掘的应用和发展,阐述了近年来遗传算法在分类系统挖掘和关联规则挖掘方面的应用。最后对遗传算法在数据挖掘中的应用前景和面临的挑战进行了分析和展望。 相似文献
7.
近红外光谱分析技术作为一种绿色分析技术,在许多领域中已得到广泛应用.随着应用的深入和拓展,近红外光谱的数据类型逐渐从传统数据变成近红外光谱大数据.本文总结了近红外光谱的预处理、奇异样本筛选、多元校正和模型转移等技术及其在相关领域的应用.对近红外光谱大数据分析技术的初步研究,包括近红外光谱在工业品在线检测、不同批次产品鉴别中的应用以及近红外光谱物联网系统等也进行了综述.此外,对于近红外光谱大数据未来的发展及近红外光谱大数据云平台的基本功能、软硬件的设计与开发、建设过程中需要解决的问题等进行了详细阐述. 相似文献
8.
大数据技术的迅猛发展对计算效率提出了更高的要求.由于量子系统的独特性质,量子计算具有经典计算不具有的量子超并行计算能力,能够对某些重要的经典算法进行加速.人们发现,除了大数分解算法,量子计算的更多用途是对量子体系的仿真计算和在数据分析领域的应用.近年来,大数据和量子计算开始融合.虽然实际使用的量子计算机尚未建成,量子计算在大数据的应用在理论上已经取得了一些重要的进展.实验上也有了一些发展.本文首先介绍量子计算的基本原理和Grover量子算法.随后以量子机器学习作为切入点,介绍了量子计算在数据挖掘领域的应用. 相似文献
9.
随着移动互联网、云计算、物联网、机器类型通信等新兴信息通信技术的飞速发展,信息社会进入了网络化的大数据时代.快速普及的智能化移动终端应用助推了全球移动数据流量的大幅度增长.在移动大数据时代,海量数据、业务类型演进、数据多样化、数据空-时域分布不均匀等特征给无线网络带来了严峻的挑战.为了应对挑战,一方面,无线网络从新频谱拓展、传输技术、智能立体化组网等多维度进行演进以满足大数据传输与应用的需求;另一方面,移动大数据作为一种新的生产要素改变着人们认知网络的方法,无线网络可以充分借鉴互联网数据挖掘的理论与方法,实现网络的灵活部署、无线资源的优化配置和低能耗绿色通信. 相似文献
10.
大数据时代,以数据驱动的药物研发(data-driven drug research and development)方式有望显著提高药物研发成功率、缩短药物研发周期以及降低药物研发成本.本文简短综述了近年来药物设计和药物信息相关数据整合和数据挖掘的最新研究概况,并对大数据时代的药物设计与药物信息研究提出了展望. 相似文献
11.
崔辰州 于策 肖健 何勃亮 李长华 樊东卫 王传军 曹子皇 范玉峰 洪智 李珊珊 米琳莹 裘实 万望辉 王建国 王甲卫 尹树成 郝晋新 薛艳杰 刘梁 陈肖 张海龙 谌俊毅 乔翠兰 苏丽颖 《科学通报》2015,(Z1):445-449
天文学已经进入数据密集型时代或者说大数据时代.面对海量天文数据在存储、计算、网络、软件、算法乃至工作模式等方面的需求和挑战,天文学家连同计算机和信息技术领域的专家正努力使基于科学数据的知识发现过程变得更加容易.虚拟天文台旨在实现科学数据的互操作,打造一个全球性的数据网格.天文信息学则从分支学科的高度来考虑天文学的长远发展.数据挖掘和知识发现在数据密集型时代大有可为,自身也必将获得长足发展.本文简要论述天文学研究在数据密集型时代所面临的挑战,介绍虚拟天文台理念和最新进展,探讨天文信息学发展的必要性和所包含的研究内容,阐明数据挖掘和知识发现的必要性和发展方向. 相似文献
12.
13.
14.
继互联网、物联网、云计算之后,大数据已成为当今信息技术领域的发展热点.大数据在带来"大"价值的同时,也存在"大"安全问题.大数据的基本特征对计算设施、存储、网络、信息资源等提出了更高的安全要求,传统的信息安全手段和管理机制已经跟不上大数据时代的信息安全形势发展.本文在研究大数据安全新特点的基础上,分析了我国大数据发展面临的信息基础设施自主可控程度低、安全防护技术和手段不足等问题;阐述了自主可控对大数据安全的重要性和意义,明确了解决大数据安全的根本之道在于实现我国主要信息产品、设备和技术的自主设计制造,并总结了我国在大数据安全领域自主可控产品的发展现状.大数据安全事关国家安全,本文最后从加强大数据战略规划和安全体系建设、构建中国特色自主可控的发展路线、强化大数据技术在信息安全领域的创新应用等3个方面,探讨提出了解决我国大数据安全的策略和办法,以确保我国大数据时代的信息安全逐步朝着体系化、规范化和技术自主可控的方向发展. 相似文献
15.
随着计算机应用技术的发展,神经网络及以数据库技术和数据库管理系统为基础的数据挖掘技术广泛地应用在现代高科技领域中,成为处理以信息化为主体的装备维修保障系统中大量信息的主要技术手段.文章通过对神经网络的概念、过程以及装备维修保障系统中涉及的数据挖掘方法及系统的实现对上述问题进行了论述. 相似文献
16.
对肿瘤登记和大数据的发展、大数据对肿瘤登记的作用和影响进行了系统回顾,大数据和肿瘤登记近年发展快速,大数据的发展促进了肿瘤登记的发展,而肿瘤登记发展又推动了大数据的进步.在大数据的影响下,肿瘤登记将向以下几个方向发展:(ⅰ)肿瘤登记自动化;(ⅱ)及时收集、整合和更新不同来源的肿瘤数据,提高肿瘤资料的质量、可用性和易用性,推动肿瘤资料的开放和共享,扩展肿瘤资料的应用;(ⅲ)各级医疗卫生信息中心的出现将彻底改变肿瘤登记模式;(ⅳ)采用大数据的技术和方法建立各级肿瘤数据中心;(ⅴ)医院肿瘤登记逐步开展,人群肿瘤登记覆盖率大幅提高,部分省将全民开展肿瘤登记.肿瘤登记自动化的理念和技术,迎合了大数据和肿瘤登记发展的趋势,并可借鉴应用到其他疾病的监测和研究. 相似文献
17.
科学大数据与数字地球 总被引:9,自引:0,他引:9
大数据研究正发展为科技、经济、社会等各领域的关注焦点,诸多国家已将大数据研究上升至国家战略层面.本文从时空角度论述了大数据的缘起、内涵与发展势态,分析了科学大数据成为科学研究新途径的历程——科学范式开始从模型驱动向数据驱动发生转变.给出了科学大数据的定义及科学大数据计算的应对策略.进一步地论述了数字地球学科的基本理论框架和数字地球中的数据系统,指出了数字地球学科具有大数据的鲜明特点.最后以"胡焕庸线"形成机理的空间认知研究为例,具体阐述了数字地球学科中的大数据研究的理论和方法. 相似文献
18.
分子科学是化学的核心,也是生物、材料、药学等学科的基础.传统的分子科学研究通过实验或理论手段进行,研究成本高、周期长,难以处理高复杂度体系.随着大数据时代的到来,数据驱动的人工智能研究已成为继实验、理论和模拟之后的第4种科学研究范式.数据驱动的机器学习凭借其快速高效的数据处理能力,在分子科学领域展现出巨大的发展潜力.尤其是在分子性质预测、分子设计、化学反应预测及逆合成、量子化学计算、自动化合成等领域获得了广泛应用.本文首先介绍面向分子科学数据智能研究过程中的3个关键部分,即分子科学开放数据集、分子描述符和机器学习算法;然后,列举机器学习在不同分子科学研究方向中的重要应用案例;最后,分析讨论该研究领域可能存在的挑战及潜在发展方向. 相似文献
19.
随着信息技术的迅速发展,各行各业积累的数据都呈现出爆炸式增长趋势,我们已经进入大数据时代.大数据在很多领域都具有广阔的应用前景,已经成为国家重要的战略资源,对大数据的存储、管理和分析也已经成为学术界和工业界高度关注的热点.收集、存储、传输、处理大数据的目的是为了利用大数据,而要有效地利用大数据,机器学习技术必不可少.因此,大数据机器学习(简称大数据学习)是大数据研究的关键内容之一.哈希学习通过将数据表示成二进制码的形式,不仅能显著减少数据的存储和通信开销,还能降低数据维度,从而显著提高大数据学习系统的效率.因此,哈希学习近年来成为大数据学习中的一个研究热点.本文对这方面的工作进行介绍. 相似文献
20.
太阳耀斑是指发生在太阳表面局部区域中突然和大规模的能量释放过程.它是空间环境的主要扰动源,对地球空间环境造成很大影响.太阳耀斑预报是空间天气预报的重要组成部分,对其研究具有重要的实用价值和科学意义.现有的大部分太阳耀斑预报模型是从观测数据提取预报因子,利用各种统计和数据挖掘技术建立预报因子与耀斑发生之间的关系模型,利用建立的模型对未来时间的耀斑发生进行预报.在预报研究中,预报因子、预报方法和预报模型是3个主要研究领域.其中预报因子的选取和数据处理尤为重要,是建立预报模型的前期工作.预报因子主要采用太阳黑子、磁场参量和分形因子等.预报方法包括统计方法、机器学习方法和数据同化方法.统计方法在早期的耀斑预报建模中用的较多,随着数据挖掘技术的发展,越来越多的机器学习方法应用到预报模型中并取得了较好效果.而近期发展的数据同化方法有更好的模型修正能力.预报模型早期基本使用静态模型,后来发展起来的动态模型具有更强的优势;而自组织临界模型在物理方面给了耀斑发生更多的解释.本文分别从这3个方面总结了耀斑预报的研究进展,结合中国科学院国家天文台太阳活动预报中心的工作,评述了一些重要的研究成果.最后,对未来的研究方向进行了总结和展望. 相似文献