大数据并行计算框架 |
| |
作者姓名: | 陈国良 毛睿 陆克中 |
| |
作者单位: | 深圳大学计算机与软件学院;广东省普及型高性能计算机重点实验室;深圳市服务计算与应用重点实验室 |
| |
基金项目: | 国家高技术研究发展计划(2012AA01A309);国家自然科学基金委-广东联合基金(U1301252);国家自然科学基金(61170076,61471243);广东省重点实验室建设项目(2012A061400024);深圳市科技计划项目(JCYJ20120613155632545,SGLH20131010163759789,JCYJ2014 0418095735561)资助 |
| |
摘 要: | 大数据是当前IT信息技术研究和应用的热点,但目前的研究多集中在系统和应用层面,而理论基础研究方面相对较少.本文以计算复杂性理论为基础,针对大数据量大、快速和多样性等挑战,着重研究大数据的可计算性及其计算原理.首先将多种类型的大数据抽象到度量空间进行统一化表示以解决多样性问题,其次在度量空间中基于距离对大数据进行划分,最后运用NC类计算理论等并行计算理论和方法对大数据问题进行并行求解,以解决量大和快速等问题.本文从更广的视角,根据大数据的特性和大数据整个生命周期,提出处理大数据的策略和技术以及需要变革思维方法研究大数据.
|
关 键 词: | NC类计算 度量空间 数据划分 可计算性 |
本文献已被 CNKI 等数据库收录! |
|