共查询到20条相似文献,搜索用时 62 毫秒
1.
牟清亮 《中国新技术新产品精选》2010,(20):221-221
企业统计工作是对企业发展的内部和外部信息进行援集和整理,对企业的生产经营情况进行统计调查和统计分析、提供统计资料、实施统计监督的过程:企业统计工作不仅是企业管理的要求,同时也要满足国家宏观经济管理的需要。本文阐述了企业统计的应用性的作用及准确可靠的统计信息,便于决策和管理者正确地把握形势,客观地剖析问题,做出科学的决策。 相似文献
2.
讨论基于数据规约的近似挖掘技术,在数据预处理阶段对海量数据集进行数据规约.近似数据挖掘的工作流程包括任务定义、数据准备与预处理、数据挖掘建模、结果的解释与评估、模型发布与应用5个阶段.同时,提出使用属性选择和实例选择方法实现近似挖掘的方案,并对该方案进行挖掘效率和结果模型准确性的分析评估.该方案能满足对企业级大数据集进行高效挖掘的需要. 相似文献
3.
通过大数据技术对海量的用户贡献内容构建数据分析系统框架,以酒店为例,进行多维度分析及可视化应用。基于TripAdvisor网站的列表和点评信息,通过分布式爬虫框架爬取所需的数据,经过数据预处理,采用分布式文件系统存储数据,在此基础上运用统计建模及自然语言处理方法进行数据分析研究,借助第三方框架对分析结果进行可视化。研究者在使用该框架时,可以根据自身需求从多个维度进行数据分析及可视化应用。该框架能够有效地对旅游评论大数据进行多维度的统计分析,进而为旅游相关人员提供基于旅游评论大数据的参考信息。 相似文献
4.
浅谈MATLAB软件在教育统计中的应用 总被引:1,自引:0,他引:1
如何对实验结果进行统计分析,以得到准确有效的结论是教师进行教育实验研究中的一个重要问题.随着信息技术的发展,人们越来越多使用的计算机来处理数据.用MATLAB软件对教育实验数据进行统计分析是一个全新的思路,利用MATLB软件提供的统计功能,可以方便地进行教育统计分析如:数据分析、统计绘图以及数值计算等,简单易学,而且功能强大,可以在教育统计中广泛应用,以提高处理数据的效率和准确性. 相似文献
5.
数据挖掘中并行离散化数据准备优化 总被引:2,自引:0,他引:2
在海量数据挖掘中,针对元数据的离散化数据准备处理能有效提高数据挖掘效率.本文提出了一种并行比较并获得最优离散化的数据准备算法(AOA),针对不同数据集,先进行数据集的特性检测以获得数据集分布特性,按照分布特性进行数据集的异常值检测和剔除,并行完成与分布特性适配的离散化方法处理,通过比较不同离散化方法的熵、方差指数、稳定性参数的最小欧氏距离,根据三个参数自动化比选,获得最优离散化的预处理成果.仿真表明,对不同样本数据库进行关联规则挖掘结果中,比较四种固定的离散化数据预处理方法,在使用AOA数据准备算法并行比选出最优的离散化来数据预处理后,在不同最小支持度阈值情况下,挖掘得到关联规则数都更少,因此效率得到提高. 相似文献
6.
以现有的常见钢种的大气腐蚀数据为依据,利用Foxpro以Windows95为平台编制成具备数据管理,系统维护,数据统计预测,数据打印,系统帮助和退出7个功能模块的数据库管理系统,除现有数据库的功能外,本数据可对数据系统进行了统计分析,对金属在未来一定时间内的大气腐蚀进行预测。 相似文献
7.
探讨了联机数据挖掘中海量数据的预处理问题.提出了基于立方体的数据预处理算法.该算法可对数据进行有效的收集,并可有效地约简数据.实验证明对于数据泛化,这种预处理是很有效的. 相似文献
8.
郑伟安 《华东师范大学学报(自然科学版)》2014,2014(3):159-163
大数据是一个热门词,但还没有形成严格的理论基础。研究大数据的目的全在于应用。从数学形式来看,大数据与高维高频海量数据区别不大.从统计学的观点来看,研究大数据就是从高维高频的海量数据中找出一个较低维的平稳过程,然后利用大数定律(也叫遍历定理)找到其可用的价值。在金融交易中,这就是统计套利. 相似文献
9.
"大数据"时代,数据竞争已经成为企业的致胜之道。近年来随着信息化建设的不断深入,中国邮政积累了海量的生产数据和管理数据,这些数据的价值得到初步挖掘,并在邮政的经营和生产中发挥作用,邮政统计工作信息化也必将是在该背景下改进的主要方向。 相似文献
10.
11.
通过专家访谈、问卷调查收集智慧旅游评价指标数据,利用集值统计方法对数据进行预处理,结合因子分析建立智慧旅游评价指标体系。运用多元统计方法对中原地区游客喜欢的排名靠前的河南城市进行实证分析,得到其城市智慧旅游综合因子得分。结果表明:在智慧景区服务及游客体验智慧化建设方面旅游城市洛阳表现突出。 相似文献
12.
13.
基于术语集规模小、内容稳定、入度高、访问频率高、具有整体性的特性,提出了术语集冗余预处理.在此之上设计了符合海量资源描述框架(RDF)数据集特性的划分框架.与经典多层次图划分算法的对比实验结果表明:引入术语集冗余和边权重因子的划分框架适用于海量RDF划分任务,能够以较小的冗余开销有效地降低边切分,从而为上层计算提供了良好的数据分布管理基础. 相似文献
14.
15.
针对模糊评估的特点,通常采用集值统计方法对项目进行评估,由于传统的集值统计方法在对评估的结果进行可信性检验时,检验方案的缺陷使最终的结果具有失真性。文中在验证传统的集值统计法存在缺陷的同时,建立了在数据删除模型下的集值统计可信性检验,通过对评估区间进行检验和处理,提高了评估结果的可信度。 相似文献
16.
数据预处理在高速公路收费系统中的应用 总被引:1,自引:0,他引:1
本文利用数据预处理技术,将高速公路收费系统中的海量信息进行处理,去除数据中的重复、冗余以及错误信息,提高了系统的稳定性和高效性,也为系统的有效数据挖掘奠定了基础。本文基于最新的.NET技术,对数据预处理算法进行了具体实现,并结合SQL Server2005给出了实现结果。 相似文献
17.
利用“聘用制”归档材料的收集,对数据进行档案统计分析,发挥其档案管理工作职能,试图发现普遍性规律,彰显档案统计工作的活力,发挥档案统计工作的巨大潜能。 相似文献
18.
适用于大规模文本处理的动态密度聚类算法 总被引:2,自引:0,他引:2
针对传统的基于密度的聚类算法对海量数据处理时, 存在参数输入复杂及时间复杂度高的问题, 给出新的密度定义方法, 并在此基础上提出一种只需一个简单输入参数就能动态识别密度不均匀聚类簇的聚类算法, 同时将其扩充为可以处理海量数据的两阶段动态密度聚类算法。在人造数据集、大规模数据集以及中英文文本语料数据集上的实验表明, 所提出的算法具有输入参数简单和聚类效率高的特点, 可以应用于海量文本数据的聚类处理。 相似文献
19.
20.
Excel电子表格软件所具备的统计分析功能,对高校《体育统计》课程教学及学校体育教学、科研、管理等数据统计处理有重要的作用,很值得在体育教师中推广。本文着重介绍Excel 2000中的“数据分析”工具,在体育统计教学中有关描述统计和方差分析的使用方法。 相似文献