共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
征信是指对企业组织和个人的信用信息进行采集、整理、保存和加工,并向信息使用者提供的活动,其本质在于利用信用信息对金融主体进行数据刻画.长期以来,中国征信市场是以央行为主导的单一格局,在用户覆盖面和数据多样性方面,央行征信系统有很大的局限性.大数据为征信业提供了丰富的数据资源,也改变了征信产品的设计和生产方式,成为未来征信业发展的重要基石.中国大数据征信业尚处于起步阶段,大数据时代仍存在数据安全与隐私保护、征信产品创新、数据征信监管等问题,可谓机遇和挑战并存. 相似文献
3.
4.
5.
传统征信体系已经难以满足一些新兴业态的发展需求,由此催生了在互联网金融平台下大数据征信体系。首先回顾中国征信体系的发展,说明其现存的问题,以蚂蚁金服为研究对象,研究发现蚂蚁金服进行征信的过程是一个开源的"编译—反编译"的循环过程。最后结合蚂蚁金服大数据征信的应用以及传统央行征信体系的经验,提出了构建面向大众、开放互联的大数据征信平台的建议。 相似文献
6.
ETL是数据仓库构建中的核心环节,通过对传统的ETL架构体系的介绍,从数据抽取、数据转换等方面对ETL过程进行了改进,让数据转换环节在数据抽取和数据清洗加载的过程中同时进行,并增加了一个临时存储区,以此来缓解在数据抽取和转换过程中由于数据量太大或过于复杂而引起的数据拥堵和冗余的现象。通过改进后的ETL系统,可以提高整个数据仓库运行的效率,大大改善运行速度,提高了数据仓库的数据质量。 相似文献
7.
尹津其 《中国新技术新产品精选》2009,(19):22-22
基于WEB的数据抽取是当前相当热门的方向之一。本文对此作了一个比较全面的介绍,概括了基于WEB的数据抽取的主要概念和特点说明基于WEB的数据抽取所常用的技术。最后简单介绍了基于WEB数据抽取中的实际应用一例。 相似文献
8.
一种自动化的网页数据抽取方法 总被引:1,自引:0,他引:1
数据抽取是当前网络飞速发展的背景下衍生的一类技术。简单介绍了数据抽取技术的发展和研究现状,并针对目前数据抽取技术的不足提出了一种新的数据抽取方法.能够自动化地并高准确度地从网页上抽取数据。 相似文献
9.
基于数据仓库的销售分析系统的设计和实现 总被引:5,自引:0,他引:5
数据仓库是信息处理领域近几年出现的面向分析和决策的新技术 .介绍了数据仓库中数据模型的特点和设计方法 ,并通过一个销售分析系统的实例 ,详细阐述了数据仓库的数据建模、数据抽取和更新、多维数据模型的实现、数据呈现 4个过程 ,给出了一种基于数据仓库技术的决策分析系统的设计和实现方法 相似文献
10.
基于信息增益及归因理论,结合矩阵表示方法,建立了征信数据的关联规则挖掘模型,以解决征信数据关联规则挖掘模型的变量权重确定及变量取值的影响度问题.该模型提高了其决策结果的准确性和科学性,决策效率得到提升. 相似文献
11.
商业竞争日趋激烈的今天,单纯的联机事务处理系统已经不能满足管理者的决策支持要求,联机分析处理(OLAP)技术的出现具有重要意义.研究了目前联机分析处理的关键技术,数据仓库的经典解决方案,数据预处理的相关方法,提出了一种面向商业OLAP的并行数据抽取接口设计方案,并对设计过程中的数据清理、数据集成和变换、数据归约等数据预处理技术作了重点介绍和应用研究.最后结合实际应用阐明了提出的数据抽取方案对于实现商业OLAP功能的有效性和实用性. 相似文献
12.
本文从数据仓库的组成入手,系统的分析了数据仓库的整个体系结构;着重地介绍了在数据仓库的设计过程中必须注意三个关键的问题:选择数据仓库的目标数据库、数据抽取和转换工具及前端数据访问和分析工具。 相似文献
13.
14.
15.
针对广告抽取系统的实际需求,该文提出了利用XPath规则从包含多个广告的页面中抽取广告记录数据的方法.该文主要阐述了广告抽取系统核心模块的实现机制和系统架构.实验结果表明,该方法能够准确定位页面广告数据块,并且能较好提取块内广告记录信息,具有一定的实用价值. 相似文献
16.
乐丁惕 《海南大学学报(自然科学版)》2012,30(4):349-353
介绍了基于索引路径的数据抽取算法的不足,从代码角度和用户需求角度2个方面进行考虑,提出了一种进改良措施,有效地提升了数据抽取的准确率,从而大大减少了数据冗余.由于补充了记录、有效数据等定义,使得抽取出的数据仍然保有其在网页中的结构关系,为之后的语义标注工作带来了极大的方便,为深度网页(Deep Web)数据集成奠定了良好的基础. 相似文献
17.
袁鸿雁 《长春工程学院学报(自然科学版)》2010,11(1):108-110
由于HTML只描述数据怎样显示而不描述数据的内容,因此识别HTML表格并抽取其数据是Web信息抽取领域中重要的研究课题之一,针对现在包装器技术的不足提出了一种新的基于领域本体的HTML表格结构识别技术,为构造HTML表格信息抽取系统打下基础。 相似文献
18.
结合数据抽取处理的多源性、数据预处理功能的集成、数据抽取处理描述信息的重用等特征,讨论数据抽取事务逻辑划分及组件包设计。给出数据抽取包的定义、包的逻辑结构及可视化管理工具设计。提出用元数据生成数据抽取包,用DTS包作为数据抽取包的执行载体的方法,以提高数据传输性能和简化系统实现。 相似文献
19.
江启宇 《中国新技术新产品精选》2009,(17):29-29
介绍了一种基于ASP,NET的技术的线上考试系统,该系统实现了Internet上网络考试环境的设置、考试、管理,并针对考试数据的管理与分析进行了讨论,最后,给出了一种英语考试系统的设计思路和抽取试卷的方法及部分源代码。 相似文献
20.
建立工程建设领域信用信息共享平台,能够减少和杜绝暗箱操作、权力寻租、信用缺失等问题,对于解决工程建设领域突出问题和推进项目信息公开和诚信体系建设具有重要意义。本文分析了信用征信平台的系统框架、数据流向和关键技术。 相似文献