首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
数据仓库数据加载技术   总被引:2,自引:0,他引:2       下载免费PDF全文
数据仓库中的数据不是传统数据库中数据的简单堆积,其数据的组织必须方便基于数据仓库基础之上的数据挖掘和商业智能工作,为决策者提供访问、分析及共享信息的能力,从而发挥数据仓库的真正功效。成功构造一个数据仓库的关键在于自始至终理解用户需要,紧紧围绕用户目标这一主题进行数据的搜集和存储。首先分析数据仓库的特点及拥有的数据类别及组成,重点介绍如何从现有数据库中有效地将数据引导至数据仓库的方法和策略,具体给出了数据仓库中5种不同类别数据的加载方法。  相似文献   

2.
邵天会  胡建华 《河南科学》2012,30(11):1601-1604
由于数据库中处理数据标准不同,当用户构建数据仓库时,会产生不同效果的问题.而ETL作为数据处理的基本工具,能够在数据仓库构建的过程中提供稳定、高效、可靠的数据.ETL在数据仓库创建过程中起着举足轻重的地位,构建一种基于ETL多点缓存技术的数据仓库,可为用户提供一种稳定的、高质量的数据仓库.  相似文献   

3.
本文对呼叫中心构建数据仓库系统做了一些研究,并提出了呼叫中心数据仓库解决方案,建立了与呼叫平台相关的分析主题,以期望给用户提供运营决策以及呼叫中心运行状况的一些参考数据。  相似文献   

4.
通过分析用户获取网络信息所面临的问题,对现存网络信息进行评估,在开源的页面分析工具HtmlParser基础上提出了基于模板技术的产品信息定制模型.该模型根据产品定制系统页面提供的定制条件,生成用户抓取模板,系统根据此模板输出数据到用户显示界面,实现了系统信息的灵活定制和信息抓取的复用.  相似文献   

5.
6.
如何迅速从海量数据中获得准确的决策信息是现代商业企业致胜的关键.以数据仓库及OLAP Services为工具,通过建立多维数据模型和数据立方体,针对企业销售数据设计一个数据仓库管理系统,把事务数据库中原始混乱的数据集成转化变成数据仓库中规范的数据方便用户的查询,进而辅助企业决策.实际证明系统实用方便,大大提高企业信息管理效率.  相似文献   

7.
如何迅速从海量数据中获得准确的决策信息是现代商业企业致胜的关键。以数据仓库及OLAPServices为工具,通过建立多维数据模型和数据立方体,针对企业销售数据设计一个数据仓库管理系统,把事务数据库中原始混乱的数据集成转化变成数据仓库中规范的数据方便用户的查询,进而辅助企业决策。实际证明系统实用方便,大大提高企业信息管理效率。  相似文献   

8.
提出了一种基于采集和管理地理信息数据的数据仓库模型,这个模型允许用户使用由不同探测源采集上来的环境数据并有权将其规范化,以方便浏览和分析.并且用户还可以通过使用分布式计算方法和网络应用程序加工处理这些数据。  相似文献   

9.
Web日志预处理中会话识别的优化   总被引:3,自引:0,他引:3  
针对目前的各种会话识别方法,提出了一种优化的会话切分方法.该方法基于对用户下载时间、对页面的平均阅读时间及页面的链入、链出数等几个参数的综合,得到每个用户页面的访问时间阈值,根据该阈值来切分用户会话,得到会话侯选集合;然后,根据用户对页面内容的兴趣度、浏览特性等来删除会话中的链接页面和不感兴趣的页面,生成一种最终有效的访问页面序列,从而为以后的模式发现提供良好的数据.实验结果表明,相对于所有用户使用单一先验阈值和使用统计方法结合页面内容确定阈值的方法,笔者提出的方法能更准确地确定页面访问时间阈值,得到更为合理有效的会话集合.  相似文献   

10.
本文给出了一种Web用户和页面的模糊聚类算法.在该算法中,通过Web日志中的数据,根据用户对Web页面的浏览情况分别建立Web用户和页面的模糊集,在此基础上用最大-最小法的模糊相似性度量构造模糊相似矩阵,并由此构造模糊动态聚类算法.  相似文献   

11.
用户对Web站点的访问代表了用户对Web站点上页面的访问兴趣,这种兴趣程度可以通过用户对Web站点上页面的浏览顺序及页面上的浏览时间表现出来.通过对Web用户访问路径的分析,提出一种基于浏览路径及浏览时间的相似度的度量方法.然后,把粗糙度的概念引入Leader聚类算法中,提出粗糙Leader聚类算法.最后使用标准数据集进行了试验,证明基于此种相似度计算方法,应用粗糙Leader聚类算法Web用户的有效性.  相似文献   

12.
基于MAS的Web用户数据预处理   总被引:1,自引:2,他引:1  
数据预处理是采用基于Web的使用挖掘发现用户模式的第一步.由于Web用户数据来源的不同,不仅导致用户的识别困难,用户访问页面的完整性也难于得到保证,这给下一步的用户模式发现带来了问题.本文提出了一个基于MAS的数据预处理方法:在客户端采用Agent精确捕获用户浏览行为,构造用户访问图;在服务器端的Agent保存服务器生成页面,并根据客户端Agent返回的数据完整获得用户的访问内容,为有效实现用户模式发现提供了保证.  相似文献   

13.
分析数据仓库在我国企业中的应用现状.认为目前我国企业数据仓库的应用主要存在对数据仓库的概念理解不深,对项目的长期性、艰巨性认识不足,数据库系统中数据的积累不够,用户没有参与数据仓库建设的需求分析,项目实施过程中的管理混乱,具体实现中的技术问题尚未完善等问题.企业应从确定建立数据仓库的合适时机,选择切合实际的实施方法,取得最高管理层的支持和认可,确定基本目标、量化预期收益,选择正确的设计思路,选择合适的合作伙伴等6个方面应用数据仓库技术.  相似文献   

14.
本文研究了一种基于数据关联规则采集技术的用户个性化页面动态生成方案,此方案设计实现用户注册/登录、查询、购买;管理员对网站的系统管理;个性化页面动态生成——回显等程序模块;实现ASP和HTML页面,与现今网上已采用的一些方案相比,具有用户使用更简单、反映用户更明显细致等优点.  相似文献   

15.
针对现有搜索行为分析方法只能分析单一类型搜索行为,无法有效获取用户兴趣的问题,提出多种搜索行为联合分析方法.通过使用M5模型对页面停留时间、鼠标点击次数、页面重访问次数及滑块移动次数4种类型的用户行为进行联合分析,从多个角度获取用户行为信息用于分析用户兴趣,并实现了对多种搜索行为构成的高维数据进行联合分析,同时满足了在线行为分析中对结果计算的实时性要求.实验表明该方法可以提供比Belkin方法更高的行为分析质量.  相似文献   

16.
从Web数据中挖掘频繁访问模式   总被引:7,自引:0,他引:7  
提出了一种新的用户浏览行为模型,通过在Web日志挖掘中引入页面信息量参数,以Web页面文件大小与用户浏览时间的比值作为对页面关心程度的度量,将页面引用划分为导航目的与内容目的两种类型。在此基础上定义并实现了对应的内容事务识别方法。实际数据的挖掘结果证明了模型的适用性。  相似文献   

17.
李林涛  高峥 《科技信息》2011,(13):79-79,32
本文将数据仓库技术与财务分析理论相结合,试图运用数据仓库技术设计基于财务分析体系的数据仓库开发应用模型,使该数据仓库系统在满足财务分析各个方面的基本需求的同时,向用户提供更高效、全面的查询分析功能。为财务分析数据仓库系统的实际开发和实施提供理论依据和支持。  相似文献   

18.
基于并行数据仓库的数据分布调整策略   总被引:1,自引:0,他引:1  
并行数据仓库系统的性能与数据在多处理机之间的分布密切相关.本文根据并行数据仓库系统的体系框架,提出了全新的并行数据仓库数据三层模式结构,并在此模式基础上,根据用户查询的变化设计了动态多维数据分布和调整策略,通过改变数据分布模式和数据物理存放的方式来保证系统数据分布均匀和工作负载均衡.实验结果证明,此算法能有效地缩短OLAP平均查询响应时间,提升系统的整体性能.  相似文献   

19.
姜涛 《科技资讯》2007,(22):99-99
在数据仓库解决方案的基础之上开发数据挖掘系统,可以使数据仓库进一步适应企业高层决策的需求.基于数据仓库的挖掘系统不仅具有极高的灵活性,而且能够协助用户发现期望获取的知识和部分未知的有用信息.本文将介绍基于OLAP数据挖掘的概念,以及讨论OLAP关联挖掘的实现.  相似文献   

20.
结合Ralph Kimball和Inmon的数据仓库设计和架构思想,以建设某学院办公自动化数据仓库为例,提出一种基于实体联系(ER)模型的数据仓库多维建模方法。该方法从构建数据仓库全局角度指导维度建模,同时兼顾用户需求与底层数据,从而得到既能满足用户需求、又具扩展性的维度模型。该方法规范了数据仓库的逻辑模型建模过程,可以为多维模型的设计提供方法上的指导。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号