首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 500 毫秒
1.
基于XML的Web数据挖掘技术   总被引:5,自引:0,他引:5  
全面分析了Web挖掘最新技术及发展方向,重点分析了Web结构挖掘、Web内容挖掘方法以及Web Log挖掘等,介绍了基于XML的Web数据挖掘的特点,提出了运用XML解决Web数据挖掘中半结构化数据的模型查询与模型抽取的方法,并通过实例说明了该方法.  相似文献   

2.
提出一种粗糙集和支持向量机相融合的Web数据挖掘模型.首先收集相关Web数据,提取特征,并采用粗糙集对特征进行约简,去除一些无用的特征,然后采用支持向量机对训练样本进行学习,建立Web数据挖掘模型,最后进行性能测试.实验结果表明,粗糙集和支持向量机相融合可以获得令人满意的Web数据挖掘效果,具有更高的实际价值.  相似文献   

3.
概念机理模型和数据驱动模型两类异构水环境模型在编程语言、数据描述、模型结构和开发成果等方面都存在明显差异.为了实现异构水环境模型有效集成,针对两类异构模型的不同特点,采用元数据对异构模型进行统一抽象表达,通过Web Service技术对模型进行封装以提供统一的Web服务,实现异构模型一体化集成,开发了一个水环境决策支持系统原型.研究结果表明,该方法能够有效地屏蔽模型的异构性,提供统一的Web服务,提高了系统的通用性和可扩展性.  相似文献   

4.
基于粗糙集的Web日志挖掘研究   总被引:1,自引:1,他引:0  
提出了一种基于粗糙集的Web日志挖掘模型,该模型采用粗糙集的方法对原始数据进行约简,然后应用粗糙集理论对数据进行定性分析和约简.最后结合一个Web日志实例验证了方法的可行性和有效性.  相似文献   

5.
分析了用户访问Web站点的浏览日志,度量用户的浏览行为.实验从实际获得的Web日志着手,进行Web日志的挖掘,提取用户浏览Web的行为特性数据.通过时间阈值进行会话的划分,选取合适的数据预处理,归一化后生成数据模式向量,引入人工神经网络中的自组织特征映射(SOM)模型,对用户访问倾向聚类,对用户浏览的偏爱度进行度量,为Web站点的进化提供依据.  相似文献   

6.
数据标注是Deep Web数据集成系统的重要组成部分.建立了领域标注模型,描述数据标注的思想,根据不同的数据,使用领域知识和决策树两种标注方法,给出标注算法描述,最后以图书领域作为标注对象进行实验.实验结果表明该方法可高效、准确地对Deep Web数据进行标注.  相似文献   

7.
电子商务网站的Web数据挖掘系统设计   总被引:2,自引:0,他引:2  
在分析了电子商务网站Web数据源及其挖掘任务基础上,设计了一种电子商务网站的Web数据挖掘系统模型,详细阐述了模型的数据挖掘过程与关键技术.  相似文献   

8.
在分析现有的Web访问挖掘数据预处理模型和会话识别算法的基础上,提出了一种改进的Web访问挖掘数据预处理模型并对基于时间和引用的启发式会话识别算法进行了改进。实验证明,改进的Web访问挖掘数据预处理模型和会话识别算法非常适合于当前搜索引擎广泛使用下的Web访问挖掘数据预处理。  相似文献   

9.
ModSecurity包含了3种入侵检测模型,分别是消极安全模型、积极安全模型和已知漏洞攻击模型.针对消极安全模型,提出加入1种新的Web应用防火墙的自学习TL模型方法,采用先收集、整理和归纳网页参数特征,再与用户提交数据进行规则匹配的方法,实现对Web应用的安全防护,减少了Web管理员的繁琐的规则过滤设置,增强了ModSecurity防御的能力,提高了Web服务的安全性.  相似文献   

10.
为了实现协同产品开发中的知识共享,在开放式标准的基础上,提出了一种基于特征模型和网络(Web)服务的工程知识库共享机制.以各类工程数据库、专家知识等作为底层资源而建立工程知识库,并将知识库中的知识对外包装成标准的Web服务;同时,提出了基于异构计算机辅助(CAX)系统特征的产品模型数据转换方法,并将其转换为可扩展标记语言(XML)表述而作为平台无关的信息集成方式;将产品模型的XML表述作为输入,利用Web服务的发布、发现与共享机制来选用合适的Web服务而获取相关的领域知识,以对产品模型进行评估与优化.结果表明,所得数据可以在产品模型和Web服务之间进行交互与转换,可实现高效的知识共享.  相似文献   

11.
地理空间数据的裁切是数据预处理过程中相当重要的一个环节,也是耗时较长的一道工序。传统的裁切方法不能进行批量自动处理,程序复杂,且耗费的时间长。本文介绍了一种通过C#编程实现数据裁切的简单实用的方法,可以进行批量生产,具有快捷、简单、实用的特点。有效的解决了大批量的数据裁切问题,提高了工作效率。  相似文献   

12.
动态激光测图数据处理系统   总被引:3,自引:0,他引:3  
对动态激光测图系统采集的点云数据的分析,研究开发了相应的数据处理系统。点云图是离散的坐标点阵列,不表达被测目标的边界特征及拓扑关系,利用点云图进行信息提取目前还没有成熟可行的方法及软件。该软件系统可实现动态扫描过程中扫描仪数据的预处理、姿态改正、空间匹配、信息提取、可视化等功能。  相似文献   

13.
三维激光扫描获取了大量的点云数据,数据的组织直接影响点云数据的操作速度.采用数据库管理点云数据,对点云数据采用八叉树数据模型进行组织,建立空间索引,对点云数据进行分块提取,实现点云数据的检索以及可视化.  相似文献   

14.
范围查询是对数据立方体进行数据分析的有效方法,预计算技术可以提高数据立方体范围查询的速度,实现快速的用户响应.近年来研究人员基于多维联机分析处理(MOLAP)预计算的研究主要以prefix sum及分块技术为基础,本文对分块方案及如何组织块内单元实施prefix sum方法进行探索,提出了前缀区域数据立方体结构(Prefix Region Cube,PRC),采用基于前缀区域的不规则的分块方案,这种分块方法利于从起始单元开始的前缀区域范围查询的实现.另外PRC在分块及对划分后的块内单元实施prefix sum时都采用回归分割技术,在不增加额外立方体空间的前提下,实现范围查询和数据更新的代价都为O(logdn).  相似文献   

15.
基于最小聚类单元的商圈聚类方法研究   总被引:2,自引:0,他引:2  
根据客户群聚的特点,在分析现有聚类方法的基础上,提出了基于最小聚类单元(LeastClusterCell,简称 LCC)的商圈聚类方法.并在数据挖掘体系结构中引入LCC子系统,以利用关系数据库成熟的接口技术方便地完成 对LCC的各种操作管理.  相似文献   

16.
根据广西互联网工程建设的需要,设计实现广西电子政务外网数据中心.该数据中心由数据中心局域网系统、服务器和存储系统、负载均衡系统、备份系统、安全系统、互联网出口系统和管理系统等组成.该数据中心具有交换速度快、安全稳定、扩展方便、易于管理等特点,能够有效实现政务数据的存储和共享.  相似文献   

17.
一体化仿真模型是智能气田建设的重要基础,如何利用数据驱动模型高效运转已成为亟待解决的关键难题。针对数据源分散、可用性差及与模型交互程度低等问题,开展了以下技术攻关:(1)结合数据服务总线(DSB)与PI OLEDB接口技术,实现多源结构化数据的有效集成与实时抽取,满足一体化模型对不同时间维度生产数据的业务需求;(2)建立数据质量规则库和自动扫描制度,实现数据质量的有效管控,确保一体化模型的正常运行;(3)开发基于数据流引擎技术的数据交互工具,实现了综合数据库与仿真模型的自动交互,其优势在于应用场景改变时,能够应用灵活编排基础服务的方法高效复用前期数据建设成果,大幅提高开发效率。研究表明,与国内外同类技术相比,应用数据流引擎技术突破了一体化模型与外部数据资源的交互壁垒,打破了该领域数据应用定制化开发的服务模式,为智能气田建设奠定了技术基础。  相似文献   

18.
随着多媒体技术和网络技术的迅猛发展,"数据爆炸但知识匮乏"的现象已成不争事实。图书借阅服务作为数字图书馆的主要功能之一,在数字图书馆的长期运行中积累了海量数据。为了开展读者个性化服务,研究如何利用这些数据为流通和采购等工作提供科学有效的决策参考,已成为一个热门课题。利用数据挖掘的GRI关联规则,对读者的图书借阅行为进行了分析,并给出了相应的措施和建议。  相似文献   

19.
在数字化校园建设中将既有业务系统的数据整合形成数据中心,并在此基础上进行数据分析,形成决策支撑系统,为相关管理部门提供服务.数据分析中ETL(数据抽取、转换与加载)是非常关键的技术.本文就ETL的分析和设计进行了一些基本的研究和探讨.  相似文献   

20.
SQL语句是一种重要的数据库查询语句。利用SQL语句可实现对数据进行数学统计。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号