首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 985 毫秒
1.
Web数据挖掘是将数据挖掘技术和理论应用于对互联网资源挖掘的一门新兴研究领域.XML能够为web数据挖掘提供半结构化的数据模型,解决了Web挖掘中的数据源问题.分析了Web数据挖掘的特点,并将XML技术引入Web数据挖掘领域中,进而在此基础之上介绍了一种数据挖掘的模型.  相似文献   

2.
Internet上有海量的数据信息,有效地应用这些海量数据成了数据库技术的研究热点,Web数据挖掘技术应运而生。XML数据自我描述以及XML的半结构化的数据模型,可以很容易地将XML的文档描述与关系数据库中的属性一一对应起来,实施精确地查询与模型抽取,从而解决Web数据内容挖掘的难题。随着XML作为在Web上交换数据的一种标准方式的出现,面向Web的数据内容挖掘将会变得轻松。  相似文献   

3.
研究了如何利用查询和视图来解决半结构化数据查询重写问题.给出了一种OEM数据模型和一种半结构化数据查询重写算法.算法借用了半结构化数据查询重写桶算法的思想,解决了半结构化数据模型之下查询重写的一些新问题.理论分析表明,它降低了算法的代价.  相似文献   

4.
基于XML的Web数据挖掘技术   总被引:5,自引:0,他引:5  
全面分析了Web挖掘最新技术及发展方向,重点分析了Web结构挖掘、Web内容挖掘方法以及Web Log挖掘等,介绍了基于XML的Web数据挖掘的特点,提出了运用XML解决Web数据挖掘中半结构化数据的模型查询与模型抽取的方法,并通过实例说明了该方法.  相似文献   

5.
基于OEM模型的半结构化数据的模式抽取   总被引:5,自引:0,他引:5  
Web数据是典型的半结构化数据 ,缺乏明确的、预知的、与数据分离存储的外在模式 ,导致查询、浏览和集成Web数据的效率极低。该文提出一种基于 OEM (objectexchange model)模型的半结构化数据的模式抽取算法 ,采用自顶向下的剪枝策略 ,可快速发现频繁简单路径集 ,应用于半结构化数据的集成及查询回答与优化。其特点是可降低目标模式的规模 ,有效改进模式抽取的效率  相似文献   

6.
殷家玉 《科技信息》2009,(18):181-181
本文描述了Web数据不同于传统数据库数据的特点和对其进行数据挖掘的难点,阐明了XML是一种半结构化的数据模型使得它可以应用于Web数据挖掘,介绍了XML应用于Web的理论方法,为Web数据挖掘的理论研究提供了一定的参考作用。  相似文献   

7.
半结构化数据正以其灵活性而成为解决Internet环境下互操作语义层面问题的重要工具和网络数据交换格式的标准.从基础理论层面上对版结构化数据进行研究,在考察了进程代数和空间逻辑的有关结果后,从模型和逻辑系统的角度对半结构化数据特别是XML语言进行刻画.在[1]的基础上,在数据模型中加入了受限算子,并提出一种新的空间逻辑——树逻辑,在其中引入了一个新的模态算子,它们的意义在于能够对私有数据的性质进行刻画和表达.此外,通过修正数据模型中的同余关系,使得模型符合数据的有序性,从而使其更为合理.在此基础上证明了树逻辑系统公式可满足性的不可判定性,从而说明针对整个树逻辑系统的模型检测算法是不存在的.同时选择了其中一个子逻辑系统,给出了其模型检测算法,并证明了该算法的正确性.  相似文献   

8.
随着信息时代的来临,Web数据挖掘成为了一门新兴研究领域,分析了Web数据挖掘的特点,并将XML技术引入Web数据挖掘领域中,进而在此基础之上介绍了一种数据挖掘的模型。  相似文献   

9.
XML及其在Web数据挖掘中的作用   总被引:1,自引:0,他引:1  
介绍了Web数据的数据环境和结构,XML简单、开放、扩充的特性及XML与HTML的比较.论述了面向Web的数据挖掘需要解决的问题及XML在Web数据挖掘中所起的作用。  相似文献   

10.
大数据及其技术是当前信息领域研究的热点,在数据挖掘、数据分析、信息服务以及信息安全、隐私保护等方面给图书馆带来了挑战与机遇。随着大数据时代的到来,用户对信息资源的需求越来越高,图书馆的信息处理及服务将会发生显著的变化,从大量的非结构化数据、半结构化数据集中去分析和挖掘潜在的价值将成为图书馆的主要业务之一,图书馆的服务方式也需做出相应的改变。  相似文献   

11.
KDD^*模型是基于双库协同机制的知识发现新模型,是结构化数据挖掘领域研究的一个新的分支。为了进一步提高KDD^*的智能性,设计了一个基于Multi-agent技术的智能数据挖掘系统,利用多智能体技术,实现了数据预处理,数据挖掘,知识的自动获取,基础数据库与知识库的同步进化与协调,知识的评价与表示等功能。  相似文献   

12.
煤炭资源采矿权具有和股票看涨期权一样的期权特性,本质上是一种按年度执行的多期看涨期权。利率变动将直接影响煤炭资源采矿权价值,实证研究表明Vasicek利率模型能较好地拟合我国无风险利率变动过程。建立了基于Vasicek随机利率的煤炭资源采矿权估价双因素模型,通过一实例对该模型进行了运用,结果表明该模型较现金流量法更能反映资源所有者的权益,并且随着均值回复系数的增大,运用该模型得出的采矿权价值将变小。  相似文献   

13.
近距离多煤层开采引起的采空区地面沉降在当前工矿区沉陷中占有较大的比例,而天基InSAR技术在工矿区大范围形变监测方面具有显著优势.以2018年1月至2019年8月间的43景C波段Sentinel-1B SAR数据为基础,通过时序InSAR技术对近距离多煤层开采的康平煤田进行了大范围沉降监测.以Okada模型为基础,结合近距离多煤层分布特征,采用叠加理论的原则,提出了一种基于多源模型的近距离多煤层参数反演方法.通过定量计算弹性半空间下双源模型和三源模型近距离多煤层参数反演的精度,发现三源模型精度更高,更符合小康矿近距离多煤层开采的实际特征.本研究可以为基于InSAR技术的近距离多煤层开采沉降监测及参数反演提供参考.  相似文献   

14.
面对飞速发展的信息时代,WEB数据的挖掘日益重要,而传统的搜索引擎难以胜任对数据的挖掘处理。基于XML良好的结构性和层次性,提出了利用DOM树进行WEB挖掘的方法。首先利用Tidy工具库将WEB数据转换成良好结构的XML文件,简化生成DOM树,然后通过遍历解析XML的DOM树结构,提取需要的WEB信息,实现对WEB数据挖掘。实验表明,该方法能够方便地对数据进行结构化存储和信息处理。  相似文献   

15.
讨论了数据挖掘技术的研究进展 ,并对四种方法进行了深入的研究 :关联规则、离群数据、基于案例的推理、支持向量机 ,最后提出一个基于数据挖掘技术的智能决策支持系统的框架和模型  相似文献   

16.
实体解析是指识别同一实体的不同描述形式的过程, 旨在保障数据质量, 是数据清理、数据集成及数据挖掘中的关键技术. 随着电子商务的不断发展和成熟, 商品的多样性和消费者灵活的购买方式, 使得对网络商品的精确识别和匹配成为大数据时代亟待解决的问题. 与传统实体解析主要针对结构化数据不同, 网络数据具有非结构化、异构和海量的特性, 为此设计了综合相似度算法(synthesized similarity method, SSM)来计算网络商品数据间的相似度, 同时引入凝聚的层次聚类框架, 以匹配来自不同数据源的异构商品. 此外, 为了解决大数据环境下对执行效率的要求, 从字符串相似度缓存、约束知识库和分块策略三个方面对SSM进行优化, 基于真实数据集的实验结果验证了SSM的执行效率和有效性.  相似文献   

17.
为了解决大数据的深度挖掘和即时查询的需求,建立了一个分布式、可伸缩、低成本和大容量的并行计算集群,实现了半结构化数据的SQL查询分析,并提供了标准对外接口。  相似文献   

18.
 为面向可拓建筑设计进行可拓数据挖掘, 以可拓建筑设计数据为对象, 探讨将其转化为高质量的结构数据的流程与方法。根据跨行业数据挖掘标准流程(CRISP-DM), 建立包括基元化表达、数据表设计、数据筛选、数据形式变换、变量标准化处理和变量维数约简6 个步骤的数据准备流程, 并根据建筑学专业特点, 结合可拓学、几何学、统计学理论, 设计各步骤的操作方法, 构建出完整的数据准备流程与方法。案例检验结果表明, 按照该流程及其操作方法, 可有效地将可拓建筑设计数据转化为统一格式、高信度、量化且可运算的结构数据。  相似文献   

19.
计算机辅助新词新语词典的编纂   总被引:2,自引:0,他引:2  
在参照众多语言学家关于新词新词的定义及其界定的基础上。定义了适合计算机处理的新词新语的扩充展-新现词语,给出了从大规模现代汉语语库中基于数据挖掘技术的新现词语发现,并利用该技术辅助新词语词典的编籍。  相似文献   

20.
讨论了采矿CAD系统引入参数图元的原因和参数图元的构造原则,研究了采矿CAD系统中参数图元的构造及其描述方法.此外,根据参数图元的定义机制和参数图元库的组织,研究了参数图元规范化问题、相对坐标与绝对坐标的混合定义、有参图段和无参图段的定义、图段的连接、参数图元与数据模型的关系5个关键问题,提出了一个"可变长记录"参数图元库结构组织方案,并以半圆拱巷道为例给出了采矿CAD参数图元定义方法.该参数图元的构造方案在一个基于线框构图技术的采矿CAD软件开发中实现.本方法对提高采矿CAD系统的通用性和作图效率具有一定的理论意义和实用价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号