首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
基于序列数据挖掘的中文网页特征选择方法   总被引:1,自引:0,他引:1  
提出了一种基于序列数据挖掘的中文网页候选特征的选择方法,并用于中文网页分类模型. 该方法运用改进的PAT树结构挖掘频繁出现在同一类中文网页中的字符串,通过净频率计算,挖掘出中文网页中频繁出现的有意义的词、短语、英文单词等,并结合CHI算法得到文本特征. 实验表明,该算法不仅能挖掘出传统方法所选择出的绝大部分特征,还能挖掘出一些有意义的、切词系统词库中没有的、能反映分类特点的人名,地名,新词、常用语、外文单词等.  相似文献   

2.
基于语义分层迭代法的网页挖掘技术   总被引:1,自引:0,他引:1  
提出了一种基于页面语义的分层迭代划分方法,并将其运用于网页挖掘,通过把网站页面迭代划分为不同数目节点的多层,选取符合要求的层来进行数据挖掘处理,便于快速定位到该层中的某个节点,该节点就是需要的主要内容。  相似文献   

3.
基于PageRank和HITS的Web结构挖掘算法研究   总被引:1,自引:0,他引:1  
在对Web结构挖掘的典型算法探讨的基础上,提出了一种PageRank算法和HITS算法相结合的改进算法,并对该算法进行了简要分析。  相似文献   

4.
Web挖掘的体系研究   总被引:6,自引:0,他引:6  
互联网的出现极大地丰富了人们的信息,但也困扰人们从中获取有用的知识。Web挖掘的应用为解决此问题指明了方向。该文从Web内容挖掘、Web结构挖掘和使用记录挖掘3个方面论述了Web挖掘的内容及相关技术的研究现状和发展方向。Web内容挖掘包括信息提取和信息检索,Web信息提取的主要过程包括向量表示、特征提取、特征缩减和文本挖掘;对于信息检索,文章从搜索引擎的原理、分类以及最新的发展技术方面对其进行了论述;而对于结构挖掘和使用记录挖掘,文章主要论述了其算法和过程。  相似文献   

5.
随着信息时代的来临,Web数据挖掘成为了一门新兴研究领域,分析了Web数据挖掘的特点,并将XML技术引入Web数据挖掘领域中,进而在此基础之上介绍了一种数据挖掘的模型。  相似文献   

6.
在非结构化数据挖掘结构模型——发现特征子空间模型(DFSSM)——的运行机制下,提出了一种新的Web文本聚类算法——基于DFSSM的Web文本聚类(WTCDFSSM)算法.该算法具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪声能力强.结合现代远程教育网应用背景实现了WTCDFSSM聚类算法.结果表明:该算法可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘;采用网格结构模型,帮助人们进行文本信息导航;从海量文本信息源中快速有效地获取重要的知识.  相似文献   

7.
Internet的发展给传统的数据挖掘领域提出了很多新的研究课题.Web挖掘技术就是传统的数据挖掘技术与计算机网络技术的结合.Web使用记录挖掘是从日志文件中挖掘出有用的信息,这些信息可以帮助站点设计者设计站点和服务,有益于商业网站开展有针对性的电子商务活动.介绍了Web挖掘的概念和分类,说明了Web使用记录挖掘的过程和意义,并指出了Web使用记录挖掘的研究趋势.  相似文献   

8.
基于Web的新闻文本分类技术的研究   总被引:1,自引:0,他引:1  
从Web新闻网页中挖掘出有用的知识是当前研究的热点问题,将Web新闻网页进行解析,在此基础上进行Web新闻文本分类处理,可在一定程度上解决此问题.针对Web新闻网页的结构特点,提出了基于Web的新闻文本分类系统的实现框架.实验结果表明,基于KNN算法的分类系统具有较好的分类效果.  相似文献   

9.
首先描述了数据开采,及Web数据挖掘,最后提出了Web数据挖掘的发展方向和趋势。  相似文献   

10.
 因特网上的数据越来越多、越来越复杂,这些异构、动态、分布的信息使得传统数据挖掘方式已经不能达到实际要求。本文提出了一种面向web 数据挖掘的改进型迭代算法,将迭代方法与多服务器并行算法进行结合,并采用该算法建立了一个支持并行关联规则的web 数据挖掘模型,融合存储节点本地计算的思想。实验证明,该模型能够提高web 数据挖掘的效率,并有随着数据量增加执行率升高的特点。  相似文献   

11.
基于IIS和web日志的关联关系的挖掘   总被引:4,自引:0,他引:4  
针对隐藏在web日志的大量记录中的规律性开展研究,提出了一种基于微软的ⅡS合理构建web日志并进行数据预处理的方案,在此基础上运用Apriori算法挖掘用户访问的页面间的关联关系,将数据预处理过程提前到web日志的建立过程中,可极大地降低数据准备的复杂性,将日志数据导入关系数据库中进行净化处理,大幅度减少了工作量,该方案可用于ⅡS下的商业网站。  相似文献   

12.
由于假定利率不变和不考虑资源开采者在运营管理上的灵活性,收益现值法在评估采矿权时容易低估其价值。为此,作者建立了基于期权的采矿权估价随机利率方法,并通过实例对该方法进行了验证。计算结果表明,基于期权的采矿权估价随机利率方法较收益现值法能提高采矿权的价值。  相似文献   

13.
介绍了Web挖掘的有关理论.着重分析了结构挖掘中基于页面链接结构的PageRank算法和对其有改进意义的HITS算法,进而介绍了内容挖掘常用的一些算法以及使用记录挖掘应考虑的问题.  相似文献   

14.
在假定波动率不变和不考虑开采者在运营管理上的灵活性的情况下,采用收益现值法评估矿业权是容易低估其价值的。为此,建立了基于期权的矿业权估价随机波动率方法,即假定波动率是时间t的函数,在此假设的基础上建立了随机波动率条件下的矿业权估价模型,并通过实例对该方法进行了验证。计算结果表明,基于期权的矿业权估价随机波动率方法较收益现值法能提高矿业权的价值。  相似文献   

15.
Web日志挖掘中数据预处理技术研究   总被引:2,自引:0,他引:2  
Web日志挖掘的基本思想是将数据挖掘技术应用于Web日志数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web日志挖掘的数据源最主要的是Web日志,根据Web日志的特点,在预处理过程中的会话识别阶段给出一种基于过滤框架网页与页面访问时间阈值相结合的会话识别方法,实验数据验证说明该方法可以显著地提高Web日志挖掘结果的兴趣性。  相似文献   

16.
提出一种新的基于用户访问路径分析的页面推荐模型.该模型采用在线处理方式,利用增量图划分方法形成页面聚类,依此生成动态页面推荐.模型以Apache模型的形式实现,可适用于大型商业网站以及内容更新频繁的网站.试验结果表明,该模型具有较好的整体性能.  相似文献   

17.
分析和讨论了基于Authorware和ASP设计和开发《C程序设计》网络多媒体教学软件的方法和步骤,并阐述了各主要界面和模块的实现方法.  相似文献   

18.
本文研究结合网站结构和页面内容以辅助Web使用挖掘,提高推荐服务质量。并在相关理论与研究的基础上,给出一种关于推荐因子的综合计算方法,经推荐质量分析,该方法具有较好的推荐优化能力。  相似文献   

19.
针对现有语义Web服务组合方法未考虑到互联网环境的动态性及Web服务的随机性问题,提出采用流演算理论对语义Web服务组合进行研究.首先将Web服务的输入、输出、前提和效应映射为基于流演算的动作形式化描述; 然后定义将OWL-S中的原子过程和复合过程向流演算转换的规则; 再根据提供的Web服务组合目标,利用形式化地推理来得出Web服务的组合序列,从而能动态地形成正确有效的Web服务组合方案.最后,通过一个会议安排实例验证上述理论,结果表明该方法是可行的.  相似文献   

20.
依据任务驱动理论,结合“网页设计与网站制作”课程特点,提出“创设情景、提出任务一分析任务、明确目标一自主学习、协作完成一交流反馈、评价任务”的教学模式,并注意任务的设计。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号