首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
Web日志挖掘技术应用研究   总被引:9,自引:2,他引:9  
随着Internet的迅速发展,Web在人们的日常生活和工作中的地位日益显著.Web日志挖掘就是通过对Web日志记录的挖掘,发现用户访问的Web页面的浏览模式,从而进一步分析和研究Web日志记录中的规律,改进Web站点的性能和组织结构,提供个性化服务.本文首先分析了Web日志的分布和特点,再对Web日志挖掘中的两个阶段即数据预处理和日志挖掘算法做了详细介绍,最后对Web日志挖掘技术做了展望.  相似文献   

2.
本文对数据挖掘技术在Web日志文件中的挖掘应用进行了探讨,并对Web日志挖掘的意义、步骤、数据、准备以及算法进行了归纳,旨在帮助网站管理者更好的管理Web站点,用户更能方便的从Web站点获得服务,提高Web的使用效率.  相似文献   

3.
管雪珍  颜艳 《科技信息》2009,(34):I0074-I0074
针对经典粗糙集理论只能处理离散数据,不能将其直接应用到连续系统的数据挖掘中。本文利用样本之间的相似关系建立相似差别矩阵,通过实例仿真说明该方法是合理有效的。  相似文献   

4.
Web日志挖掘   总被引:19,自引:1,他引:19  
提出了一种新颖的MBP算法,它利用关联规则挖掘发现的频繁项目集以加快速度,能找出所有满足阀值约束的频繁浏览路径,该算法是有很效的,同时,针对Web浏览和日志文件固有的模糊性和不确定性,还讲座了Web面面的模糊聚类问题,最后,对发现的知识讨论了其在推荐系统及自适应Web站点中的应用并给出了相应算法。  相似文献   

5.
宋宏明 《科技信息》2009,(16):176-177
经典关联规则挖掘在Web日志挖掘应用中已经比较成熟。在此基础上,针对某些商业网站的商品板块间存在层次关系,将多层次关联规则挖掘引入Web日志挖掘,能够在细节程度更低的层次或不同的细节层次间深入、全面地提供用户浏览商品过程中的频繁访问路径和频繁访问页组,以优化网站链接,为访问网站的用户提供更能满足需求的服务。本文以淘宝网女装/女士精品销售版块的链接页面为例进行验证说明。  相似文献   

6.
经典关联规则挖掘在Web日志挖掘应用中已经比较成熟。在此基础上,针对某些商业网站的商品板块间存在层次关系,将多层次关联规则挖掘引入Web日志挖掘,能够在细节程度更低的层次或不同的细节层次间深入、全面地提供用户浏览商品过程中的频繁访问路径和频繁访问页组,以优化网站链接,为访问网站的用户提供更能满足需求的服务。本文以淘宝网女装/女士精品销售版块的链接页面为例进行验证说明。  相似文献   

7.
一个简单的Web日志挖掘系统   总被引:22,自引:0,他引:22  
在分析Web日志挖掘的困难及对策的基础上,给出了一个简单的Web日志挖掘系统(SWLMS)的体系结构,具体介绍了SWLMS中日志的预处理过程,包括数据净倾、用户识别、会话识别、路径补充的主要任务及其实现,并着重介绍了预处理之后的序列模式识别过程和算法,包括最大向前路径的识别和频繁遍历路径的发现,并给出了实验结果。  相似文献   

8.
为了从海量的信息资源库中快速、准确地进行分类并提取出有用的信息,提出了一种基于粗糙集和KNN混合的Web文本分类模型。利用粗糙集的属性约简理论降低了文本分类过程中的向量维数,使用一种基于分明矩阵的属性约简算法,特征选择过程采用互信息量计算方法,并对该混合算法进行了实验,同时结合传统的KNN方法对该混合算法进行比较,验证该算法的可行性。  相似文献   

9.
本文提出了一种改进的遗传算法,用于优化Web日志挖掘的关联规则集。介绍了该算法的具体流程,提出新的染色体编码方案,新的编码配合本文的交叉操作使遗传过程更加优化,本文还对遗传的各步操作进行了改进,有效的避免遗传算法的早熟现象。  相似文献   

10.
粗糙集在民航飞机故障数据处理中的应用   总被引:1,自引:0,他引:1  
为了提高民航飞机维修中故障诊断的安全性和可靠性,改善差别矩阵求核算法在实际应用中常见问题,以A320飞机自动驾驶仪不能衔接的主要及多发故障部件的故障数据处理为例进行了阐述,给出了差别矩阵的准确定义,以此可以不按照维修手册提供的排查顺序,避免多余的步骤,缩短排故时间,提高排故效率,通过实践验证了该方法用于民航故障数据处理的可行性.  相似文献   

11.
一种基于粗糙集理论的数据挖掘算法的研究   总被引:6,自引:0,他引:6  
研究了粗糙集理论在数据挖掘中的应用,提出了一种基于粗糙集理论的数据挖掘算法.首先对信息系统的数据加工泛化,构造其二进制可辨矩阵.对矩阵进行化简得到属性约简并生成规则.最后,结合银行申请信用卡的实例,利用上述方法进行数据挖掘,消去冗余属性,抽取决策规则.  相似文献   

12.
电子邮件给人们带来极大便利的同时,垃圾邮件的日益泛滥,也给人们带来了极大的不便和危害。本文使用基于粗集最优属性约简方法对邮件集进行特征维数压缩,在不影响条件属性分类能力的情况下,利用粗糙集约简化简决策表,得到一个规则,利用规则可以对新加入的邮件进行自动分类,试验结果表明该方法是行之有效的。  相似文献   

13.
粗糙集理论为研究不精确数据的分析、推理,挖掘数据间的关系、发现潜在的知识提供了有效的工具。在数据挖掘技术中KNN算法是一个实现简单和分类准确性较高的方法,但是,当用于样本容量较大以及特征属性较多的类似医疗图像挖掘这样的领域时,其效率受到了很大的影响,找到一个删除最大冗余属性的方法成了解决这个问题的关键。将粗糙集理论与KNN算法结合起来,用粗糙集方法进行属性约简,有效地解决了KNN算法分类的这个缺点。  相似文献   

14.
粗糙集在决策系统中的应用   总被引:9,自引:1,他引:9  
介绍了粗糙集理论实现数据分类和规则推理的基本原理,对关系数据库中的二维决策表提出了一个问题解决模型,并在同时满足支持度和可信度的基础上对规则进行筛选,提高了决策的准确性和合理性。  相似文献   

15.
针对现有的基于优势关系粗糙集的规则生成算法存在运行效率低的问题,提出了一种基于多个优势差别矩阵的规则生成算法,突出不同决策类之间的差别信息,在得到精简规则集的同时,能够提高规则生成效率.通过实验与其他规则生成算法加以比较,表明该算法在平均性能方面优于其他算法.  相似文献   

16.
基于模糊集和粗糙集的关联规则挖掘策略   总被引:3,自引:0,他引:3  
提出了一种对原始数据先进行模糊聚类,再提取规则的基于模糊集和粗糙集技术的关联规则挖掘策略,可以在一定程度内减少噪声数据的干扰,消除数据对象中的冗余属性,有利于提高规则挖掘的有效性.  相似文献   

17.
针对目前远程教育中个性化教学水平较低的问题,提出了一种基于粗糙集的Web学习者聚类算法,并应用粗糙集的约简方法解决了学习者特征数据中的属性冗余问题,提高了聚类算法的效率,从而提高了远程教学网站的个性化教学水平.  相似文献   

18.
认为数据量的巨大和高维、用户交互与先验知识的利用等等是知识发现领域面临的问题和难点 .粗糙集理论是一种具有模糊边界的集合理论 ,它作为研究知识发现的新型工具 ,能严格地处理不精确数据的分类问题 ,被广泛应用于不相容决策表中的规则提取过程中 .针对粗糙集理论中属性约减和属性值约减这两个重要问题进行了研究 ,并介绍了数据集中挖掘分类规则的基本原理 ,同时利用 RS理论中核和核值的概念 ,提出了一个在数据集中发现没有冗余属性的最小归纳依赖关系并简化决策系统的数据挖掘算法 ,并应用一简单的例子说明如何在数据库中发现分类规则 ,实验结果表明此算法可以大大提高系统潜在知识的清晰度  相似文献   

19.
提出了一种基于可变精度粗糙集的规则挖掘矩阵算法,它是一个采用基于分类精确度的粗糙集模型进行决策规则挖掘的新方法,能有效地处理决策表的不一致性。实例结果和实际应用表明该算法是有效的,为信息系统的规则约简、获取和信息压缩提供了新的思路。  相似文献   

20.
粗糙集(R ough Set,RS)理论是处理模糊和不精确的问题的一种新型的数学工具,是主要应用于研究不完整数据、不确定知识的表达、学习及归纳的数学方法.它在医学领域的应用还处于萌芽状态.近年来,中医规范化和量化研究取得了明显的进展,中医的术语规范化也为计算机在中医学中的应用提供了有利的条件.本文重点论述借助于粗糙集理论的相关知识挖掘中医诊断学中证候群知识,利用粗糙集理论对临床病历建立知识表达系统,对知识表达系统进行属性约简,求出属性核,建立最小简化表,并且得出有关中医诊断的几个相应规则.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号