共查询到20条相似文献,搜索用时 46 毫秒
1.
在概述Web挖掘以及Web日志挖掘的相关领域的发展和技术及其理论基础上,详细研究了Web日志挖掘的预处理技术,Web日志挖掘利用数据挖掘技术分析和挖掘网络日志,获取网站使用情况的有价值模式,应用于个性化服务、网站设计和商业决策等方面.通过将日志挖掘的结果与最优路径算法将结合,进一步优化网站,设计出拥有最优路径拓扑结构的网站,使优化后的网站更具优势,在同类网站中能够脱颖而出. 相似文献
2.
本文首先在"信息爆炸"的时代背景下提出数据挖掘和Web数据挖掘的重要性,然后针对Web日志挖掘详细讨论了其数据预处理的主要步骤及其过程方法,最后阐述了Web日志挖掘在网站建设上的应用,为后继研究提供了参考。 相似文献
3.
4.
随着Internet网络的高速发展,海量的未标签文档和相对少量的已标签文档是当前Web文档的一个普遍情形,如何有效的利用少量的已标签文档去聚类海量的未标签文档,从而更好地获取有价值的信息,即半监督学习问题,已成为当前研究的热点.本文针对目前Web文本挖掘领域的无监督学习算法的检测率不高,而监督学习算法需要大量的标签数据又不易获得的问题,将半监督中的标签绑定技术与优化球形k-均值聚类算法相结合进行Web文本挖掘,并使用真实的测试数据对Web文本挖掘系统进行实验.结果表明本文方法对有价值文本具有较高检测率及较低的误报率,整体检测性能优于基于监督和无监督学习的Web文本挖掘算法. 相似文献
5.
6.
基于Web Log的数据预处理研究 总被引:4,自引:0,他引:4
Web日志文件是进行Web挖掘的重要数据来源,对Web日志的数据预处理是Web挖掘过程中关键的一步,首先介绍了Web日志挖掘的体系结构,然后详细地分析了Web日志文件,并对基于Web日志文件的数据预处理进行了较深入的研究,提出了包括数据净化、数据抽取、数据转换和数据集成等过程的具有实际应用价值的数据预处理的实现方法。 相似文献
7.
8.
基于Web挖掘的个性化服务 总被引:3,自引:0,他引:3
协同过滤和基于内容的过滤等传统个性化服务技术存在不能处理大规模数据、需要用户输入主观的评价信息、只能利用静态的统计特征等缺陷.最近提出基于Web使用挖掘和Web内容挖掘的个性化服务体系结构,在此基础上进一步引入了Web结构挖掘,统称为基于Web挖掘的个性化服务体系结构;给出了通过聚类算法获取总体使用特征、内容特征和结构特征及其一致化表示的方法;提供了通过总体使用特征、内容特征和结构特征实现个性化服务的途径. 相似文献
9.
<正>自从电子商务出现以来,它就在全世界范围内受到了人们的格外关注,并且得到了迅速的发展。但是,目前电子商务网站普遍存在的问题是购物者难以找到所希望购买的商品,甚至在耗费很长的时间后仍然找不到自己想要的商品,而最终放弃购买。并且商家也普遍对目前的网络销售行情感到失望,尽管如此,电子商务仍是目前最好的商品展示媒体和工具。然而,网上产品展示的目的不仅仅是单纯地展示产品,更重要的是通过让客户更多地了解产品来提高产品的销售量。因此,目前电子商务所 相似文献
10.
作为Web内容挖掘的重要组成部分,基于Web的命名实体提取与实体关系发现,以海量Web网页中蕴涵的海量实体及丰富的实体间关系为对象,充分利用Web数据本身的特点,发展一整套方法和技术,力求高效、准确地提取Web网页中的实体与关系. 相似文献
11.
随着Internet的普及,电子商务正以令人难以置信的速度蓬勃发展.新的商业环境在为企业提供新的商机的同时,也对企业发出了新的挑战.以客户为中心的客户关系管理是电子商务环境中企业吸引和留住顾客的致胜法宝之一.怎样在电子虚拟世界中吸引新的客户,一方面,企业能够提供满足用户个性化的产品和服务;另一方面,要引导客户从众多的产品中容易地找到自己喜爱的东西.近年来兴起的推荐系统成为解决这些问题的重要途径之一.推荐系统(Rec-ommender System)是根据用户个人的喜好、习惯来向其推荐信息、商品的程序. 相似文献
12.
13.
14.
徐国华 《湘潭大学自然科学学报》2012,(4):112-117
为了对网页客户进行研究,从理论上自主构建了一套具体的分析方法.该方法将代数学知识与计算机科学知识相结合,通过进行若当标准型转化和施密特正交化,确定了网页客户的具体分类方法,同时也确定了网页客户的发展趋势.随后,将上述理论分析结果具体应用于某网站,展开基于该实证对象的网页客户挖掘与聚类研究.确定了该网站的发展趋势和聚类特性.通过近一年的应用检验,确定了理论研究和实证应用的正确性. 相似文献
15.
16.
17.
陈建 《海南师范大学学报(自然科学版)》2005,18(3):226-229
在制作准考证时,制作一个动态Web页面,各个学校通过这个动态Web页面将应考者的信息输入,利用动态Web技术将数据集中保存在服务器端,最后由服务器端的数据制作出全部的准考证.通过这种分布式的处理方法,将任务分散,从而降低了处理的难度和强度,各个学校的处理可以同时进行,既提高了整体的处理效率,也能够有效地保证数据的正确性. 相似文献
18.
电子商务的发展不仅促进了全球经济的发展,同时也给社会各界带来了新的挑战和机遇。电子商务网站的安全对电子商务的发展有着至关重要的作用。因此,本文电子商务网站的意义出发,通过分析影响其安全的因素,提出了解决和最大限度减少安全威胁的方法和措施,为创造一个安全可靠的电子商务氛围提供理论和实践指导。 相似文献
19.
20.
陈欢 《哈尔滨师范大学自然科学学报》2018,(3)
针对电子商务的隐私数据追踪问题,提出一种适用于大数据平台技术架构的数据追溯方法,将传统标注法与密码技术相结合,构建安全性更高的追溯标识信息,基于用户敏感数据位置进行标识信息的嵌入,并根据大数据平台架构特点设计适用于大数据平台数据处理的追溯架构.方案中,追溯标识信息安全性高不易被伪造,具有敏感数据的针对性保护措施,能够有效提高大数据平台的追溯效率. 相似文献