共查询到17条相似文献,搜索用时 171 毫秒
1.
本文首先在"信息爆炸"的时代背景下提出数据挖掘和Web数据挖掘的重要性,然后针对Web日志挖掘详细讨论了其数据预处理的主要步骤及其过程方法,最后阐述了Web日志挖掘在网站建设上的应用,为后继研究提供了参考。 相似文献
2.
3.
基于Web Log的数据预处理研究 总被引:4,自引:0,他引:4
Web日志文件是进行Web挖掘的重要数据来源,对Web日志的数据预处理是Web挖掘过程中关键的一步,首先介绍了Web日志挖掘的体系结构,然后详细地分析了Web日志文件,并对基于Web日志文件的数据预处理进行了较深入的研究,提出了包括数据净化、数据抽取、数据转换和数据集成等过程的具有实际应用价值的数据预处理的实现方法。 相似文献
4.
5.
6.
随着Internet网络的高速发展,海量的未标签文档和相对少量的已标签文档是当前Web文档的一个普遍情形,如何有效的利用少量的已标签文档去聚类海量的未标签文档,从而更好地获取有价值的信息,即半监督学习问题,已成为当前研究的热点.本文针对目前Web文本挖掘领域的无监督学习算法的检测率不高,而监督学习算法需要大量的标签数据又不易获得的问题,将半监督中的标签绑定技术与优化球形k-均值聚类算法相结合进行Web文本挖掘,并使用真实的测试数据对Web文本挖掘系统进行实验.结果表明本文方法对有价值文本具有较高检测率及较低的误报率,整体检测性能优于基于监督和无监督学习的Web文本挖掘算法. 相似文献
7.
加权Web访问模式聚类算法 总被引:4,自引:0,他引:4
针对Web应用挖掘中聚类算法中的问题,提出加权Web访问模式聚类算法,该算法利用服务器日志库中保存的网页访问次数信息,提高了聚类的客观性和准确性。 相似文献
8.
随着我国社会经济的迅速发展,Internet和电子商务也随之发展起来,Web站点业务的竞争也随着互联网的发展愈发激烈。为了能够获得更多的电子商务信息并对其加以组织和利用,应该从具有丰富数据资源的电子商务中挑出所需的商业形式,这样就能更多地了解到客户的想法。为了获得更多商家和客户的支持,要完善网站的结构,使之能够为客户提供更多更便捷的服务。Web数据挖掘技术是寻找Web文档和用户浏览网站数据中具有潜在应用价值信息的一种手段,挖掘到的信息非平常模式的信息。本文通过对电子商务数据特点进行分析,来详细描述Web数据的概念、方法和相关技术。 相似文献
9.
10.
基于Web挖掘的个性化服务 总被引:3,自引:0,他引:3
协同过滤和基于内容的过滤等传统个性化服务技术存在不能处理大规模数据、需要用户输入主观的评价信息、只能利用静态的统计特征等缺陷.最近提出基于Web使用挖掘和Web内容挖掘的个性化服务体系结构,在此基础上进一步引入了Web结构挖掘,统称为基于Web挖掘的个性化服务体系结构;给出了通过聚类算法获取总体使用特征、内容特征和结构特征及其一致化表示的方法;提供了通过总体使用特征、内容特征和结构特征实现个性化服务的途径. 相似文献
11.
VS.NET2008是美国微软公司发布的最新的系统开发平台.本文主要介绍了在此开发平台下如何使用XML Web Services技术来开发电子商务网站的系统架构,以及在开发的过程中所考虑的一些代码重用问题.最后,提供了简易Web服务的实现. 相似文献
12.
在一般对数衰减模型中衰减因子是一个常量,但在实际应用中会引起较大的测距定位误差. 为了减少定位估计误差,在对Zigbee 组网定位实验数据进行统计分析的基础上,提出用负指数函数来描述衰减因子与距离(目标节点与锚节点间距)之间的关系,进而建立一种改进对数衰减模型;给出一个基于改进对数衰减模型的ML 估计器,并推导了该估计器的Cramer-Rao下界(Cramer-Row lower bound, CRLB). 在实验室和车站站场的Zigbee 组网定位实验结果表明,使用改进对数衰减模型的ML 估计器能提供更准确的定位估计,对场景变化有较好的适应性. 相似文献
13.
温海波 《哈尔滨师范大学自然科学学报》2013,(4):55-59
提出了基于邻接矩阵思想的FP-Growth改进算法IPILFPG,它采用项对索引链表作为FP树的辅助存储,避免重复遍历路径,优化搜索过程.该算法显著降低挖掘存储空间以及时间复杂度,提高挖掘效率.通过实验验证其正确性,并与其它算法比较验证其高效性. 相似文献
14.
一种文本分类数据挖掘的技术 总被引:7,自引:0,他引:7
挖掘的理论和应用研究是数据挖掘领域一个新的重要分支,介绍了一种文本数据挖掘方法. 首先,论述了文本挖掘的意义和重要性,探讨了文本挖掘的定义和文本分类的一些形式,然后讨论了一个以数据预处理、特征提取、特征表示和特征匹配等文本分类的一些关键理论问题,并给出了一个基于该方法的文本分类系统的实验结果,实验结果表明了该方法的可行性. 相似文献
15.
Web文本分类是Web数据挖掘的一个重要研究方向,它是在通过经验数据训练得到的分类体系下,根据网页的文本内容自动判别网页类别的过程,本文提出一种综合粗糙集与支持向量机的Web文本分类模型,利用粗糙集的属性约简方法,减少支持向量机训练数据的维数,提高Web文本分类的性能与效率. 相似文献
16.
介绍了数据仓库的体系结构、相关技术和数据分析技术,分析了数据仓库的两个重要应用——OIAP和数据挖掘的功能和实现中的相关技术和方法,对数据仓库研究的现状和发展方向进行了介绍. 相似文献
17.
在分析决策树算法及遗传算法的基础上,提出了一种将两种算法结合起来挖掘分类规则的新方法.实验证明,它不仅解决了数据挖掘中的“碎片”问题,同时还提高了分类的准确率. 相似文献