首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 109 毫秒
1.
针对目前Web挖掘的传统算法执行效率低、挖掘结果相关度低的缺陷,从Web挖掘的内容方面入手,在分析基于Web语义化文本数据挖掘关联规则结构的基础上,改进传统的Apriori算法,提出面向语义化的隐含文本数据挖掘算法,仿真结果表明改进后的算法具有较高的执行效率及较好的挖掘相关度,对于面向文本的Web挖掘算法研究具有一定的借鉴意义。  相似文献   

2.
HITS是一种经典的Web链接分析算法,其主要问题是容易发生主题漂移和互相加强.针对这些问题,提出了一种改进的算法T-HITS.通过一种网络结构图来映射垃圾链接集与其对应的网站,并结合链接文本将垃圾链接排除,最后利用可信度模型来修正结果,实验数据表明改进后的算法提高了查询结果的相关度,减少了主题漂移的发生.  相似文献   

3.
Web页面相关度算法   总被引:1,自引:0,他引:1  
元搜索引擎是建立在独立搜索引擎之上的搜索技术,而Web页面相关度算法是元搜索引擎的核心技术之一.文中在文档价值预测模型(DVPM)的基础上,将Web页面分解为不同的属性,通过属性值的计算来预测Web页面的相关度,给出了相关度的计算公式与评价,进行了相关度算法的实验研究.结果表明,该算法提高了Web页面的准确度.  相似文献   

4.
HITS是Web结构挖掘代表算法之一.HITS算法仅考虑页面之间的链接关系,容易出现主题偏移现象.文中分析了用户历史行为与兴趣之间的关系,从四个方面近似计算用户兴趣度.提出了基于用户兴趣度的改进HITS算法(HC-HITS),对比实验结果表明HC-HITS算法减少了主题漂移现象,取得较好的效果.  相似文献   

5.
互联网上信息是海量的,并且还在快速的发展.面向主题的Web信息检索已成为当前研究的热点之一.将语义网技术同传统的信息检索技术相结合,给出一个利用本体判断主题相关度的判断算法,通过实验验证了算法的有效性.  相似文献   

6.
方群 《科技信息》2009,(31):95-95
本文概述了Web数据结构挖掘技术,详细分析了Web数据结构挖掘技术中的PageRank算法和它的改进算法加速评估算法,提出了有条件使用加速评估算法的算法思想。  相似文献   

7.
挖掘用户的浏览模式是Web挖掘的热点之一.提出一种基于多约束条件的Web挖掘框架,该框架可以有效地提高挖掘算法的效率和挖掘结果产生的灵活性.  相似文献   

8.
Web日志挖掘及AprioriAll算法的改进   总被引:2,自引:0,他引:2  
阐述了利用数据挖掘技术对Web日志进行挖掘的可能性及其重要作用.通过用户维的引入,对已有的Apri-oriAll算法进行了改进,改进后的算法降低了原算法的时空复杂度,特别是在新算法中可以对Web日志数据按用户维进行切片,消除了原算法中的I/O相关性.这不仅使对Web日志数据进行的挖掘活动可以分散地进行,而且使多机连网分布式挖掘成为可能,同时还可以实现对Web日志的增量挖掘和动态挖掘.此外,该改进算法的特殊意义还在于它不仅可以将所有用户看作一个整体进行挖掘,而且还可以对不同的用户个体的行为进行独立地挖掘,使挖掘出的结果能够满足对用户个性化使用的需求.  相似文献   

9.
PageRank算法是最为经典的Web结构挖掘算法,但是其存在主题漂移的问题,使得搜索结果中存在大量与查询主题无关的网页。在分析Page Rank算法的基础上,提出利用欧式距离计算主题相似度并融入传统的PageRank算法中,形成一个改进的网页排序算法,并把此算法应用到云计算环境中,研究MapReduce编程模型上的PageRank算法流程。  相似文献   

10.
正关联规则与负关联规则有着同样重要的作用,而传统的关联规则算法只能挖掘正关联规则.本文对关联规则的相关度进行判断,并在此基础上提出了一个能同时挖掘正负关联规则的算法,实验证明改进算法是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号