首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 187 毫秒
1.
基于模糊粗糙k-均值的用户访问模式的聚类   总被引:1,自引:2,他引:1  
Web用户访问过的网页以及在该网页上的浏览时间体现了用户的访问兴趣.为了更好的衡量任意两个用户访问模式之间的相似/相异度,每个用户访问模式都被转换成具有相等长度的模糊向量,其中每个元素要么是0要么是模糊语言变量,它体现了用户是否访问过该网页及在该网页上的浏览时间.由于类的边界可能是模糊的,因而使用粗糙k-均值法对这些代表用户浏览特征的模糊向量进行聚类.最后使用Davies-Bouldin指标来衡量聚类的效果.  相似文献   

2.
一种新的层次结构网站用户兴趣模式变化识别算法   总被引:3,自引:2,他引:1  
提出了一种Web用户兴趣变化识别的算法,面向层次结构的信息类网站,可以达到客户自适应的目的.该算法由长、短期两个兴趣模型构成,分别基于指数衰减理论和贝叶斯后验概率理论.基于一个Internet上真实网站的实验结果表明,本文提出的算法可以迅速识别出用户的兴趣变化,并且广泛适用于新闻、虚拟社区等层次结构类网站的网页内容推荐,满足用户在信息浏览时的个性化需求.  相似文献   

3.
提出一种模糊的粗糙近似法用于对web日志中的用户浏览模式进行聚类.在聚类过程中,一个网页是否被访问反映了用户的浏览兴趣,一个网页上的浏览时间反映了用户浏览兴趣的程度,它被刻画成模糊语言变量以忽略时间值之间的细小差别.每个用户浏览模式被表示成等长的模糊向量的形式以表示该用户访问过的网页及网页上的浏览时间.最后使用粗糙近似的方法对这些表示用户浏览模式的模糊向量进行聚类.这种方法可以把具有相似浏览行为的用户聚成一类.  相似文献   

4.
一种基于分布式融合的多模型图像跟踪系统   总被引:2,自引:0,他引:2  
设计了一种基于分布式融合的多模型图像跟踪系统。由于图像中噪声的存在、遮挡现象的发生以及被跟踪对象的变形会对某些跟踪算法产生影响 ,因此 ,一个比较理想的跟踪系统应该能够融合这些跟踪算法的优点 ,从而稳定地跟踪目标。本系统采用了 3种跟踪模式 :基于区域的跟踪模式 ;基于B样条主动轮廓的跟踪模式和基于特征点的跟踪模式。利用这 3种模式分别进行跟踪 ,并由基于区域的跟踪模式判定遮挡 ,从而决定将哪些模式的跟踪结果送到融合中心。仿真实验表明 ,这种算法能有效解决遮挡问题 ,并具有较强的鲁棒性。  相似文献   

5.
一种基于会话聚类算法的Web使用挖掘方法   总被引:1,自引:0,他引:1  
Web使用挖掘作为数据挖掘的一个重要任务,有助于了解用户群体的特征,从而为其提供个性化服务.提出了一种基于用户会话聚类的Wei使用挖掘算法.首先,对Web日志预处理采用基于时间窗的用户会话识别方法,提出了一种基于三元组的用户会话表示方法,并在此基础上给出了基于网页语义相似性的会话处理方法,该方法能够在保持用户兴趣不变的情况下有效降低会话维度;其次,提出了一种基于时间及频次的用户会话相似性度量方法;最后,设计了一种两阶段PS-KM会话聚类算法,先用PSO方法进行全局搜索再转入基于K-means方法的局部聚类过程.仿真表明了算法的有效性.  相似文献   

6.
基于网络浏览行为,研究小众领域的用户画像建模方法.本文提出构造领域文本伪本体的方法,并从用户的网络浏览行为中挖掘用户兴趣,生成了基于领域兴趣的用户画像,随后将构建的用户画像应用于个性化推荐领域,解决了小众领域因用户量少、信息不足而难以精准刻画用户画像的问题.该方法在以下三方面显著不同于其他相关研究工作:1)基于领域文本快速构建领域伪本体,构建基于伪本体的用户画像建模方法;2)采用词向量将网页映射到伪本体,构建画像生成算法;3)基于领域概念间相似度构建画像优化算法.最后,本文使用了交响乐团的售票数据及用户的网络浏览数据,采用多个指标进行实证分析,验证了本文提出的画像建模方法的有效性与合理性.  相似文献   

7.
Web日志挖掘可以发现访问者兴趣和需求, 提出了一种改进的以访问时间、点击次数以及访问路径共同刻画用户的访问兴趣的Web日志挖掘算法. 首先以Web日志为基础构建相关矩阵, 使用平均访问时间相似度和访问路径相似度共同度量用户访问兴趣的相似程度, 最后采用直接聚类去除相交项的聚类算法将相似用户和相关URL聚类. 实证分析结果表明该算法能较好地解释用户的实际访问兴趣, 从而为网站提供相应的运营建议.  相似文献   

8.
在基于多服务器结构的分布式虚拟环境中,各服务器之间的负载平衡是系统有效运行的关键问题,围绕该问题开展了工作并主要针对动态区域调整算法中存在的问题进行了改进.首先分析了现有动态区域调整算法在迁移目标服务器选取和待迁移区域选择中的不足,给出了一种基于生成树的动态区域调整算法.算法通过建立生成树选择路径组合的方式,改进了服务器集选取的策略,并在此基础上对集合内的服务器进行基于Cell的待迁移区域选择方法,从而在产生较小开销的同时,提高了负载平衡效果.通过实验对比分析,验证了算法的有效性.  相似文献   

9.
协同过滤推荐算法通常是基于兴趣相似的用户行为来实现个性化推荐, 其核心义用户之间的兴趣相似度. 本文在传统的协同过滤推荐算法基础上, 考虑在线评论对用似度识别的影响. 在混合商品推荐中, 粗粒度识别评论情感极性; 而在同类商品推荐中, 细粒别每个商品特征的情感极性. 如果用户对产品的某个特征评价次数大于平均次数, 表明用户对征较关注; 如果对产品的某个特征评价低于平均评价, 表明用户对该特征较挑剔. 进而根据用户评论来建立用户偏好模型, 用户在评论中反映出来的相似度越高, 表明用户之间的偏好越. 实验表明, 同传统的协同过滤算法相比, 基于在线评论情感分析的用户协同过滤算法在率和召回率指标上有显著提升.  相似文献   

10.
随着Web 2.0技术的发展和推广,社会化标注系统为用户提供了有效表达自我和抒发感情的机会。针对社会化标签的特征,本文提出了一种考虑用户兴趣变化和用户标注信息的协同过滤推荐方法。首先,基于用户的历史记录信息构建了用户原始数据模型;然后将基于艾宾浩斯遗忘曲线的遗忘函数引入原始数据模型构建了用户兴趣模型,其中,利用融合时间权重的文本挖掘技术TF-IDF建立了基于项目类别标签的用户兴趣模型,综合标注标签加权频数和用户评分构建了基于标注标签的用户兴趣模型,融合时间权重和项目评分构建了基于评分的用户兴趣模型;进一步,基于用户兴趣模型并利用余弦相似性以及改进的Pcarson相关系数可计算融合用户评分和标签的用户兴趣相似度,根据用户兴趣相似度可为目标用户构建近邻集合从而生成推荐。实验结果表明,本文所提方法可以较好的考虑到用户的兴趣变化以及用户对标注标签的偏好,并通过对比实验证实该方法比传统的协同过滤方法推荐质量更高。  相似文献   

11.
Anomaly detection has been an active research topic in the field of network intrusion detection for many years. A novel method is presented for anomaly detection based on system calls into the kernels of Unix or Linux systems. The method uses the data mining technique to model the normal behavior of a privileged program and uses a variable-length pattern matching algorithm to perform the comparison of the current behavior and historic normal behavior, which is more suitable for this problem than the fixed-length pattern matching algorithm proposed by Forrest et al. At the detection stage, the particularity of the audit data is taken into account, and two alternative schemes could be used to distinguish between normalities and intrusions. The method gives attention to both computational efficiency and detection accuracy and is especially applicable for on-line detection. The performance of the method is evaluated using the typical testing data set, and the results show that it is significantly better than the anomaly detection method based on hidden Markov models proposed by Yan et al. and the method based on fixed-length patterns proposed by Forrest and Hofmeyr. The novel method has been applied to practical hosted-based intrusion detection systems and achieved high detection performance.  相似文献   

12.
基于共同机制的时间序列关联模式挖掘系统及其应用   总被引:1,自引:0,他引:1  
提出了一种针对不同时间序列间关联模式的发现方法,并阐述了以该方法为基础而构建的关联模式挖掘系统的结构.系统按步骤主要分成序列分割,模式聚类和关联模式挖掘三个部分.其中关联模式的发现基于共同作用机制的思想,即两个不同的时间序列之所以出现频繁的关联模式,必定存在某种共同机制的作用或者二者本身之间有某种因果关系.通过定义可靠度来度量作用强度,并以此作为阈值约束,大大降低了算法的复杂性,伸缩性好,产生的关联模式数量适当.将其应用于股市关联变动模式的发现验证了其有效性.  相似文献   

13.
针对分布式系统,提出了自适应哈希链结构的频繁模式挖掘算法。该算法首先在每个站点产生局部频繁1-项集,再产生全局频繁1-项集,根据全局频繁1-项集产生各站点的投影数据库,在各个站点分别扫描投影数据库中的交易,并根据站点可用内存情况形成相应大小的哈希链结构。通过挖掘各站点的哈希链结构得到全局频繁项集。给出了基本步骤和挖掘算法。研究表明该算法不但效率高,而且适应性强。  相似文献   

14.
基于星图匹配的导弹初始定位定向方法研究   总被引:1,自引:0,他引:1  
论述了星敏感器捷联在弹体上,采用星图匹配技术修正导弹初始定位、定向的原理。提出了一种适用于星光制导的凸多边形算法,简化了弹载星表。由星敏感器视场中的星图,可生成唯一的最大凸多边形,基于凸多边形的星图识别算法可同时获得多颗星的瞬时位置,由此可获得弹体在赤道惯性系和发射点惯性系中的姿态及其关系。最后导出导弹初始定位、定向误差的数学表达式。仿真结果表明该方法的有效性。  相似文献   

15.
一种挖掘频繁模式的数据库划分新方法   总被引:3,自引:1,他引:2  
提出了一种新的数据库划分方法。该方法应用于需要产生候选项的频繁模式的挖掘过程,可以大大减少对数据库的扫描操作,提高数据挖掘效率,特别是对于较长模式的数据挖掘更是如此。该方法是将交易数据库按照交易的长度(或者说模式的长度)划分成若干个子数据库,将等长度的交易划分到同一个子数据库中,这样在获取候选项的支持度时,只需要扫描模式长度大于等于相应候选项长度的子数据库即可,从而减少了对数据库的扫描操作。给出了基于数据库划分的挖掘算法,通过理论推导和实验证明了该方法的有效性。  相似文献   

16.
用户兴趣度的描述是推荐输入研究中的重点问题,论文通过对用户兴趣描述中存在的复杂性和不确定性因素的分析,提出借助Vague集理论解决这一问题难点的思路.论文定义用户评分,用户注册信息,分享,购买,收藏,浏览时间等六项指标反映用户的兴趣爱好,采用Vague集方法得到了六项指标的取值,利用线性加权的方法得到任一用户对任一属性的Vague兴趣度描述.论文的研究在不确定理论研究推荐算法方面奠定了理论基础,同时也为Vague集理论的研究发现了新的应用背景.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号