首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
一种改进的基于树路径匹配的网页结构相似度算法   总被引:1,自引:0,他引:1  
提出一种改进的基于树路径匹配的网页结构相似度算法, 该算法定义了树路径的序列相似度和位置相似度, 找出网页的树路径集合, 通过网页间的最佳树路径匹配计算结构相似度. 实验结果表明, 用改进后的算法计算网页结构相似度比传统树路径匹配方法更符合实际, 更合理有效.  相似文献   

2.
传统协同过滤算法slope one简单高效,但只关注了用户评分之间的关系,而没有考虑到用户之间的相似性。为了使该算法的推荐结果更加精确,基于对slope one算法及weighted slope one算法原理的分析研究,提出将用户相似度与weighted slope one算法相结合的改进算法。同时分析了流行度与平均因子对用户相似度的影响,并对用户相似度公式进行了加权改进。通过标准Movie Lens数据集对slope one算法、weighted slope one算法以及改进的slope one算法进行评估对比,从实验数据中可以看出改进的slope one算法推荐结果更加精确。  相似文献   

3.
为了提高推荐算法的准确率和效率,通过提取遗漏项目的 侧面特征来改进相似度的计算方法,达到最终结果更加接近用户真实兴趣的目标.文中采用的算法中不仅包含了传统的协同过滤算法计算相似度,还引入了对项目侧面特征相似度的计算,通过对周围真实用户的结果记录推理出两种相似度的权重情况,并通过多次实验得到最佳结果的权重.对最终的均方根...  相似文献   

4.
为了解决余弦相似度算法进行数据清洗时重复与相似的数据会使计算量呈几何级增长的问题,提出了基于N-Gram和动态滑动窗口的改进余弦相似度算法.首先通过计算每条数据的N-Gram值,并对数据进行相似度排序,然后定义初始滑动窗口,其窗口值根据N-Gram值的方差动态调整,最后在每个窗口中根据相似度与阀值判断相似数据.实验结果表明,改进的余弦相似度算法在运行速度上有大幅度提高,数据清洗准确率也得到提升,且该算法适用于海量数据的情形.  相似文献   

5.
基于相似度的加权复杂网络社区发现方法   总被引:2,自引:0,他引:2  
针对加权复杂网络中的社区结构发现问题,本文定义基于权重关系的相似度,并在此基础上定义了节点中心度和归属度,改进GN算法的模块度评价函数,提出一种基于相似度的中心聚类算法(SCC).该算法通过计算节点间的相似度,选取合理的中心度大的节点作为社区中心节点,最后基于节点归属度来聚集从而形成社区;同时,提出了用相似度代替边介数的改进GN算法SGN.通过理论分析,并在数据集上进行实验验证,结果表明SCC算法与WGN算法、SGN算法相比,速度和精度上均有较大改善.同时与I2C算法相比,社区的划分有效性更好.  相似文献   

6.
将经典的PageRank算法和汉明距离相似度算法结合,提出一种新的网页排序方法。通过结合汉明距离(Hamming distance)相似度算法,计算检索词和网页文本相似度,提高搜索查准率;在增加检索词的同义词的搜索过程中,通过改进汉明距离相似度算法,提高搜索查全率。实验结果表明,该方法与PageRank算法相比,拥有了更好的效果。  相似文献   

7.
谷春英  张顺利 《科学技术与工程》2013,(10):2871-2874,2879
恶意程序代码的相似度估计是恶意程序代码分析和检测的重要研究内容。现有的方法主要是对恶意程序代码进行属性计算或结构度量,但由于恶意程序代码结构的灵活性和恶意程序代码的伪装、恶意程序代码的相似度较难度量。提出了改进指纹和LSC加权的恶意程序代码相似度估计算法。该算法首先对恶意程序代码进行函数作用域划分和标准化预处理,然后对其进行字串序列化,利用改进的指纹相似度来对恶意程序代码的相似度进行度量;同时结合最大公共字串匹配算法进行结构度量,并对其相似度计算结果进行加权,对恶意程序代码结构的相似度进行综合估计。实验以C语言结构的程序代码为例,利用折半查找算法生成恶意程序代码测试数据集进行算法有效性验证。仿真证明该算法具有较好的恶意程序代码相似度估算精度。  相似文献   

8.
为了提高协同过滤推荐算法的推荐准确度,降低对未评分项目的评分预测误差,提出了一种针对修正余弦相似度改进的协同过滤推荐算法.一方面,为了解决修正余弦相似度中未考虑项目热度的问题,在传统的修正余弦相似度基础上引入热门项目惩罚因子;另一方面,为了克服改进的修正余弦相似度公式高度依赖共同评分数量的限制,引入JS散度并改进,将改...  相似文献   

9.
针对由于用户评价矩阵的数据稀疏性而导致推荐精度和准确率不高的问题,提出了一种基于双层相似度的协同过滤算法。经典算法通过改进某一种相似度或者混合相似度来提高推荐精度和准确度,本文对此进行了改进,将最近邻相似度和最近评分相似度两个概念进行区分,采用双层相似度来寻找这两个概念层次的邻居。第1层用来寻找与用户行为偏好的最近邻居,基于用户共同评价行为和差异行为的对数似然比及用户物品属性偏好相似性来实现。第2层用来寻找在评分意义上的最近评分邻居,通过改进的皮尔森相似度衡量用户评分上的相似性,给用户未知的物品进行评分预测。在Movielens数据集上的实验结果表明,本文算法能够快速排除干扰找到用户邻居,极大地提高了推荐系统的精确度、准确率。  相似文献   

10.
知网是一个英汉双语本体,含有丰富的语义知识.在综合考虑了知网中义原重合度、义原差度、层次深度等因素的基础上,提出了一种新颖的义原相似度计算方法,并在义原相似度计算的基础上,通过改进的匈牙利算法来计算基于知网的概念相似度,最后通过实验验证算法的有效性,与基于WordNet的方法相比,文中提出的基于知网的相似度计算一样可以取得较好的精确度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号