首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 425 毫秒
1.
针对目前推荐系统存在的用户评分稀疏性现象,该文提出了一种基于上下文学习和张量分解的个性化推荐算法,算法通过利用用户之间共同评价的项目的上下文信息与评价过项目的用户上下文信息分别构建两个三阶张量,并应用高阶奇异值分解充分挖掘上述两个三阶张量实体之间潜在的关联关系,并将张量分解后的两个三维张量进行组合进而得到最终的推荐列表,以响应用户个性化请求.实验结果表明,该算法可以有效地对上下文信息进行建模,可以显著提高在数据稀疏情况下的推荐质量.  相似文献   

2.
现有基于低秩表示的子空间聚类算法(LRR)无法有效地处理大规模数据,聚类正确率不高,以及分布式低秩子空间聚类算法(DFC-LRR)不能直接处理高维数据.为此,文中提出了一种基于张量和分布式方法的子空间聚类算法.该算法首先将高维数据视为张量,在数据的自表示中引入张量乘法,从而将LRR子空间聚类算法拓展到高维数据;然后采用分布式并行计算得到低秩表示的系数张量,并对系数张量的每个侧面切片稀疏化,得到稀疏相似度矩阵.在公开数据集Extended YaleB、COIL20和UCSD上与DFC-LRR的对比实验结果表明,文中算法能有效地提高聚类正确率,且分布式计算能明显降低算法的运行时间.  相似文献   

3.
高速公路交通流具有多维时空动态特征,其实际调查的数据存在过量随机异常的数据,导致有关调查数据的质量无法满足高速公路主动安全管理对路网各层级交通流调控的需求.利用张量理论所具有的良好多维时空数据处理能力,构建考虑短期波动、长期趋势和车道空间信息的多维时空动态张量矩阵,提出一种基于多维张量分解思维的梯度下降Tucker分解的数据质量控制算法,有效弥补传统数据质量控制方法对交通流数据内在时空关联信息利用不足的情况.选取G4京港澳高速公路杜家坎路段实际速度数据作为研究对象,选择车道维度、时间维度、时间间隔维度,构建多种不同张量矩阵形式,对算法进行实证分析.结果表明:所提出的数据质量控制算法具有良好的高速公路交通流数据修复效果.其中,以车道、天数、5min采集时间间隔3个维度所构建的张量形式修复效果最好,95%测试数据的修复值与实际值的误差在(-5%,+5%)范围内.  相似文献   

4.
为了便于用户浏览网页信息,基于全置信度关联分析,提出了一种网页层次聚类的方法。该方法采用向量空间模型表示网页文档,将文档看成事务,文档的词汇视为事务中的项,根据关联挖掘算法发现文档之间的强关联规则产生基本类,然后利用图划分的算法完成网页文档的层次聚类。在关联规则产生过程中采用全置信度量发现强关联模式,规则的产生不受支持度阈值设置的影响,即使支持度闽值设置为零,也能发现强关联模式,有效地消除了弱相关的交叉支持模式。  相似文献   

5.
为了处理张量数据,传统的学习算法常常把张量展成向量,但会造成破坏原始数据固有的高阶结构和内在相关性,导致信息丢失,或产生高维向量,使得后期学习过程中容易出现过拟合、维度灾难和小样本问题.近年提出了许多基于张量模式的分类算法,而支持高阶张量机算法是张量分类算法中最有效的方法之一.考虑到张量的高维性和高冗余性,本文提出基于多线性主成分分析的支持高阶张量机分类算法(Multilinear Principle Component Analysis Based Support High-Order Tensor Machine,MPCA+SHTM).该算法首先利用多线性主成分分析对张量进行降维,然后利用支持高阶张量机对降维后的张量进行学习.在12个张量数据集上的实验表明:MPCA+SHTM在保持测试精度的情况下有效地降低了SHTM的计算时间.  相似文献   

6.
利用毫米波信道的稀疏散射特性和张量的空间结构,提出了一种随机网格张量分解的信道估计方法,接收信号被表示为一个四阶张量,采用随机张量压缩对单个用户信道进行解耦;采用网格张量分解方式,将大尺度的用户信道张量分解为若干个小尺度张量,并行且独立地分解所有子张量,由相关因子矩阵估计信道参数.仿真结果表明,该算法能获得较为准确的信...  相似文献   

7.
为了解决星载甚高频数据交换系统(Very-high-frequency data exchange system,VDES)接收的碰撞信号在欠定情况下的分离问题,提出一种基于随机近端梯度张量分解的多通道碰撞信号分离算法.该算法根据分离模型对预处理后的信号建立广义协方差矩阵集,堆叠形成张量模型,利用Tucker分解进行压...  相似文献   

8.
为了探索非凸方法在多视图聚类方面的应用, 本文基于非凸替换函数和子空间学习, 提出非凸张量多视图子空间聚类算法. 该算法不仅对多视图数据进行自表示学习来达到学习低维子空间的目的. 而且采用带有旋转的张量结构对张量的高阶关联进行挖掘. 同时, 使用非凸函数替换以及广义奇异值算子进行张量最小化问题的求解, 从而实现对张量秩的近似. 最后基于联合优化所得关联/仿射矩阵实现聚类操作. 在不同类型的多视图数据集上的大量实验验证了该方法的聚类效果.  相似文献   

9.
针对传统多视角学习算法只关注从多视角中提取共享信息而忽略了各视角的特有信息和高阶关联的问题,提出了一种基于截断核范数的低秩张量分解的多视角谱聚类算法。计算各视角的样本相似度矩阵和转移概率矩阵,构建一个包含各视角马尔可夫转移概率矩阵的张量,从而保留各个视角的信息。采用基于张量奇异值分解的截断核范数约束目标张量的秩。通过最小化张量截断核范数,学习到一个既包含各个视角共享信息又具有高阶关联的张量。利用迭代最优化算法求解目标函数,将求得的目标张量输入谱聚类算法得到聚类结果。在4个不同类型数据集上进行实验并与传统聚类算法进行了对比,结果表明:所提算法在4个数据集上的标准互信息度量值比标准谱聚类算法的分别提高了7.9%、24.9%、29.5%、8.1%,比LT-MSC算法的分别提高了3.4%、18.1%、17.6%、6.6%。通过对非负平衡参数在0.000 1~100之间的测试发现,所提算法表现基本稳定,在非负平衡参数取0.1~1之间表现良好。与传统多视角聚类算法相比,所提算法可有效增强各视角之间的互补性和高阶关联,并且具有良好的准确性和鲁棒性。  相似文献   

10.
提出一种有效的基于概念格的分布式挖掘算法,重点讨论由部分量化规则格提取的部分关联规则的合并技术,由于能对已存在关联规则的再利用,从而更有利于用概念格来挖掘关联规则.该算法根据对局部关联规则挖掘结果的分布式合成,有利于减轻网络频繁的通讯负担,体现并行计算、异步异构数据挖掘的优点.  相似文献   

11.
仲波  张远平 《科学技术与工程》2006,6(24):3863-38663870
基于随机响应技术,提出了一种在保护隐私的关联规则挖掘中对包含三个属性值的序数型数据进行伪装的方法.设计了在伪装的数据集上进行挖掘的算法;分析了算法的安全性及复杂度。并通过实验表明,该算法在伪装的数据集上挖掘出来的规则与原规则相比,相对误差不超过5%。  相似文献   

12.
In communication alarm correlation analysis,traditional association rules generation(ARG) algorithm usually has low efficiency and high error rate.This paper proposes an alarm correlation rules generation algorithm based on the confidence covered value.Confidence covered value method can judge whether a rule is redundant or not scientific After the rules that based on weighted frequent patterns(WFPs) generated,the association rules were deleted by the confidence covered value,in order to delete the redundant rules and keep the rules with more information.Experiments show that the alarm correlation rules generation algorithm based on the confidence covered value has higher efficiency than the traditional method,and can effectively remove redundant rules.Thus it is very suitable for telecommunication alarm association rules processing.  相似文献   

13.
针对目前短时交通流预测算法多考虑交通流的低维信息特征,导致无法满足预测精准度要求等问题,引入高精度低秩张量填充理论(HALRTC),构建基于周、天、时段等多时间维度的动态张量模型,设计了一种融合高维交通流特征的短时交通流预测算法,并以京港澳高速公路杜家坎路段交通流速度数据为例进行实证验证。研究结果显示,算法能够基于较少历史数据较快达到良好预测效果,可有效实现针对工作日与非工作日的交通流预测,平均绝对误差(MAE)平均值约为3.6%,并能及时跟踪交通流波动性。在缺失数据情况下,所提出算法预测精度随数据缺失比例增大而降低,但相较于3种经典预测算法可表现出更好的预测精度。  相似文献   

14.
由于在实际的数据挖掘过程中容易出现无用的频集和冗余的规则,所以降低频集和规则的冗余度可大大提高挖掘的质量,这也是数据挖掘中一直被关注的问题,提出了一个用等价类生成关联规则的方法,算法主要在频集的基础上建立项集的等价关系,进而对项集划分等价类,同时将得到的关联规则划分为精确关联规则和近似关联规则两个集合,通过等价类,不但可以很容易地生成所需要的关系规则,同时可以方便地判断数据之间依赖关系的强弱,同时,项集的等价关系在实际应用中也很有利用价值,算法最后的规则结果集剔除了由来自同一等价类中的面集的重复出现构成的冗余规则,从而得到了较小的关联规则集合。  相似文献   

15.
提出了一种改进的Tucker分解法,将二维的张量分解到两个维度中.分别通过改进Tucker和Tucker算法的矩阵减秩和收敛运算,得到保存完整信息的原张量的近似估计值.仿真实验结果表明,改进Tucker算法提高了系统的检测性能.  相似文献   

16.
为恢复多声道音频在采集过程中丢失的数据,提出基于加权优化的张量分解方法.首先用张量对音频建模,并且根据其尺寸定义一个标识数据丢失位置的加权张量,然后使用加权最小二乘问题描述CANDECOMP/PARAFAC(CP)模型并通过一阶优化算法求解,最终通过获得的因子矩阵恢复音频.通过不同数目通道数据丢失的隐藏参考和基准的多激励测试,说明针对丢失数据采用CP分解方法是有效的,即张量分解能够得到较好的音频恢复效果.   相似文献   

17.
介绍数据挖掘中关联规则的情况.在分析关联规则挖掘算法的基础上,对经典Apriori算法进行改进,改进算法意在通过减少生成候选频繁项集的数量和扫描数据库次数.从而,加快算法的执行效率和节省空间.  相似文献   

18.
一种实时有效的蜂群模式挖掘算法   总被引:1,自引:0,他引:1  
针对实时相关运动模式挖掘应用的需求,提出了一种实时地发现关闭蜂群模式的簇重组算法(CLUR).该算法维护一个候选蜂群模式列表,在每个时间戳采用基于密度的聚类算法对移动目标进行聚类,根据聚类结果组合所有的最大移动目标集,记录相应的时间集,然后构建候选蜂群模式,并更新到候选列表.算法给出了三种更新规则和一种插入规则,用于实现候选蜂群模式列表的更新,同时降低了候选列表的冗余度,提高了算法的效率.在每个时间戳结束时可通过关闭检测规则实时地发现当前时刻的关闭蜂群模式.在合成数据上的综合实验验证了CLUR算法的正确性、实时性和高效性,CLUR算法适用于实时相关运动模式挖掘系统.  相似文献   

19.
基于检测器数据的时空相关性,为缺失数据修复模型动态地选择解释变量,在综合考虑检测器数据的周期性趋势和实时变化特性的基础上,提出了一种改进的缺失数据修复方法.对上海市南北高架的线圈流量数据进行数据修复精度测试.结果表明,相较于传统的支持向量回归(SVR)模型,该方法在3个测试检测器上的数据修复平均绝对误差分别减小了3.80%、3.40%、25.23%,并且在数据连续缺失1~10个时平均绝对百分比误差均低于6%.  相似文献   

20.
因初始项集中的数据特征相关,使关联规则Apriori算法的数据挖掘结果存在误差.为了解决这个问题,结合粗糙集理论(RST),提出一种改进的关联规则数据挖掘算法;然后,将该算法应用到软件工程风险因素和风险缓解因素管理分析中,提出一种新的软件工程适应性结构.仿真结果表明,该改进算法提高了挖掘数据的效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号