首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
为了解决Levenshtein距离算法在长文本和大规模匹配效率的不足,本文针对Levenshtein距离算法提出一种提前终止的优化策略.首先根据Levenshtein距离矩阵中元素内在的联系,归纳总结出一个递推关系式.再依据此递推关系式,提出一种提前终止策略,可提前判断两个文本是否满足预先设定的相似度阈值.经过多个学科题库判重实验的佐证,本文的提前终止策略能显著减少计算时间.  相似文献   

2.
基于快速留一交叉验证的核极限学习机在线建模   总被引:1,自引:0,他引:1  
提出了一种基于快速留一交叉验证(FLOO-CV)的在线核极限学习机(OKELM),以逐次增加新样本与删除旧样本的方式进行在线训练;设计了一种无需人为设定、能够根据系统过程特性自适应改变的FLOO-CV预测误差阈值,根据误差阈值仅引入预报误差较大的样本对模型进行更新,以提高模型的稀疏性和泛化能力;利用Hermitian矩阵求逆引理实现了对网络输出权值的递推求解,减小了在线存储空间和计算时间.经混沌时间序列预测和连续搅拌釜式反应器的过程辨识结果表明,相比于离线核极限学习机、无稀疏策略的在线核极限学习机和在线序贯极限学习机,OKELM具有更快的计算速度和更高的学习精度.  相似文献   

3.
针对协同过滤面临的一些本质问题,如数据稀疏和冷启动,本文提出了融合用户相似度和加权的信任传播来重组信任矩阵的方法。首先,将原始信任矩阵中用户相似度低于某一阈值的信任关系去掉;其次,将评分矩阵中用户相似度高于某一阈值的用户对添加到信任矩阵中;最后,考虑加权的信任传播,以此找到更多的信任邻居并对不同距离的信任邻居进行区分。在Epinions和Film Trust数据集上进行的对比实验结果表明,重组信任矩阵的方法能够有效地提高推荐精度,并在一定程度上解决了冷启动问题。  相似文献   

4.
针对文本在聚类或分类时,由于数据高维稀疏导致相似度值低的问题,提出一种基于改进文本相似度计算的聚类方法.首先,利用向量空间模型VSM表示文本,采用余弦函数计算文本之间的相似度;然后,基于网络中节点的相似性传播原理,通过设置阈值找到与各个文本相似度较大的文本集合,进而使用Jaccard系数将两个文本之间相似度计算转化为两个文本集合之间的相似度计算;最后根据得到的文本相似度矩阵,利用谱聚类算法对文本进行聚类.在WebKB上的实验结果表明,与传统的K-means、谱聚类方法相比,该方法提高了聚类的准确度,召回率与F值.  相似文献   

5.
多视角子空间聚类是一种利用视角之间的互补信息,找到视角间统一的表示并发现潜在分组结构的方法,近年来已成为机器学习的研究热点.提出一种基于低秩稀疏约束的自权重子空间聚类算法.具体的,低秩稀疏约束能发现数据的全局和局部结构信息,使自表示矩阵呈现稀疏性和低秩的特点;而自权重方法利用视角表示矩阵与共享相似度矩阵之间距离的反比为每个视角分配合理的权重,同时学习到一个视角之间共享的相似度矩阵,降低受损视角对于共享相似度矩阵的影响.以上提到的两种方法组成一个统一的优化框架,再使用增广拉格朗日乘子交换方向最小化方法(ALMADM)对提出的聚类算法进行优化.在基准数据集中的实验结果证明该算法比其他算法更有效.  相似文献   

6.
非负矩阵分解(NMF)是一种有效的数据降维方法,广泛应用于图像聚类等领域.然而,NMF不能捕获数据固有的几何结构,所以基于图的非负矩阵分解被提出.基于图的算法大多使用K-近邻来构造相似度图.由于数据中的异常值和错误特征,直接构造图是不准确的.针对上述问题,提出了基于学习一致性相似度矩阵的图非负矩阵分解方法.该方法首先通...  相似文献   

7.
提出了一组尺度化的Broyden-ABS算法. 算法中Jacobian矩阵的行向量为一组可变的尺度化Broyden公式所递推,在迭代过程中,行递推一直保持Jacobian矩阵的稀疏性. 文章的最后一节,在标准假设下,证明了该方法的超线性和收敛性  相似文献   

8.
当前的图像修复算法在处理小面积损坏图像时,可取得较佳的视觉质量;但难以用于高对比度边缘和高频分量的大面积损坏图像的修复,存在明显的模糊效应与块效应,使得修复质量较差。对此,提出了结构相似度索引耦合优化稀疏表示的大规模损坏图像动态修复机制。基于数据度与置信度构造图像块先验模型,提取损坏图像的已知块;再引入K-SVD算法和拉格朗日乘数机制,构造最优字典矩阵,优化稀疏表示,以重构目标图像损坏区域;并设计结构相似度索引与动态更新机制,估算稀疏表示系数,并动态更新字典矩阵,输出修复图像。最后测试了其机制性能。结果表明:与当前图像修复算法相比,在大规模损坏图像与高对比度边缘图像修复中,具有更好的修复效果、更高的相似度,显著消除了模糊效应与块效应。  相似文献   

9.
在对现有的概率矩阵分解算法研究的基础上,针对其中只使用评分信息来做预测存在较大误差的问题,提出了一种结合用户相似度的社会化推荐算法(SRUS).首先,以概率矩阵分解算法(PMF)为基础,结合用户相似度信息进行建模;其次,使用潜在特征空间将评分矩阵和相似度矩阵关联到一个统一的框架中;最后,对这2个矩阵进行矩阵分解,实现算法的优化推荐.将这一算法与PMF算法进行比较,实验表明,SRUS算法在数据稀疏性、冷启动和精确性方面具有更优的效果.  相似文献   

10.
针对基于社交网络的事件推荐覆盖性和准确性不够高的问题,提出了基于用户相似度Si-user Walker算法.该算法利用基于事件的社交网络特征,将线上用户群组数据抽象为图,以重启随机游走算法为基础,改变了传统的完全基于图的拓扑结构进行随机游走的策略.根据地理位置划分事件类型,提出了新的用户相似度计算方法,然后根据用户相似度矩阵作为随机游走的转移概率,既保留了图的传递性,又保证了图节点游走的真实性.与其他推荐算法在真实的数据集上实验表明,该算法在均方根误差、准确率及覆盖率上均得到提升.  相似文献   

11.
为了解决评分数据的稀疏性和用户最近邻的精确性问题,文章提出了一种基于奇异值分解(singular value decomposition,SVD)和项目属性的协同过滤推荐算法。该算法首先采用SVD方法对用户-项目评分矩阵降维,得到用户矩阵和项目矩阵,根据项目矩阵计算项目间的评分相似度,同时根据项目属性计算项目间的属性相似度,将2种相似度的结果加权计算得到项目间的相似度,最后采用最近邻的方法预测目标用户对待评分项目的评分。在MovieLens数据集上的实验结果表明,该文所提出的方法可以有效应对用户评分稀疏的问题,并能提高推荐的准确性。  相似文献   

12.
针对最小二乘支持向量机对训练样本内噪声比较敏感和其稀疏性差的问题,提出基于密度k-近邻向量的训练样本裁剪算法。对训练样本的各个样本类进行聚类,删除噪声数据,提高支持向量机的训练精度。通过计算出每个样本类的平均相似度和平均密度,得到样本的类相似度阈值;根据相似度阈值,将小于类相似度阈值的样本进行合并,减少训练样本总数。实验结果表明,该算法在保证训练精度的情况下,减少了支持向量数目。  相似文献   

13.
针对核极限学习机(Extreme Learning Machine with Kernel,KELM)在线应用过程中,核矩阵膨胀,导致算法复杂性不断上升,且难以跟踪系统时变特征的问题,以滑动时间窗为基本建模策略,提出了一种新的KELM在线稀疏学习算法.在前向与后向稀疏化过程中,基于提出的构造与修剪策略,通过在线最小化字典的积累一致性,可选择一组具有预定规模的关键节点.在增样学习与减样学习过程中,基于节点选择结果,利用矩阵的初等变换与分块矩阵求逆公式,模型参数能被在线递推更新.提出的算法被用于混沌时间序列预测与音频放大器状态预测.实验结果表明:相比于4种流形的在线序贯ELM算法,提出的方法在花费相似的测试时间的条件下,能够显著提升预测精度,且具有较好的稳定性.  相似文献   

14.
针对超声图像连续性差、自身具有稀疏性的特点,提出了一种适用于超声图像的压缩感知重建方法。该方法以小波变换为稀疏基,Hessenberg矩阵为测量矩阵,引入正交匹配追踪(OMP)算法实现了超声图像的重建。超声C-扫描图像重建结果表明在观测数据采样率降低、数据缺失等条件下均能清晰的成像,验证了该方法的有效性。此外,本文给出Hessenberg测量矩阵的有限等距性(RIP)性质证明;并与基于Toeplitz测量矩阵的图像重建方法进行了比较,实验结果表明利用本文方法的重建图像在平均结构相似度(SSIM)、峰值信噪比(PSNR)和三维差值图等指标上均较优。该压缩感知重建方法在采样率为50%,原始数据较差的前提下,成功恢复出相似度在80%以上的超声图像。  相似文献   

15.
稀疏子空间聚类是处理高维数据聚类的有效途径,而相似度矩阵的构造是稀疏子空间聚类的关键一步。文章引入子空间追踪算法来构造相似度矩阵,并由此给出了保证特征选择和特征再选择的充分条件。数值实验表明,子空间追踪算法所选择的原子相比经典的正交匹配追踪算法,其选择的原子更具代表性,精确特征选择率更高,聚类误差也得到了保留甚至更低。  相似文献   

16.
传统基于物品的协同过滤算法由于物品相似度矩阵稀疏,推荐准确率不高.针对这一问题,提出一种基于标签和改进杰卡德系数的协同过滤算法,进行电视节目个性化推荐.首先,爬取相关信息对原始数据进行扩充,并利用统计学方法对时间特征进行归一化处理,计算用户偏好系数;然后,统计出现次数较高的类别作为推荐类别标签,并利用改进的杰卡德系数构造标签相似度矩阵;最后,根据推荐类别标签的用户偏好系数计算节目的推荐系数.实验结果表明,基于标签的协同过滤算法可以降低稀疏矩阵对推荐准确率的影响,相比基于物品的协同过滤算法,准确率提高了5%,召回率提高了3.1%.另外,使用改进的杰卡德系数计算相似度,减少了热门标签对推荐系统的影响,进一步将准确率提高了5%,召回率提高了2.3%.  相似文献   

17.
随着云计算等新型服务计算的兴起,Web服务数量日益增长,相同或相似功能的Web服务也逐渐增多.为了向用户推荐更高质量的服务,精确地预测Web服务的QoS值成为亟待解决的重要问题.传统的协同过滤方法已经被广泛应用于QoS预测和Web服务推荐中,但因为数据稀疏和噪声问题导致QoS预测性能不好.为提高QoS预测的性能,文中通过分析用户服务QoS矩阵的时空特征,提出了一种基于全局和局部结构相似度的稀疏矩阵分解模型.该方法将QoS矩阵的相邻时间相似用户的网络环境相似性这一特征融入到矩阵分解中,并利用分解的因子对QoS矩阵进行低秩填充.这种方式在一定程度上消除了数据稀疏和噪声的影响.在真实Web服务调用数据集上进行实验,结果表明,该方法在预测精度上优于典型的协同过滤算法(相比于NMF,其MAE值最大下降了3.25%,RMSE值最大下降了6.65%;相比于SVD,其MAE值最大下降了3.67%,RMSE值最大下降了7.01%),能够有效地解决数据稀疏和噪声的问题.  相似文献   

18.
基于核矩阵优化方法的本体算法   总被引:1,自引:1,他引:0  
彭波 《科学技术与工程》2013,13(26):7692-7696
本体相似度计算和本体映射被广泛应用于查询扩展和图像检索中,已成为信息科学研究的热点内容,其核心为计算本体图中顶点间的相似度。用核矩阵表示本体图中每一对顶点的相似度,根据相邻顶点相似度大、不相邻顶点相似度小的特征,结合转换函数的光滑性得到核矩阵优化模型,求解模型得到最优核矩阵。将此方法分别应用于生物GO本体和数学学科本体,通过实验表明新本体相似度计算和本体映射算法有较高的效率。  相似文献   

19.
针对发动机状态在线预测中样本累积、预测模型膨胀和在线更新速度慢等问题,提出了基于增量稀疏核极限学习机的在线预测方法.该方法定义了KELM核函数矩阵的稀疏测量矩阵,并根据矩阵原子相干最小化和自信息量最大化的样本信息度量准则实现在线样本前向稀疏与后向删减,提高了样本稀疏化效率.利用有效样本对测量矩阵在最佳阶数内进行在线扩充与修剪,限制了预测模型膨胀.利用改进的增量建模方法对模型的核权重矩阵进行递推更新,从而建立规模有限且结构稀疏的在线预测模型,提高了在线建模速度.仿真数据和发动机状态参数在线预测实验结果表明,与现有在线预测方法相比,ISKELM具有更高的样本稀疏化和在线建模效率.对发动机排气温度进行120步预测时,预测速度分别提高了80.50%和31.72%,预测精度分别提高了48.56%和15.81%.   相似文献   

20.
MC-CDMA系统中的多进制联合稀疏图设计   总被引:1,自引:0,他引:1  
为解决移动通信系统过载传输,在稀疏图多址接入基础上,将低密度扩频技术拓展至多载波传输系统,设计了基于多载波码分多址(MC-CDMA)的多进制联合稀疏图.该多进制联合稀疏图通过变量节点和置换节点,将低密度扩频矩阵和多进制低密度奇偶校验码(LDPC)校验矩阵结合起来,使得系统的接收端能够在整幅稀疏图上同时完成多用户检测和信道译码.多进制联合稀疏图融合了扩频、多载波调制和信道编码等技术,包含多维信号的综合协作处理.计算机仿真表明,多进制联合稀疏图MC-CDMA在系统严重过载情况下,仍然能达到理想的通信性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号