首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
为了实现空气质量的在线预测,提出了一种基于XGBoost算法的改进集成学习算法OPGBoost。首先对PI(plant information)实时数据库系统进行二次开发,构成大数据挖掘与分析平台,运用数据融合工具对原始数据进行预处理,并采用Boruta算法进行特征选择,从而构造出包含更多属性特征量的有效数据集。然后对XGBoost算法中的一阶和二阶导数进行优化,并通过时间滑动窗口和衰减函数机制获取训练数据以及训练模型的权重,最后采用Bagging集成学习策略构成OPGBoost组合模型。实验结果表明,针对基于PM2.5浓度和AQI表征的空气质量预测,本文方法与4种已有算法相比在准确性和实用性方面具有明显的优势,能够较精确地预测未来1、12、24h的空气污染情况。  相似文献   

2.
由于能反映用户的偏好,可以弥补传统频繁项集挖掘仅由支持度来衡量项集重要性的不足,高效用项集正在成为当前数据挖掘研究的热点.为使高效用项集挖掘更好地适应数据流环境,提出了一种基于事务型滑动窗口的数据流中高效用项集挖掘算法MHUIDS.首先在二进制向量的基础上,提出了高事务加权效用项集树(HTWUI-树)的结构.进而分别给出了事务型滑动窗口初始化与滑动的算法描述.最后,提出了高效用项集的剪枝策略与挖掘算法.实验结果表明,MHUIDS算法具有较高的挖掘效率及较低的存储开销.  相似文献   

3.
针对时间序列,研究和分析时序关联规则挖掘,提出时序关联规则数据挖掘的基于滑动窗口和时序树特殊结构的新的挖掘算法,并利用该算法挖掘超过给定支持数阈值频繁时序,为用户的决策支持及趋势预测提供支持,并通过实验验证算法的有效性和实用性。  相似文献   

4.
提出1种基于Bitmap的活动时间冲突查询算法。首先对原始数据预处理以构建Bitmap索引结构,然后构建两阶段查询算法:第1阶段遍历Bitmap索引得到满足各个活动持续时间的候选时间区间和候选用户集合,并过滤其中的无效用户、调整候选时间;第2阶段完成冲突区间组合优化,获得不冲突条件下活动组织的全局最优方案;最后,以8 628个用户的50 000条真实数据(时间跨度为1月)进行实验,分为单活动及多活动场景,以用户数量、时间范围、活动数量、持续时间等为测试指标,对比本文算法与滑动时间窗口法测试结果。研究结果表明:本文提出的算法能够满足大规模、涉及时间冲突的活动组织查询的时效性要求,该算法查询速度比滑动时间窗口法的查询速度快,单活动场景下其查询响应速度约为滑动时间窗口法的100倍。  相似文献   

5.
多尺度滑动窗口是众多目标检测方法采用的搜索策略,但数量巨大的窗口(约十几万的量级)使得计算复杂度大大增加,降低了算法的有效性。为此,候选框算法替代滑动窗口方法被应用于目标检测中。分析评价候选框算法在车辆检测中的应用效率。构造了图像规模为1000的车辆数据集。采用此数据集,研究分析了Edge boxes算法、Selective search算法和Objectness算法的召回率和计算效率。根据场景和光照条件,选取了阴影场景、拥堵场景、夜间场景来分析不同算法的性能并探讨了其局限性。实验结果证明,Edge boxes算法在整体数据集中性能最优,召回率为0.91。但其在夜间场景中仅为0.4左右,此类场景下算法性能并不理想。  相似文献   

6.
离群数据挖掘是数据挖掘中的重要内容.本文针对时间序列数据进行离群数据挖掘方法的研究.在引入了基于局部离群点因子的离群数据挖掘方法与时间序列上滑动窗口基础上,将二者相结合,提出了基于滑动窗口的时间序列离群数据挖掘算法,并将算法应用于海表温度数据得到海表温度的异常之处.  相似文献   

7.
基于滑动窗口的遥感图像人造目标检测算法   总被引:1,自引:0,他引:1  
提出一种基于滑动窗口的人造目标检测算法.首先,根据图像的平滑性将整个图像划分为平滑与非平滑图像区域;然后,在非平滑区域随机生成一系列滑动窗口,并融合4种目标特征的度量准则构造一个判别滑动窗口目标性的评分函数,检测算法根据评分函数的取值判别窗口中是否包含人造目标;最后,在人造目标图像集上进行的实验表明:该算法能准确地检测出图像中的人造目标,并具有一定的抗噪声干扰能力.  相似文献   

8.
文章在宏块层的码率控制中使用线性R-Q模型,该模型与二次R-Q模型相比可以更好地克服模型参数抖动的问题.在R-Q模型参数更新时,提出了改进的2D滑动窗口进行数据选择,相对于JVT-H017提案里的窗口更加充分地挖掘了空间相关性;同时提出了新的MAD预测模型,该模型相对于JVT模型达到了更加精确的预测效果.仿真实验结果表明,该算法与原JVT相比峰值信噪比得到了明显的提高,比特分配比JVT平稳且更加接近目标比特.  相似文献   

9.
基于智能手机用户在输入身份验证密码和滑动触摸屏过程中的个人独特行为特征,提出了两种身份验证方案,将单类支持向量机(OCSVM)算法应用到身份验证模型中,采用网格搜索算法获取模型的最优参数.实验结果显示两种身份验证方案都具有较好的泛化能力和验证精度,身份的验证过程不会干扰正常的用户操作.  相似文献   

10.
为了进一步提高招生数据挖掘的有效性,将FP-growth算法与分层线性模型相结合,用于高等院校的招生数据挖掘;利用FP-growth算法,通过频繁集的生成与关联规则,从高校历史招生数据中获取置信区间大的关联数据;采用单层和多层线性模型,将学生层面变量与学校层面变量相结合,确定招生数据挖掘有效变量;在分别建立单层线性模型和多层线性模型后,借助多层线性模型软件库,求解模型的系数和显著性检验水平。实例仿真结果表明,通过对比不同变量的系数和显著性检验水平,所提出的模型能够有效分析不同变量对招生录取的影响。  相似文献   

11.
一种基于可变滑动窗口的数据流分段聚类算法   总被引:2,自引:2,他引:0  
数据流的应用越来越广泛,数据流挖掘成为数据挖掘的重点研究方向之一。在分析各种数据流聚类算法的基础上,提出了一种基于可变滑动窗口的数据流分段聚类算法。算法以时间序列数据流模式表示技术为参考,以去除噪音和压缩数据为目的,实现了数据流的特征提取和概要存储。实验表明,算法具有低时空复杂度、自适应等特点。  相似文献   

12.
针对社交网络用户个人信息难以获取、公开信息不完整、不通用甚至内容虚假的问题,选择了普适性强,且能客观、真实反映用户行为习惯的位置数据作为相似性分析依据,对新浪微博、滴滴打车进行位置数据采集,形成两个高价值且具有国内网民特色的数据集作为实验对象.提出了一种基于时间滑动窗口模型的轨迹相似性匹配算法,通过调整时间窗口和位置距离优化算法F值,实现不同网络平台用户的相似性分析.以对新浪微博和滴滴打车的用户位置数据为例进行验证,实验结果证明了地理位置为虚拟身份相似性判断的正相关影响因子,且判断相似性的平均F值超过90%.   相似文献   

13.
针对不同时间段的数据流对当前数据流分类影响程度不同,在滑动窗口技术基础上提出了时间窗口权值的频繁模式(TWWFP)分类算法.首先,对滑动窗口中的每个基本窗口赋予一个与时间有关的窗口权值;然后,采用TWWFP-Tree结构存储当前滑动窗口中每个基本窗口中的频繁数据属性,实时更新TWWFP-Tree结构;最后,检测相邻3个滑动窗口中权值属性的平均分类误差,发现突变后及时减少下一个滑动窗口的长度可适应数据流的变化.实验证明该分类算法比没有时间窗口权值分类算法的精确度最大提高3%.  相似文献   

14.
Web日志挖掘及AprioriAll算法的改进   总被引:2,自引:0,他引:2  
阐述了利用数据挖掘技术对Web日志进行挖掘的可能性及其重要作用.通过用户维的引入,对已有的Apri-oriAll算法进行了改进,改进后的算法降低了原算法的时空复杂度,特别是在新算法中可以对Web日志数据按用户维进行切片,消除了原算法中的I/O相关性.这不仅使对Web日志数据进行的挖掘活动可以分散地进行,而且使多机连网分布式挖掘成为可能,同时还可以实现对Web日志的增量挖掘和动态挖掘.此外,该改进算法的特殊意义还在于它不仅可以将所有用户看作一个整体进行挖掘,而且还可以对不同的用户个体的行为进行独立地挖掘,使挖掘出的结果能够满足对用户个性化使用的需求.  相似文献   

15.
心音信号的短时傅立叶变换分析   总被引:6,自引:2,他引:4  
心音信号是一种典型的非平稳信号,短时傅立叶变换(STFT,又称窗口傅立叶变换)是用于对非平稳信号进行时频分析的有效工具.在用STFT分析心音信号时,窗口宽度的选择是非常重要的.一方面,要使用尽可能窄的窗口来保证信号的局部平稳性,另一方面,要选用较宽的窗口来提高频率分辨率.如何处理这一矛盾就成了问题的关键.通过调整滑动时间窗的宽度,达到了比较满意的效果.首先用窄时间窗进行分析,频谱图具有高时间分辨率,得到了心动周期等时域特征参数.进而逐渐加宽时间窗,最后得到高频率分辨率的频谱图,可以看出各心音成分的频谱特征.实验结果表明,不同时频尺度的STFT分析可以很好地描述正常心音信号的时域和频域特征.  相似文献   

16.
为提高车道线检测算法的准确性与稳定性, 提出一种基于双向窗口特征提取技术的车道线检测算法。融合运用Hough 变换与边缘分布函数技术得到车道线的直线特征点; 运用双向窗口特征提取技术获得所有车道线特征点, 包括直线部分与弯曲部分。获得直线与双曲线相结合的车道线模型: 在近视场, 应用直线车道线模型能获得较好的鲁棒性; 在远视场, 使用双曲线模型可有效检测出车道线的弯曲部分。实验结果表明, 相较于已有的车道线检测算法, 该方法可有效提高多种场景下车道线检测的准确性和稳定性。  相似文献   

17.
为了解决直接序列匹配中签名序列存在随机波动和时间轴方向非均匀伸缩,导致相关分析给出的匹配度不高的问题,提出了采用滑动窗口对真实签名进行局部相关性分析的方法.将手写签名按压力划分成若干笔段,研究笔段匹配算法;对分段后的数据序列用滑动窗口算法进行局部相关分析.算例显示,对不同的签名个体而言,总有一些笔段的相关性极高,最小相关系数都达到0.8甚至0.9以上,这些笔段,正是签名者的稳定的签名特征,无论是相关分析法还是特征矢量分类法,滑动窗口局部相关分析都是一种有效的算法.  相似文献   

18.
针对当前关于数据流加权最大频繁项集WMFI(weighted maximal frequent itemsets)的研究无法有效地处理频繁阈值和加权频繁阈值不一致情况下WMFI的挖掘问题,提出了完全加权最大频繁项集FWM FI(full w eighted maximal frequent itemsets)的概念.为了减少naive算法在处理滑动窗口下完全加权最大频繁项集挖掘时存在的冗余运算,提出了FWMFI-SW(FWMFI mining based on sliding window over data stream)算法.所提出的算法通过基于频繁约束条件的优化策略减少了naive算法中M ax W优化策略的无效调用次数;采用编辑距离比率作为WMFP-SW-tree的重构判别函数,可以有效减少该树的重构次数.实验结果表明FWMFI-SW算法是有效的,且比naive算法更有时间优势.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号