共查询到20条相似文献,搜索用时 140 毫秒
1.
真实数据集中含有缺失值,许多数据分析技术不能直接应用到不完整数据上,且缺失值的存在会明显地降低算法的有效性,缺失数据处理是一个不可缺少的数据预处理过程,因此提出了一个基于统计度量的缺失值填补算法,名为灰色类中心缺失值填补(GCCMVI)方法,利用数据点的类中心和标准差来填补缺失值,此外,通过比较阈值和实例与类中心间相关性的大小关系,决定是否加上(减去)标准差,灰色关联分析用来计算相关性,在缺失值被填补后,得到的完整的数据集用来训练支持向量机(SVM)分类器.在三种类型不同的数据集上进行比较,以分类精度,填补效果,填补时间作为评估准则来衡量算法的有效性.实验结果表明,所提出的算法显著地提高了分类精度和填补效果. 相似文献
2.
缺失数据插补是数据科学中的基本方法之一.本文针对类别型缺失数据提出了一种基于聚类和半参数logisitic学习模型的插补法.该方法首先采用K-近邻法对缺失数据进行预插补,然后用聚类算法将数据分类,提高数据间的相似性,再为每一类数据集建立半参数logistic学习模型,进而完成最后的插补.基于中国家庭金融调查(CHFS)数据集的实证研究表明,该方法优于常用的K-近邻插补法和随机森林插补法. 相似文献
3.
针对传统缺失值检测方法缺少对多维特性数据全面立体的分析及难以从众多缺失值填补算法中选择合适方法的问题,通过设计缺失值检测方法,在目前常见的数据点缺失度基础上,首次提出数据总体缺失度和加权数据总体缺失度的概念,实现对数据集缺失程度的全面检测,进而通过实验对比分析不同缺失值填补方法性能。实验结果表明,在不同缺失度的情况下,不同缺失值填补算法的性能不同,所提出的方法可为缺失值填补算法的选择提供有效依据。 相似文献
4.
基于嵌套滑动窗口的数据流缺失数据填充算法 总被引:1,自引:0,他引:1
提出了一种基于嵌套滑动窗口的缺失数据填充算法.考虑到传感器数据流的时效特性,采用嵌套滑动窗口选取空间相关度高且距离最近的数据作为样本数据,之后分两种情况对缺失数据进行填充.算法首先通过皮尔逊相关计算对数据的空间性进行分析,应用嵌套滑动窗口对缺失数据相关的数据进行采样,得到强相关数据,之后采用MKNN算法进行精确填充.通过皮尔逊相关分析和嵌套窗口采样,极大地降低了数据样本大小,提高了缺失数据处理实时性;对于不具有强的空间相关的缺失数据,考虑到短时间内采集数据间强的时间相关性,采用线性相关法对数据进行填充,降低算法复杂度.实验表明,该算法能够实时、精确地对数据流缺失数据进行填充. 相似文献
5.
针对缺失数据的有效填充问题,提出利用模糊C-均值聚类(FCM)算法的隶属度矩阵作为待填数据的加权权重.首先使用同一属性均值对缺失数据作预填充,再进行FCM以得到每个类别的隶属度矩阵,最后用该矩阵作为权重去乘以每个类别的属性均值,得到最终的填充数据.在UCI数据实验中,将FCM填充算法与k近邻(KNN)填充算法作对比分析,结果表明,FCM填充得到的均方根误差总体小于KNN填充. 相似文献
6.
王希雷 《天津科技大学学报》2007,22(3):62-64
针对不完备信息系统,提出缺失比概念.用缺失比表示待填充样本中缺失数据和剩余数据对决策结果的影响能力的大小,进而根据缺失比选择使用的约简,然后通过填充矩阵寻找缺失数据的最大可能值.采用对Rough集进行扩充和数据填补相结合的决策表数据补齐方法.试验结果表明该方法有较好效果. 相似文献
7.
为研究非齐次马氏链缺失数据一元函数的强大数定律. 首先给出了非齐次马氏链缺失数据的一个定义,由这个定义说明作为非齐次马氏链的子列,缺失数据显然也具有马氏性.在前人研究马氏链收敛性的基础上,通过鞅差收敛定理给出非齐次马氏链缺失数据一元函数平均极限定理,再由这个极限定理,给出了非齐次马氏链缺失数据的一元函数满足强大数定律的一个充分条件和几个推论. 相似文献
8.
钢结构施工过程监测数据缺失机理与处理方法 总被引:1,自引:1,他引:0
分析并总结了钢结构施工过程监测中缺失数据的成因及特征,依据缺失数据形成机制将缺失数据分为三类.根据不同类型和特征的缺失数据,提出了基于最小二乘原理以回归分析理论为基础的数据补偿方法.通过对大同美术馆屋盖钢结构和"生命之环"钢结构施工过程监测数据的分析处理与比较,验证了该方法的有效性,说明了该方法的实用价值. 相似文献
9.
针对缺失数据的有效填充问题,提出利用模糊C-均值聚类(FCM)算法的隶属度矩阵作为待填数据的加权权重.首先使用同一属性均值对缺失数据作预填充,再进行FCM以得到每个类别的隶属度矩阵,最后用该矩阵作为权重去乘以每个类别的属性均值,得到最终的填充数据.在UCI数据实验中,将FCM填充算法与k近邻(KNN)填充算法作对比分析,结果表明,FCM填充得到的均方根误差总体小于KNN填充. 相似文献
10.
为获取完整的交通流数据集,提出了一种交通流数据修复方法.结合多源数据的互补特性,基于深度学习模型构建了时空关联特征提取方法,将高速公路交通流数据缺失情况分为3类,并基于随机森林算法建立修正模型.模型以平均绝对误差最小为优化目标,基于测试集和选择集优化了模型的参数.利用高速公路固定检测器和浮动检测技术获取的多源数据,对比分析了单一数据源与多源数据的修正精度.结果表明:多源数据修正模型明显优于单一数据源修正模型,在点缺失、线缺失和面缺失3种情况下,MAPE的平均值分别提高了24. 87%,39. 87%和52. 93%.此外,随着缺失比例的增加,较单一数据源模型,多源数据修正模型精度更为稳定,在点缺失、线缺失和面缺失3种情况下,其MAPE的方差仅为0. 01,0. 03和0. 08,证明其具有较好的鲁棒性. 相似文献
11.
文石型碳酸钙晶须填充纸张性能研究 总被引:1,自引:0,他引:1
传统方解石型碳酸钙填料填充纸张时填料留着率低,受纸张强度降低的限制填充量较小。文章采用自制文石型碳酸钙晶须替代传统方解石型碳酸钙,研究其填充纸张性能的变化,结果表明:同样条件下,文石型碳酸钙晶须较传统方解石型碳酸钙填料有更高的留着率,更小的纸张强度降低率。 相似文献
12.
13.
丁振凡 《吉首大学学报(自然科学版)》2013,34(1):21-25
在分析网络考试流程的基础上,对学生操作部分的各环节进行服务建模,对考试控制、组卷、试卷显示、阅卷、考试登记、考试查阅分析等进行服务设计.系统实现采用AJAX结合Spring技术,给出了应用的服务调用与应用整合思路.讨论了IOC容器Bean的部署,以及应用服务间利用Json进行试卷包装传递的方法. 相似文献
14.
本文研究了黄原酸盐的一种应用。将滤纸与氢氧化钾和二硫化碳反应,制成黄原酸滤纸(滤纸形态不变)。然后让水样通过,水中的铜离子被其黄原酸螯合生成黄色的纤维素黄原酸铜,用纸上双波长吸光度差值法测定吸光度。该法选择性好,检出浓度可达0.2μg/L,相对标准偏差小于4%。 相似文献
15.
吴晓琴 《合肥学院学报(自然科学版)》2007,17(2):47-50
分析了智能组卷约束条件,建立了智能组卷系统的数学模型,并给出了改进的遗传算法求解智能组卷问题的新方法.实验结果表明所提出的新组卷算法相对于其他算法更能有效地解决自动组卷问题,组卷成功率高,组卷速度快,具有较好的性能和实用性. 相似文献
16.
气泡监测的超声波传感器及其检测电路原理 总被引:1,自引:0,他引:1
李昔华 《重庆工商大学学报(自然科学版)》2003,20(4):87-89
介绍了一种应用于医疗电子设备中安全监控环节的超声波气泡监测传感器的设计方法。简述了其工作原理,并对结构特性作了说明,给出了较详细的发射与接收电路原理图。结合应用中的实际情况,设计了灵敏度可编程调节电路。 相似文献
17.
18.
王元明 《上海大学学报(自然科学版)》1995,1(2):138-143
带有边界条件的样条空间有重要的应用,本文建立了一类带有边界条件的二元样条空间的维数公式,并且给出了这类子空间的局部支撑基底的构造,文[2]中的结果是本文结果的特殊情形。 相似文献
19.
讨论了在有限资金的情况下,为了保证生物的多样性,如何进行投资将获得最佳的收益.提出了绝对优势模型,这个规划是非线性的0-1规划且是NP难的.为了简化计算,将其近似为线性规划即线性化的绝对优势模型,并应用软件解这个规划.比较了这个近似与对原模型用穷举法解决在计算上的优势.分析得出的结果,并对其应用进行了讨论. 相似文献
20.
盛丽娜 《科技情报开发与经济》2014,(8):119-122
以具体数据分析了期刊影响力对论文被引频次的影响.结果表明,论文的篇均被引频次与所在期刊的总被引频次、影响因子、5年影响因子和基金论文比均呈显著正相关(均为P=0.000).分组比较结果表明,总被引频次、影响因子、5年影响因子和基金论文比数值较大的期刊,其发表论文的篇均被引频次较高.另外,核心期刊发表论文的篇均被引频次高于非核心期刊(P<0.05).期刊的学术影响力对论文的被引频次有影响,发表在高学术影响力期刊上的论文可以更多地被引用. 相似文献