首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
针对大数据岭回归问题,研究了提升计算效率的子抽样方法.现有子抽样方法的研究主要集中于没有惩罚项的模型框架,而相较于普通最小二乘估计,岭回归中惩罚项的引入权衡了估计的偏差和方差.通过子样本所得估计的渐近性质研究,本文提出了以渐近均方误差为优化准则的岭回归最优子抽样估计,并计算得到包含岭杠杆值和L2范数的子抽样概率,对岭杠...  相似文献   

3.
将相关研究提出的累积切片均值估计(CUME)、累积海塞方向(CHD)应用到多元响应降维子空间的估计中并对估计量加以改进得到改进的多元累积切片估计(g-CUME)、多元累积海塞方向(g-CHD).  相似文献   

4.
针对大数据中高维变量多重共线性问题,结合Logistic模型提出两种基于主成分分析法的两步子抽样算法,分别为基于A-最优准则的最小均方误差(minimum Mean Square Error, mMSE)抽样和基于L-最优准则的最小方差协方差(minimum Variance covariance, mVc)抽样。实证结果表明,相较于随机抽样,mMSE抽样和mVc抽样能大幅降低模型参数估计的均方误差,提升模型的查准率、召回率、F1分数、特异度等分类评价指标。  相似文献   

5.
本文收集了2010年-2011年意大利足球甲级联赛前30场比赛中得分、积分、主客场情况、净胜球数等数据,首先对数据做主成分分析,剔除影响不显著的变量,然后运用多分类Logistic回归方法,建立Logistic回归模型,预测比赛结果.结果显示:对2010年-2011意大利足球甲级联赛结果影响较大的是主客场,多分类Logistic回归模型判断正确率较高.  相似文献   

6.
该文针对响应变量为有序多分类标量数据,协变量为函数型数据构建函数型累积Logistic回归模型,并在贝叶斯分析框架下构造Gibbs抽样算法解决参数估计问题.具体解决流程为:首先,通过潜变量连接有序响应变量与函数协变量间的关系,同时对回归系数函数和回归函数型自变量选取主成分基函数进行展开,设置潜变量模型误差项服从Logistic分布.再利用Polya-Gamma变换解决模型似然函数的复杂性,并求得回归系数展开系数的后验分布从而构建Gibbs抽样算法.最后将该方法应用与模拟数据和实际空气质量指数(AQI)的分析,结果显示能较好地对模拟数据和空气质量指数(AQI)污染状况进行分类.  相似文献   

7.
首先利用经典线性回归分析对影响兵团各师农业总产值的几个因素进行分析,通过分析发现回归结果不尽合理.因此先对各师数据进行主成分分析,然后再利用农业总产值关于各个因素的主成分进行回归.得出了满意的结果.  相似文献   

8.
基于大数据下,对围绕数据中心综合布线进行分析,布线系统是搭建数据中心的基础物理平台,作为数据中心内部连接与管理的基础设施是所有数据流通的基础,综合布线对于数据中心运行大数据流起到非常关键作用。大数据与网络基础设施发展相互制约,所有数据量上升都需要一定综合布线与其相适应。  相似文献   

9.
通过构造一个新的矩阵,改进了基于模糊点数据的回归分析,大大减少了模型和运算的复杂性.  相似文献   

10.
基于Bootstrap方法数据包络分析的回归分析   总被引:3,自引:0,他引:3  
数据包络分析(DEA)方法中每一决策单元(DMU)有效性值的计算都涉及到考察集中所有其他DMU,因而使得DEA有效性值之间并不独立.为克服DEA有效性值的这种内在依赖性,提出了基于Bootstrap方法的DEA回归分析方法,以提高回归分析结果的可信度,并以封闭式基金业绩的DEA回归分析为例对之加以说明.  相似文献   

11.
把CT成像机理引和三维目标重构,提出了基于断层积分求逆的目标复原方法。真实CT图象实验结果表明,该方法明显地优于传统的三维重建方法,可以较厚的断层条件下实现三维目标的准确复原,具有重要的理论意义和应用价值。  相似文献   

12.
应用回归分析的数据关联算法   总被引:1,自引:0,他引:1  
针对复杂电磁环境下目标跟踪需要兼顾实时性和精确性的问题,应用测量领域的数据处理方法,提出了回归分析的数据关联算法.首先,利用对滤波曲线的两点回归分析,逐一预测各观测到达时刻的置信区间,筛选出关联点;接着,以系统处理周期为分组标准,对筛选序列进行成组观测数据回归分析;最后,计算出观测融合点,并用该点更新滤波器新息.该算法不仅能将复杂的关联转变成测量点迹动态更新过程,而且优化了同步化处理步骤.仿真实验表明:回归分析算法与联合概率数据关联算法相比,在直线运动场景下,两者的均方根误差及轨迹丢失率相近,且随着目标数目的增多,前者在平均占用CPU时间上的优越性更加突出;在曲线运动场景下,两者跟踪误差相当,前者占用CPU时间仅为后者的1/6.  相似文献   

13.
高霞 《创新科技》2015,(11):27-30
科技评价对象所涉及的数值、图像、声音具有全媒体、多维度、跨时间的特性,挖掘和运用这些海量数据,转化为直观的、随时间和空间变化的、以图形图像呈现在同行评议专家面前,可以有效提高评价的效率和效果.通过建立众包模式、数据整合和提取规则知识、将科技评价结果应用于实践、建立评价过程交互式可视化的流程以构建基于大数据的科技评价模式,这种模式存在着观念陈旧过时、数据挖掘能力、大数据处理速度、科技评价数据安全等方面的挑战.  相似文献   

14.
提高神经网络(NN)的收敛速率和预测精度一直是人工智能领域的一个挑战性问题,尽管许多研究人员已在研究中使用小批量数据训练神经网络获得了较好的效果,但是这些方法并不够灵活.针对这个问题,该文提出了一种新的数据预处理算法即Fibonacci采样算法.根据Fibonacci数列规则绘制一个新的训练数据序列,这不仅可以恢复小批...  相似文献   

15.
一种基于历史记录的网络流量数据采样方法   总被引:3,自引:2,他引:1  
通过将宏观网络流量的变化特征分解成为具有历史记忆特点的周期变化特征和具有随机变化特点的趋势变化特征,提出了一种基于历史记录的网络流量数据采样方法(NFDS—HM).实验表明:NFDS-HM采样算法对实际网络流量曲线进行拟合的结果,在其所获得的样本数量比Poisson采样过程所获得的样本数量减少25%的情况下,其期望值失真率、方差失真率分别降低了16.4%和16.2%.  相似文献   

16.
本文研究整群抽样调查中在不满足分群原则时,可利用回归估计提高估计精度的方法,并通过实例说明,回归估计法应用于整群抽样是降低抽样误差的有效方法。  相似文献   

17.
成分数据的偏最小二乘回归分析法   总被引:1,自引:0,他引:1  
本文针对具有成分数据信息的多因变量对多自变量线性回归问题,在传统的线性回归基础上提出了一种成分数据的偏最小二乘回归分析法,并对其进行了理论性分析,论证了该方法的可行性与合理性。  相似文献   

18.
本文针对具有成分数据信息的多因变量对多自变量线性回归问题,在传统的线性回归基础上提出了一种成分数据的偏最小二乘回归分析法,并对其进行了理论性分析,论证了该方法的可行性与合理性。  相似文献   

19.
择取国家森防总站2009—2013年辽宁省林木虫害大数据,根据林木虫害时空复杂性,提出一种基于时空影响域的虫害关系网络构造方法.以昆虫生活习性确定时间影响范围,以虫害危害等级确定空间影响范围,并将松毛虫作为研究对象.结果表明,松毛虫虫害关系网络为无标度网络,服从幂律分布;松毛虫传播扩散快;虫害易聚集发生;网络拓扑具有鲁棒性.该建网方法能够反映真实世界,是解读林木虫害大数据的有效方法.期待通过本文对松毛虫虫害关系网络的复杂网络理论分析,能对实际林木虫害防治工作中防治策略的制定及防控力度的估计提供理论指导.  相似文献   

20.
提出一种基于多台行驶中汽车产生数据重建机动车道3D地图的大数据策略.每台在线汽车上的程序实时上传经过优化的汽车3D坐标信息至服务器.优化方法为使用最小二乘法结合卡尔曼滤波器,利用汽车总线信号实时修正汽车的位置,相比GPS信号,经纬度和高度误差均降低50%以上.此外,还使用遗传算法代替卡尔曼滤波器,进一步降低卡尔曼滤波器的经纬度误差达16%.其次,服务器根据来自多台在线汽车上传的数据建立道路表面的3D点云数据库,并使用K-聚类算法进行数据挖掘,可推算出具有多条行车线道路的每条行车线的中心轨迹,以此建立机动车道3D地图.所建立的地图可为汽车能耗优化策略提供数据支持,降低行驶能耗.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号