首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
从观察数据中发现变量之间的因果关系是许多科学研究领域的关键问题,传统Granger因果模型受到维度灾难的影响,难以准确地在高维时间序列中发现因果关系.提出一种基于分位数因子模型的Granger因果分析新方法 QFMCGC用于高维时间序列因果关系的判定.首先,QFM-CGC采用赤池信息量准则进行模型选择,避免人为干预设置滞后阶数的操作;然后,对向量自回归(Vector Autoregressive,VAR)模型中的条件变量建立分位数因子模型进行降维,减少VAR模型中的待估计系数,对降维后的VAR模型重新进行条件Granger因果分析;最后,使用蒙特卡洛模拟评估不同方法识别底层系统与观测时间序列的连通性结构的能力.在不同维度变量的线性仿真系统和两组现实数据集上与基准方法和经典方法进行了比较,实验结果验证了该方法的有效性.  相似文献   

2.
软件失效多数由其包含的谓词引发.本文针对特定的故障模型,提出一种基于需求规约的谓词测试用例生成方法.该方法从需求规约中提取出因果图,再将因果图转换为谓词,再由BRO算法生成测试约束集,最后将生成测试用例集.实例分析表明,方法能有效生成测试用例集,并满足相应的测试谓词准则.  相似文献   

3.
针对自然语言处理中传统因果关系抽取主要用基于模式匹配的方法或机器学习算法进行抽取,结果准确率较低,且只能抽取带有因果提示词的显性因果关系问题,提出一种使用大规模的预训练模型结合图卷积神经网络的算法BERT-GCN.首先,使用BERT(bidirectional encoder representation from transformers)对语料进行编码,生成词向量;然后,将生成的词向量放入图卷积神经网络中进行训练;最后,放入Softmax层中完成对因果关系的抽取.实验结果表明,该模型在数据集SEDR-CE上获得了较好的结果,且针对隐式的因果关系效果也较好.  相似文献   

4.
基于关系马尔可夫模型的枚举型缺失值估计   总被引:1,自引:1,他引:0  
针对数据质量中数据缺失问题,提出了基于关系马尔可夫模型(RMM)的枚举型缺失值估计方法.该方法充分考虑属性间的关联性,将动态属性选择(DAS)方法与RMM结合,最大限度地利用完整数据的信息,提高了该方法的估计能力;利用RMM计算源状态到目的状态的转移概率,采用MaxPost和ProProp 2种缺失值填充方法,对缺失值进行填充.采用公认数据集,进行了对比实验,验证了该方法的有效性和优越性.  相似文献   

5.
科学构建观察现象背后因果关系是各领域研究的一个基本问题。oCSE是构建动态因果网络的一种经典方法,它通过依次寻找单个节点的因果父集逐层构建网络,区别于当前通用的由成对节点间因果关系简单合成网络的思路。oCSE能够更充分利用数据生成高质量网络,但其存在两点局限:当出现多重传递性或共因性因素时易误判因果关系;大量测算对比致使时间效率偏低。为克服上述局限,本研究提出一种改进方法oCSE-BS:引入贝叶斯评分推断特殊情况下测试节点与目标节点的因果关系,避免引入伪父节点,提升识别因果关系的正确率;采取早期丢弃策略过滤弱相关节点,避免完全搜索带来的高计算量,提升算法运行的时间效率。经验证oCSE-BS在生成网络质量和时间效率方面均优于oCSE,同时发现其运行效果对网络规模、网络稀疏度敏感度较高,对样本噪音敏感度较低。  相似文献   

6.
基于遗传算法的因果图网络结构学习   总被引:1,自引:0,他引:1  
在因果图理论中,采用了图形化和直接因果强度来表达知识和因果关系,它克服了贝叶斯网的一些不足,已发展成了一个能够处理离散变量和连续变量的混合模型.但是因果图的结构得由领域专家给出,这在实际中很难办到.鉴于因果图结构的复杂度随论域中节点个数的增加呈指数上升,寻找最有可能因果图网络结构成为了NP-HARD难题.文中给出了如何利用已知数据集,寻找最有可能的因果图网络结构设计的遗传算法(Genetic Algorithm,GA).  相似文献   

7.
提出一种中文因果关系分析方法,以便更加细腻地表达因果关系.该方法由因果关系提取和权重计算组成.首先,构建了中文因果关系四元组数据集,将因果划分为核心名词和谓语状态,即原因中的核心名词、原因中的谓语或状态、结果中的核心名词、结果中的谓语和状态;然后,构建了中文因果关系抽取(CCE)模型,该模型由中文预训练的基于全词掩码训...  相似文献   

8.
大多数统计分析方法基于完整的数据集,这些方法不能直接用于包括缺失值的数据集.此外,由于成分数据的特殊属性,传统的缺失值插补方法直接用于这种类型的数据可能得到不良的结果.因此,对成分数据而言,缺失值的填补具有十分重要的意义.为了解决这个问题,根据核函数的性质,提出了一种基于修正Sigmoid核的成分数据缺失值非参数插补方法.该方法使用模拟和真实的数据集与k近邻插补法和最小二乘迭代回归插补法进行比较.实验结果表明,新的插补方法可以得到更准确的估计.  相似文献   

9.
针对反事实框架下的因果推断问题,在因子分析视角下,从优化角度提出利用 L2 因子分析方法估计反事实值,并引入 L1 损失函数优化 L1 风险;结合因果推断与正交因子模型,将面板数据中需要估计的反事实值视作缺失值,从而把因果推断反事实值估计转变为带有缺失值的潜在因子模型估计;舍弃面板数据中的缺失值,通过优化一步得到潜在结果与平均处理效应,避免了信息丢失问题;采用 L1 因子分析代替 L2因子分析来估计模型,做出稳健性上的改进,并获得中位数处理效应;介绍了一种交替凸优化算法解决 L1 、L2 因子分析中的目标函数最小化问题,并给出其具体实现步骤;对于加利福尼亚州限制烟草政策案例做了实证研究,将 L1 、L2 因子分析与已有因果推断方法进行比较分析,结果表明:因子模型的 L1 、L2 估计量同样适用于宏观经济变量预测;最后通过设置伪实验组与伪介入的假设,验证了 L1 因子分析较其他方法具有更稳健的预测效果。  相似文献   

10.
针对智能交通系统数据采集过程中发生的数据缺失问题,本文提出一种基于动态生成对抗网络(dynamic generative adversarial network, D-GAN)的路网交通数据修复方法。该方法首先依据交通数据的时空特性与设定的缺失类型和缺失比例来构造各种缺失交通数据矩阵,然后基于博弈思想迭代训练由2个全连接神经网络构成的生成对抗网络。引入一种新颖的动态自适应机制,研究能在模型计算过程中自动识别生成器与判别器的最佳迭代次数,最终生成完整的交通数据矩阵并修复缺失值。采用加州PeMS和广州交通速度数据集来完成D-GAN模型的构建,并使用多种评价指标评估D-GAN的修复性能。实验结果表明:相对于非随机缺失模式,D-GAN对随机缺失模式的修复精度更高;随着缺失率增加,D-GAN的修复精度加速下降。但在各种缺失条件下,D-GAN模型的修复性能要优于现有模型(例如BGCP、prophet-RF和GAIN)。  相似文献   

11.
传感器节点监测数据缺失会影响核电站外围环境辐射监测的有效性,需要对缺失数据进行准确估计.提出一种基于支持向量机的监测数据缺失值估计算法,对传感器节点缺失监测数据进行估计.用实际监测数据对算法进行了验证,用均方误差和相关系数评价实验结果.并与现有的基于神经网络的估计算法进行了性能比较.实验结果表明,本文所提出的算法具有较高的估计精度.  相似文献   

12.
针对获取大规模的多跳问答训练数据集耗时耗力的问题,提出一个基于对比学习思想的多跳问题生成模型.模型分为生成阶段和对比学习打分阶段,生成阶段通过执行推理图生成候选多跳问题,对比学习打分阶段通过一个基于对比学习思想的无参考问题的候选问题打分模型对候选问题进行打分排序,并选择最优的候选问题.该模型在一定程度上缩小了无监督方法与人工标注方法的差距,有效缓解了缺少多跳问答数据集的问题.在数据集HotpotQA上的实验结果表明,基于对比学习的多跳问题生成模型能有效扩充训练数据,极大减少了人工标注数据的成本.  相似文献   

13.
在响应变量随机缺失MAR机制的前提条件下, 针对线性回归模型, 提出了一个新的期望递归最小二乘算法(Expectation Recursive Least Square, ERLS), ERLS方法巧妙的结合了EM算法和RLS的优点, 自适应的递归估计回归系数, 从而避免了高维数据的相关矩阵的求逆困难. ERLS算法是实时自适应处理算法, 无需存储全部数据集, 在观测数据存在野值时, ERLS算法优于LS方法.  相似文献   

14.
含隐变量和选择偏差的图模型中的因果推断   总被引:2,自引:0,他引:2  
Bayes网络常用于多变量间的因果推断,但当存在未观测的隐变量和选择变量时,这种图模型往往无法正确描述观测变量间的因果关系。作者利用在观测变量上构造的最大祖先图模型刻画观测变量间的独立性关系和因果结构,并提出了具体的实现算法,从而可由观测数据来推断这类不完全观测下的部分因果关系。  相似文献   

15.
文章利用Granger因果图表示多维时间变量序列间的因果关系,图中的顶点集由序列的各个分量组成,顶点间的有向边表示分量序列间的Granger因果关系,无向边表示分量间的同期因果关系.建立Granger因果图的p-分离准则,研究Granger因果图的Markov性.  相似文献   

16.
Bayes网络常用于多变量间的因果推断,但当存在未观测的隐变量和选择变量时,这种图模型往往无法正确描述观测变量间的因果关系。作者利用在观测变量上构造的最大祖先图模型刻画观测变量间的独立性关系和因果结构,并提出了具体的实现算法,从而可由观测数据来推断这类不完全观测下的部分因果关系。  相似文献   

17.
贝叶斯网络模型是经典概率图模型,目前已经广泛应用到各个领域中.在贝叶斯网络模型的参数获取方面,以往的方法往往仅依靠数据集或者专家知识.实际情况中,数据集往往存在缺失或者存在噪声,而单一专家指定的参数存在较大的主观因素,两类方法所得参数与实际存在较大偏差.提出基于D-S证据理论的专家综合知识结合小数据集的贝叶斯网络参数学习方法,克服了依靠数据集小的情况下造成的参数不准确或依靠单一专家知识主观性较强的问题.通过实验验证,提出的方法在小数据集的情况下,所获得的贝叶斯网络参数更为准确.并将提出的方法用于公安机关刑事案件线索研判,综合专家知识与小数据集获取模型参数,研判结果能够较好地反映实际情况,证明了方法的有效性.  相似文献   

18.
含异常值的数据和高维数据越来越频繁地出现,对现有的稳健估计和多元线性回归估计方法提出了挑战.传统的多元线性回归模型估计对异常值非常敏感,基于MCD估计方法的多元线性回归估计对异常值有一定的抵御作用.但随着数据维数的增加,MCD估计的精度不断降低,稳健性也随之降低,且当数据维数大于样本量时MCD估计方法失效.因此,本文利...  相似文献   

19.
真实数据集中含有缺失值,许多数据分析技术不能直接应用到不完整数据上,且缺失值的存在会明显地降低算法的有效性,缺失数据处理是一个不可缺少的数据预处理过程,因此提出了一个基于统计度量的缺失值填补算法,名为灰色类中心缺失值填补(GCCMVI)方法,利用数据点的类中心和标准差来填补缺失值,此外,通过比较阈值和实例与类中心间相关性的大小关系,决定是否加上(减去)标准差,灰色关联分析用来计算相关性,在缺失值被填补后,得到的完整的数据集用来训练支持向量机(SVM)分类器.在三种类型不同的数据集上进行比较,以分类精度,填补效果,填补时间作为评估准则来衡量算法的有效性.实验结果表明,所提出的算法显著地提高了分类精度和填补效果.  相似文献   

20.
高维数据如气象数据中不可避免地存在异常值,应用最广泛的最小二乘法在识别异常值上不具有稳健性和灵敏度.稳健估计方法可使求出的估计量不受异常数据的强烈影响,从而能更好地识别异常点.这里给出了基于稳健S估计的主成分分析模型,其中加入Tukey的双权型函数约束条件.该模型无须对数据分布函数的具体形式做假设,算法的收敛速度较快.之后再结合B样条函数对数据作平滑处理,以平均残差平方和为检验统计量,使用同样具有稳健性的调优箱型图作为判别异常值的界限.实证分析采用了我国长江流域5个城市60多年共约58 000条气象数据,分别运用PCA方法和基于稳健S估计的异常值判别方法对该数据集进行了对比分析.可以明显地看出,相比传统方法,基于稳健S估计的异常值判别方法更突出地给出关于异常值的信息,能更好地识别异常值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号