首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
任瑞林 《河南科学》1992,10(4):336-342
本文以无放回简单随机抽样(SRSWOR)为例,讨论了相继调查中的轮换样本问题,证明了一个基本定理,从而为充分利用数据信息构造总体特征的估计奠定了基础.文中还提出了若干总体均值、发展速度和增长量的估计量,并由基本定理点出了这些估计量的均值和方差。  相似文献   

3.
简单介绍了高校科研管理系统和ASP技术及相关知识,重点介绍了应用ASP技术开发在线样本检索的设计开发思想.在科研管理系统中检索是用户经常使用的操作手段。同时用户在内容重复检索中涉及到大量字段,样本检索可以使用户避免这样的重复操作.在开发系统时采用了样本检索技术与普通检索结合,既发挥了普通检索的灵活性,又发挥了样本检索的高效性.  相似文献   

4.
通过选取最有信息量的样本提交专家进行标注,主动学习算法可以有效地减少无效标注样本的工作量.在充分考虑位于分类边界的不确定样本和基于先验分布的具有代表性样本的基础上,本文构造了不确定性与代表性相结合的可控主动学习算法.首先利用样本的kNN分布状况建立不确定性置信度模型,该思路不需要知道样本分布的具体类型和参数计算;然后在样本聚集度模型的基础上进行聚类,在此基础上建立代表性置信度模型.最后将不确定性置信度模型与代表性置信度模型进行综合,构造可控的主动学习策略,使得每次主动学习选择的样本更具有"价值".在UCI机器学习数据库上的仿真实验结果表明本文的思路是合理可行的,在实验所用数据集上,当达到相同的目标正确率时,本文的方法比随机采样算法所需的样本数量少得多.  相似文献   

5.
一,二重混合检查法:大批中剔出缺陷个体的方法   总被引:2,自引:1,他引:1  
提出了求无需混合的确界的方法,首次提出了比一重混合更节约检查的加倍混合(二重混合)检查方法。按上下界点制作了检察表,对多重混合量平均检查公式提出了一个猜测。  相似文献   

6.
给出了在有放回抽样时,样本均值的数学期望和方差的计算结果;同时通过引理的证明给出了在无放回抽样方式下,样本均值的数学期望和方差的结果。从而说明了在抽样方式不同的情况下,样本均值的数学期望相同,但方差却是不同的,但是,当样本容量n很大时,则两者的差别是不大的;当n趋于无穷大时,这两者就没有区别了。  相似文献   

7.
在文献 (1)中 ,给出了随机微分方程样本解的存在性 ,研究了同个问题的整体存在性 ,得到了 2个结果 ,分别由定理 1和定理 2给出  相似文献   

8.
可视化方法通过将多维空间数据映射到二维平面上,依据“物以聚类”属性对二维平面中各样本点进行分类、识别,找出离群样本并将其剔除掉.与此同时,产生目标函数等值线.沿着等值线值增大或减小的趋势方向寻优,就很容易地确定出最优点或最优化操作区域.以某卷烟厂生产烟丝为例进行分析和计算,结果表明,文中筛选样本数据方法中,离群点的剔除提高优化结果的准确度。最佳操作条件的确定可为工业生产或科学实验提供决策支持。  相似文献   

9.
岩土力学参数Bayes统计推断存在验前和后验样本信息问题.在解决工程问题时,先验与后验分布信息的获取是靠样本容量的大小确定,而获取样本信息是要付出工程费用的.为了探讨岩土参数Bayes法推断中先验与后验样本的取值大小,采用贝叶斯推断简化方法,通过对某工程的岩土力学参数分析,得到先验样本数为30~35个和后验样本数不少于4个时,计算出的统计参数均值与方差的误差最小.本文的研究为岩土工程力学参数概率统计样本大小的确定提供了参考.  相似文献   

10.
在介绍设计样本的基础上,说明了软件开发各个阶段都存在可重用的样本的可能性,讨论了不同阶段样本间存在的层次性,并详细论述了各层样本的描述问题,包括样本共同属性的描述和与层次相关的特有属性的描述。作者还介绍了样本之间可能存在关系种类。最后给出了一个利用多样性协同实现的实际应用系统,该系统包括了若干不同层次,不同粒度的样本。  相似文献   

11.
为快速对数据进行特征选择以实现精确分类,采用M-distance算法思想进行数据集簇聚类,对样本数据进行预处理;设计加权K近邻算法缩减样本间距并构建样本分类模型;采用模拟简谐振动的方法遍历样本数据,求解最优加权特征向量,实现样本分类.实验结果表明:设计的算法是正确的,分类模型是合理的.在样本数据特征中,分离出的消费者最为关心的前10个样本特征符合消费者的行为选择,说明算法设计有一定实用性.  相似文献   

12.
基于Banach空间中的l-范数的有关理论研究回归估计学习问题收敛性的界.利用l-范数,估计了在给定函数集上最小化经验风险的函数的风险与该函数集上的最小风险之差的界,也就是所谓的"样本误差"的界.同时,给出了基于l-范数的样本复杂性的界.  相似文献   

13.
面对小样本数据集,虚拟样本生成(virtual sample generation,VSG)技术已被证实能有效提升机器学习算法的性能,然而对于最优的生成数量并未有明确的结论。本文首先在给定训练样本标准方差上限的条件下,采用信息熵理论研究最优虚拟样本生成数量;其次将虚拟样本所产生的噪声加以考虑,在给定的置信水平(0.95)下建立了最优虚拟样本生成数量的一般概率模型及分析方法;最后以2016年浙江湖州某变电站历史监测故障数据建立小样本数据集,设计4次相关虚拟样本生成实验,结果表明,上述两种最优虚拟样本生成数量法则行之有效,相应的机器学习预测精度有所提高。  相似文献   

14.
本文论述正态母体抽样中,样本方差及样本标准差的有关性质,并改进统计计算中的一个近似计算公式,通过具体计算,论证修正后的公式优于原来的公式。  相似文献   

15.
根据美国某大学11年的图书借阅量,分析借阅的图书的分布特点,建立模型,并通过模型来预测各类图书在未来时间里的需求量。  相似文献   

16.
针对现行抽样中存在的问题,对形成抽样误差的原因进行了分析,导出了随机样的样本大小公式,并对其应用情况进行较为详细的论述。  相似文献   

17.
18.
主动学习算法可以有效减少样本标注的工作量,每次选取最有信息量的样本交由专家标注。样本的代表性与不确定性都是衡量样本信息量的重要因素,将两者综合考虑能够获得更好的综合效果,但在两者的结合方式上一直存在不少问题,导致算法的适应性不强。为解决该问题,本文提出了基于样本不同属性的鲁棒偏倚赖主动学习分类算法,通过引入偏倚赖权值系数函数,在综合考虑样本的代表性和不确定性的同时,更可以突出样本的特性。同时由于样本代表性模型的渐变,在选择样本过程中更能突出代表性样本与不确定性样本的学习层次,前期训练以代表性样本为主,后期训练以不确定性样本为主,使得算法的适应性大大提高。在UCI机器学习数据库上的仿真实验结果表明本文的思路是合理可行的,在实验所用数据集上,与所提供的对比算法相比,本文的方法只需较少的标注样本便可以达到相同的分类正确率。  相似文献   

19.
机械结构件疲劳寿命预估的基础是其材料的p-S-N曲线,而p-S-N曲线的拟合需要大量的试验数据,对人力物力的成本需求较高。为研究小样本数据拟合p-S-N曲线的方法,分别运用Bootstrap法和样本信息聚集原理,得到了泵头体材料的p-S-N曲线。结果表明,Bootstrap法拟合的p-S-N曲线误差较均匀;样本信息聚集原理在基准应力为716 MPa比756 MPa时预测10~4~10~6次范围内的疲劳寿命误差更小,且应力级别相差较大时的疲劳寿命的预估比Bootstrap法更为精确;结合经济效益及试验误差,最佳应力级别数为5组,每组应力级别下进行5根试样。  相似文献   

20.
2009,“江苏制造”因自主创新向“江苏创造”提升。2011,发展的舞姿因创新而会更加炫动。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号