首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
为了提高垃圾邮件样本的覆盖率和实时性,降低垃圾邮件过滤系统的计算复杂性和滞后性,提出了基于垃圾邮件发送的行为特征,采用蜜罐原理进行垃圾邮件样本采集.引入蜜罐帐户评价公式,根据这个公式设计并实现了蜜罐帐户选择算法,动态地在电子邮件服务器中选择一定数量的帐户作为蜜罐并生成蜜罐集合,定期从蜜罐集合中采集邮件样本,作为过滤系统的学习语料.实验表明,利用该方法能够使采集到垃圾邮件样本覆盖率达到98%以上.由于系统能够定期地进行样本采集,因此实时性较强,从而提高系统过滤垃圾邮件的能力.  相似文献   

2.
应用预设和调节可信区间宽度的方法,提出了病例对照研究评价疫苗效力VE所需样本含量的计算公式.由公式计算的样本含量能使研究者掌握由样本所获得的VE点估计值接近总体真实值的程度,从而能较为准确地判断研究结果的实际意义。  相似文献   

3.
利用Taylor公式和中心极限定理,给出了样本方差某函数的期望和方差的近似公式,并求出了样本方差的某个函数s的渐近分布.  相似文献   

4.
将自组织(SOM)神经网络、误差反馈(BP)神经网络和遗传算法(GA)三者结合起来,应用于边坡稳定性分析中.首先推导了基于高斯函数的SOM神经网络过程简化权值求解公式,并采用SOM神经网络对收集到的边坡样本进行归类,降低了学习样本的噪声;然后设计了适用于边坡工程的神经网络结构编码模式;再将GA用于优化BP神经网络结构;最后对优化后的BP神经网络进行了计算.计算结果证明,优化后的BP神经网络在安全系数的拟合以及样本的误差分布方面均有明显的改善.同时,通过与其他类型的神经网络相比较,优化后的BP神经网络准确度较高,用于计算边坡的安全系数误差较小.  相似文献   

5.
飞行器数据分析的统计和计算方法研究一直是我国航空科研中的重点项目,针对目前实际试飞资料有限的情况,阐述了小样本情况下数据分析的统计模拟及计算方法,推导了在给定飞行器试飞最大允许误差和考虑犯两种错误概率条件下的检验与最佳样本容量的估计公式,最后通过算例介绍了该统计和计算方法在实际中的应用,从而验证了方法的正确性和严谨性。  相似文献   

6.
通过选取最有信息量的样本提交专家进行标注,主动学习算法可以有效地减少无效标注样本的工作量.在充分考虑位于分类边界的不确定样本和基于先验分布的具有代表性样本的基础上,本文构造了不确定性与代表性相结合的可控主动学习算法.首先利用样本的kNN分布状况建立不确定性置信度模型,该思路不需要知道样本分布的具体类型和参数计算;然后在样本聚集度模型的基础上进行聚类,在此基础上建立代表性置信度模型.最后将不确定性置信度模型与代表性置信度模型进行综合,构造可控的主动学习策略,使得每次主动学习选择的样本更具有"价值".在UCI机器学习数据库上的仿真实验结果表明本文的思路是合理可行的,在实验所用数据集上,当达到相同的目标正确率时,本文的方法比随机采样算法所需的样本数量少得多.  相似文献   

7.
针对现行抽样中存在的问题,对形成抽样误差的原因进行了分析,导出了随机样的样本大小公式,并对其应用情况进行较为详细的论述。  相似文献   

8.
K最近邻算法(KNN)在分类时,需要计算待分类样本与训练样本集中每个样本之间的相似度.当训练样本过多时,计算代价大,分类效率降低.因此,提出一种基于DBSCAN聚类的改进算法.利用DBSCAN聚类消除训练样本的噪声数据.同时,对于核心样本集中的样本,根据其样本相似度阈值和密度进行样本裁剪,以缩减与待分类样本计算相似度的训练样本个数.实验表明此算法能够在保持基本分类能力不变的情况下,有效地降低分类计算量.  相似文献   

9.
岩土力学参数Bayes统计推断存在验前和后验样本信息问题.在解决工程问题时,先验与后验分布信息的获取是靠样本容量的大小确定,而获取样本信息是要付出工程费用的.为了探讨岩土参数Bayes法推断中先验与后验样本的取值大小,采用贝叶斯推断简化方法,通过对某工程的岩土力学参数分析,得到先验样本数为30~35个和后验样本数不少于4个时,计算出的统计参数均值与方差的误差最小.本文的研究为岩土工程力学参数概率统计样本大小的确定提供了参考.  相似文献   

10.
基于自由度给出样本方差不同定义的比较,并给出直观解释和相关性质,达到对数理统计中抽样公式、方差分析及回归分析等统计特性的理解.  相似文献   

11.
条件概率的计算是概率论中极其重要的计算之一,一般有利用定义式计算和缩减样本空间计算两种方法.缩减样本空间计算法在先验概率问题计算上比较浅显易懂,但在后验概率问题上计算一般不采用这个方法,而是使用定义式来计算,后验概率的计算又和贝叶斯公式有较大的关系.着重讨论缩减样本空间计算法在后验概率问题上的应用.从而避免利用贝叶斯公式计算的繁琐过程.  相似文献   

12.
徐文锵 《山东科学》1990,3(1):24-32
本文导出风向平均值的计算公式,为气象统计中关于平均风向“过零”时的计算和利用计算机连续统计、计算提供了通用的数学模型。利用该数学模型可设计出用离散取样来测量平均风向的逻辑电路(平均风向仪)和各种语言的计算机程序。  相似文献   

13.
导出齿形链少齿差行星减速器传动效率的简化公式,对样机效率进行计算,表明计算效率与实测相符。  相似文献   

14.
具有Fano谐振的表面等离子体纳米结构因其独特的光学特性及应用潜力,受到了广泛的关注和研究.品质因子(Q值)是谐振模式电磁存储能力的一个重要评价指标,本文从定义出发得到了Q值的时域拟合公式,并结合时域有限差分方法对典型金属纳米结构以及Fano谐振各特征模式的Q值展开研究;此外,还使用了较为简单方便的频域半高宽公式对上述结构进行了Q值计算.通过对比两种方法得到的结果,我们发现尽管频域半高宽公式能够适用于简单的金属纳米结构谐振模式Q值计算,但是在处理Fano谐振的Q值时将会带来较大的误差,有些情况下甚至极大地偏离实际值导致计算结果失去意义.,而本文中采用的时域拟合Q值公式从谐振模式的本质出发,不受结构响应谱线型的影响,适用于各种情况下对谐振模式Q值的准确计算.  相似文献   

15.
从中子和γ射线的实际输运过程出发,推导出了一个柱样品的中子注量衰减和γ自吸收修正的统一计算公式.在推导中考虑了这两种效应的位置关联用不同方法对这个公式的计算结果进行了检验,证明这个统一计算公式物理图像清晰,计算速度快,结果可靠,适用于快中子核反应的伴生γ射线截面测量中的数据处理.  相似文献   

16.
有限维状态向量的样本轮廓相似度及其度量   总被引:1,自引:1,他引:0  
为了解决有限维状态向量样本的相似性度量问题,立足于分析样本的几何相似性,提出了样本轮廓的概念,约定了轮廓相似性的度量公理,构造了一种轮廓相似度计算公式。实证分析结果表明:轮廓相似度计算公式具有良好的样本几何相似性的识别能力,由此证明可以推广应用。  相似文献   

17.
对光子扫描隧道显微镜探测场进行了理论研究,由于在实际探测时支承样品的玻璃与样品间的折射率是不同的,计入支承样品玻璃影响,得出了比较符合实际的探测场理论计算公式。  相似文献   

18.
均角全距法钻孔轨迹一般计算公式的缺陷修正   总被引:1,自引:0,他引:1  
均角全距法是定向钻孔轨迹计算最常用的方法之一;但均角全距法一般计算公式存在一个缺陷:当临近两测点的方位角差值大于180°时,按均角全距法一般公式计算的方位角算术平均值方向与模型假设的实际平均方位方向正好相反;如果忽视此问题往往会造成水平向坐标增量出现较大的计算误差,进而影响钻孔定位精度。针对该问题,首先讨论了实际平均方位与方位角算术平均值的关系;然后通过严格的几何计算推导出了全新的均角全距法修正公式;最后采用一般公式、SY/T5088—2008《钻井井身质量控制规范》(下简称《规范》)算法、修正公式三种方法进行算例对比分析。计算结果显示:修正公式与《规范》算法的计算结果完全一致,证明了修正公式的正确性;当相邻两测点方位角差值大于180°,一般计算公式与修正公式的水平向坐标增量Δx、Δy正负异号,表明修正公式正好克服了一般公式方位算反的缺陷。总的说来,修正公式成功地解决了一般公式的缺陷,同时克服了《规范》算法需分类讨论的缺陷,建议推广使用。  相似文献   

19.
Pollaczek—Khinchin公式是计算破产概率的重要公式之一。给出了复合Poisson风险模型破产Pollaezek—Khinchin公式的严格证明,纠正了文献[1]中的证明错误。  相似文献   

20.
利用水文监测数据,采用理论积分公式计算纵向离散系数,通过量纲和相关分析得到估算黄河下游干流纵向离散系数的一般公式形式;考虑河床变化大、河道不顺直、含沙量大等特点,根据研究河段不同的河道特征,以理论计算值作为样本数进行多元回归分析,采用分段的方式分别得到适用于黄河下游干流河段的污染物纵向离散系数的经验估算公式.结果表明,应用该经验估算公式得到的山东河段相关系数较高,河南河段估算结果不够理想.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号