首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 906 毫秒
1.
用正态分布密度函数逼近条件概率的方法,构造出一种新的贝叶斯算法,对服从正态分布的实例进行分类.大量算例验证了该算法的分类有效性,它可以应用到求解各种数据挖掘问题.  相似文献   

2.
朴素贝叶斯分类器是当前流行的一种文本分类算法,但是它的属性独立性假设使其无法表达文本词语之间的依赖关系,TAN(Tree Augmented NaIeve Bayes)在许多情况下优于朴素贝叶斯分类器。然而,由于学习TAN所需的空间是数据属性个数的二次项级,限制了TAN对高维数据(如:文本数据)的分类,本文介绍了TAN模型及其一般的构造算法,提出一种新的TAN构造算法ITAN,该算法的空间复杂度是数据属性个数的线性级,最后将该算法用于文本分类,实验比较了朴素贝叶斯分类器和TAN分类器,实验结果表明:该方法具有较好的分类性能。  相似文献   

3.
针对朴素贝叶斯网络分类模型在处理高维大数据量时的效率偏低和准确率有待提高的问题,结合主元分析法与K-均值聚类算法构造出了一个改进的朴素贝叶斯网络分类模型;摒弃了非类属性变量相对于类属性变量相对独立的前提条件,算法首先用主元分析法在对数据集的信息量尽量保存的同时进行了降维操作,使得算法可以着重于进行分类问题;算法还提出了一个"相对融合点"的概念,有效地提高了算法的性能;最后对算法的性能进行了分析,并将改进的算法应用到实际的数据集进行实验,用算法产生的分类结果对数据集中产生的一些缺失数据进行修补。  相似文献   

4.
关系朴素贝叶斯分类算法对于目标关系表和背景关系表中不同的记录关联方式采用不同的策略,灵活运用连接和元组ID传播技术,高效地实现了将背景关系表中的信息加入到目标关系表中一起考虑来进行分类,提高了分类正确率。该算法采用关系数据库的数据表示方式,解决了传统的朴素贝叶斯算法不能支持关系数据库的问题。  相似文献   

5.
基于遥感影像的最大似然分类算法的探讨   总被引:10,自引:0,他引:10  
王增林  朱大明 《河南科学》2010,28(11):1458-1461
通过对最大似然分类算法的研究,并将其与马氏距离分类法在相同情况下进行对比试验,结果表明,最大似然分类方法对于光谱特性呈正态分布的遥感影像能提供较高的分类精度,而对于光谱特性呈非正态分布或偏离正态分布总体的遥感影像,最大似然分类法的实际分类效果并不理想,进而分析最大似然分类法的适用性.  相似文献   

6.
 空间分类是空间数据挖掘的重要分支,寻找高效的空间分类算法是空间分类研究的重要方向.在空间对象的邻接图及朴素贝叶斯分类法的基础上提出一个新的空间分类算法,该算法对空间对象进行分类时,既考虑了待分类对象的属性对分类的影响,又考虑了其空间邻接对象对它分类的影响.该算法的计算复杂度不高,分类的正确性好.  相似文献   

7.
各个教学点单独估得的效益值不尽相同甚至是矛盾的。本文采用层次线性模型和经验Bayes方法,将教学效益看成是随机的综合求得教学效益的估计值。本文还证明了在给定条件下条件正态变量与条件变量(亦服从正态分布)的联合分布仍为正态分布。最后给出了算法的框图和例子。  相似文献   

8.
空间分类既要考虑待分类对象的非空间属性,还要考虑其空间邻接对象非空间属性对分类的影响.提出一种基于多关系的朴素贝叶斯空间分类算法,算法将多关系分类方法用于空间分类,考虑了不同近邻对象的非空间属性对分类产生的影响,其分类准确率高于单关系朴素贝叶斯空间分类算法.算法可以用于空间数据库中的大数据集,不需要复杂的数据预处理.  相似文献   

9.
朴素贝叶斯分类算法以其简单、高效等优点一直是分类算法的研究热点之一。但是它的条件独立性假设不能很好的表现多数现实应用中变量之间存在的依赖关系,从而影响它的分类效果。针对这一问题,提出了一种改进算法,该算法通过基于协方差和卡方拟合统计量的思想来确定权重系数。实验结果表明,与朴素贝叶斯算法相比,对于分类正确率有一定的提高。  相似文献   

10.
基于相关系数的加权朴素贝叶斯分类算法   总被引:7,自引:0,他引:7  
朴素贝叶斯分类算法的条件独立性假设在很少情况下能够满足,为了克服该问题,提出了一种基于相关系数的加权朴素贝叶斯分类模型.通过计算条件属性和决策属性之间的相关系数,对不同的条件属性赋予不同的权重,从而在保持简单性的基础上有效地提高了朴素贝叶斯算法的分类性能.首先给出了基于相关系数的属性权值求解方法,然后描述了相应的算法,并对算法原理进行了分析与证明.通过在中医小儿肺炎病例数据集和UCI数据集上的仿真实验,验证了该方法的有效性.  相似文献   

11.
R-Tree is a good structure for spatial searching. But in this indexing structure,either the sequence of nodes in the same level or sequence of traveling these nodes when queries are made is random. Since the possibility that the object appears in different MBR which have the same parents node is different, if we make the subnode who has the most possibility be traveled first, the time cost will be decreased in most of the cases. In some case, the possibility of a point belong to a rectangle will shows direct proportion with the size of the rectangle. But this conclusion is based on an assumption that the objects are symmetrically distributing in the area and this assumption is not always coming into existence. Now we found a more direct parameter to scale the possibility and made a little change on the structure of R-tree, to increase the possibility of founding the satisfying answer in the front sub trees. We names this structure probability based arranged R-tree (PBAR-tree).  相似文献   

12.
There are numerous geometric objects stored in the spatial databases. An importance function in a spatial database is that users can browse the geometric objects as a map efficiently. Thus the spatial database should display the geometric objects users concern about swiftly onto the display window. This process includes two operations:retrieve data from database and then draw them onto screen. Accordingly, to improve the efficiency, we should try to reduce time of both retrieving object and displaying them. The former can be achieved with the aid of spatial index such as R-tree, the latter require to simplify the objects. Simplification means that objects are shown with sufficient but not with unnecessary detail which depend on the scale of browse. So the major problem is how to retrieve data at different detail level efficiently. This paper introduces the implementation of a multi-scale index in the spatial database SISP (Spatial Information Shared Platform) which is generalized from R-tree. The difference between the generalization and the R-tree lies on two facets: One is that every node and geometric object in the generalization is assigned with a importance value which denote the importance of them, and every vertex in the objects are assigned with a importance value,too. The importance value can be use to decide which data should be retrieve from disk in a query. The other difference is that geometric objects in the generalization are divided into one or more sub-blocks, and vertexes are total ordered by their importance value. With the help of the generalized R-tree, one can easily retrieve data at different detail levels.Some experiments are performed on real-life data to evaluate the performance of solutions that separately use normal spatial index and multi-scale spatial index. The results show that the solution using multi-scale index in SISP is satisfying.  相似文献   

13.
针对前混合磨料射流系统存在的磨料涌出而导致对系统管件 ,尤其是喷嘴产生磨损的问题 ,对原有的射流系统进行了分析 .在分析结果的基础上 ,提出了 3种改进型系统 .对改进型系统进行了定性的理论分析 ,用试验手段得到高压管路的波速值 ,并用试验检验的方法得出了 3种改进型系统性能优劣的比较 ,认为改进 型系统较好的解决了磨料涌出并磨损管路元件的问题 .图 6 ,表 2 ,参 6  相似文献   

14.
The discovery of the prolific Ordovician Red River reservoirs in 1995 in southeastern Saskatchewan was the catalyst for extensive exploration activity which resulted in the discovery of more than 15 new Red River pools. The best yields of Red River production to date have been from dolomite reservoirs. Understanding the processes of dolomitization is, therefore, crucial for the prediction of the connectivity, spatial distribution and heterogeneity of dolomite reservoirs.The Red River reservoirs in the Midale area consist of 3~4 thin dolomitized zones, with a total thickness of about 20 m, which occur at the top of the Yeoman Formation. Two types of replacement dolomite were recognized in the Red River reservoir: dolomitized burrow infills and dolomitized host matrix. The spatial distribution of dolomite suggests that burrowing organisms played an important role in facilitating the fluid flow in the backfilled sediments. This resulted in penecontemporaneous dolomitization of burrow infills by normal seawater. The dolomite in the host matrix is interpreted as having occurred at shallow burial by evaporitic seawater during precipitation of Lake Almar anhydrite that immediately overlies the Yeoman Formation. However, the low δ18O values of dolomited burrow infills (-5.9‰~ -7.8‰, PDB) and matrix dolomites (-6.6‰~ -8.1‰, avg. -7.4‰ PDB) compared to the estimated values for the late Ordovician marine dolomite could be attributed to modification and alteration of dolomite at higher temperatures during deeper burial, which could also be responsible for its 87Sr/86Sr ratios (0.7084~0.7088) that are higher than suggested for the late Ordovician seawaters (0.7078~0.7080). The trace amounts of saddle dolomite cement in the Red River carbonates are probably related to "cannibalization" of earlier replacement dolomite during the chemical compaction.  相似文献   

15.
本文叙述了对海南岛及其毗邻大陆边缘白垩纪到第四纪地层岩石进行古地磁研究的全部工作过程。通过分析岩石中剩余磁矢量的磁偏角及磁倾角的变化,提出海南岛白垩纪以来经历的构造演化模式如下:早期伴随顺时针旋转而向南迁移,后期伴随逆时针转动并向北运移。联系该地区及邻区的地质、地球物理资料,对海南岛上述的构造地体运动提出以下认识:北部湾内早期有一拉张作用,主要是该作用使湾内地壳显著伸长减薄,形成北部湾盆地。从而导致了海南岛的早期构造运动,而海南岛后期的构造运动则主要是受南海海底扩张的影响。海南地体运动规律的阐明对于了解北部湾油气盆地的形成演化有重要的理论和实际意义。  相似文献   

16.
微生物矿化作用可以有效愈合混凝土裂缝,达到修复混凝土裂缝的目的.本文以带裂缝混凝土为研究对象,设置0.2、0.3、0.6 mm三个裂缝宽度和20、30 mm两个裂缝深度,以巴氏芽孢杆菌为菌株,通过裂缝观测、超声波测试、立方体抗压强度测试及裂缝内部微生物沉积物质的微观形貌分析,研究微生物对不同深度及宽度混凝土裂缝的修复效果.研究结果表明:巴氏芽孢杆菌可有效修复混凝土表面裂缝;氧气的供给是微生物在裂缝内部矿化的重要环境条件,随着裂缝深度的增加,巴氏芽孢杆菌的修复效果减弱;随着裂缝宽度的增大,微生物在裂缝内部的矿化效果减弱.  相似文献   

17.
海德格尔对荷尔德林诗歌的阐释,目的是进行诗与思的对话,归根结底还是探讨存在。诗与“在”的关系,是海氏诗学框架的核心内容,诗与“在”的关系又进一步引申为艺术与真理的关系,本从真理如何被遮蔽的问题入手,试图读解海德格尔诗学的内涵。艺术是无蔽的真理显明的一种方式,诗是危机的拯救,语言是存在的家园。海德格尔对诗与在的探讨最后又转入了对语言的探讨,无法走出语言的牢笼。只有在实践中,把艺术变成为社会变革的一个因素,才可以解放被传统理性压迫的力量,显现艺术的真理,确立艺术的价值。  相似文献   

18.
石油勘探开发建设项目评价是石油勘探开发建设项目管理的重要内容之一,也是提高项目决策科学性的一个重要环节。首先分析了石油勘探开发建设项目评价的理论和方法,然后从项目前评价、项目中评价、项目后评价、技改项目评价四部分讨论了项目评价的基本内容,并在此基础上构建出了新的项目评价系统。指出:新的项目评价系统与传统的评价系统[1]的最大区别在于增加了项目中评价内容,并且对其它大、中型建设项目也是适用的。  相似文献   

19.
学习普通话的重要环节是在语流中模仿普通话的节律。停延作为节律的基础,确定了语流中的音步组合,进而关系到协同发音、连续变调等一系列语音现泉。停延的研究对于普通话的朗读教学具有重要的现实意义。该文以《普通话水平测试实施纲要》提供的60篇短文为语料,对于文中的停顿做出了定量、定性的分析:普通话的音步组合层的平均长度为5—7个音节,影响各篇短文音步组合层长度的主要因素是文体风格。该文根据60篇短文的语音资料,提出了设置句中无标点停顿的语义原则、语法原则、语用原则。根据语义原则,只能在有助于语义表达的地方停顿。根据语法原则,只能在构成语法结构的地方停顿。如果在某种情况下构成了非语法停顿,那是为了满足节律的需要。根据语用原则,人们通过对语境的分析,以停顿为手段,实现表情达意的最佳效果和节奏的匀称感。文中以大量例句,对各种语法结构中的语音停顿现泉进行比较说明,做出了令人信服的阐释。  相似文献   

20.
“物理”流变考   总被引:1,自引:0,他引:1  
“物理”一词,在中国古代最早见于战国,此后在各种典籍中被广泛使用。其含义泛指万物之理与自然规律,这种含义与西方古代“物理”一词的含义相近,明清时期西学东渐,“物理”一词的翻译几经变化,古代日本的科学在相当程度上受到中国的影响,17世纪至19世纪上半叶来华传教士译述的物理书籍也在日本被注释翻译,甲午战争后,中日两国之间科技交流的态势发生了逆转,19世纪下半叶至20世纪初,日中两国“物理”一词的译名先后确定,随着现代物理学的迅速发展,物理学研究的范围和对象又在不断地变化。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号