首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 359 毫秒
1.
贝页斯数学模型在文本分类计算中得到广泛应用。过滤模型原理简单、运算效率高,保证了文本分类准确,但同时也产生一定偏差。利用贝页斯数学模型[1],针对测试样本集合的变化,分析研究贝页斯过滤规则的变化规律。为设计一种过滤方案提供理论依据。  相似文献   

2.
为解决MNB分类器在测试样本变化时分类精度误差较大的问题,采用权重标准补集分类器(WCNB)代替MNB分类器,并研究WCNB分类器对不同测试样本分类精度的变化,针对WCNB技术存在目标字符串变化所产生的权重计数问题,采用目标字符串频率转换技术,建立一种有误差补偿功能的WCNB分类器数学模型并进行了实验仿真. 实验仿真结果验证了WCNB数学模型的可行性.   相似文献   

3.
为降低垃圾邮件系统分类计算的误码率,分析了贝页斯垃圾邮件过滤系统对目标邮件的自动检测过程,从系统过滤质量和用户容错两个方面研究系统成本定义.在不同样本集合及其属性空间内,对于词语还原和间断表的开启与关闭,重点分析成本参数λ,通过调整成本参数分析贝页斯过滤系统在多种假定下邮件处理结果,完善系统建模定义标准,优化应用系统建模,提高系统过滤质量.实验结果证明该解决方案是可行的.   相似文献   

4.
基于改进蚁群算法的高精度文本特征选择方法   总被引:1,自引:0,他引:1       下载免费PDF全文
为了反映特征子集对分类结果的整体影响,去除噪声特征项,提出了一种基于改进蚁群算法的高精度文本特征选择方法。建立了特征选择数学模型,实现了特征选择过程与分类器分类过程间的直接关联;设计了特征优选与特征精选相结合的模型求解方案,降低了模型求解过程中的计算复杂度;提出了基于等效路径增强和局部搜索更新相结合的改进蚁群算法,提高了解的质量和稳定性。实验结果表明,与现有文本特征选择方法相比,该方法能大幅提升分类精度。  相似文献   

5.
介绍了一种基于贝叶斯定理的文本分类模型“树桩网络(stump network)”。将该方法与朴素贝叶斯文本分类器和TAN(tree augmented naive bayes)文本分类器进行实验比较。结果表明,在大多数数据集上该文本分类方法具有较好的分类正确率。  相似文献   

6.
利用第一、二类契贝谢夫多项式的性质,研究了两类契贝谢夫多项式系数的绝对值和的有关性质,获得了它的表达式及其一些恒等式.  相似文献   

7.
奇下标契贝谢夫多项式的积和式及其应用   总被引:1,自引:0,他引:1  
研究了第二类契贝谢夫多项式Un(x)(n=0,1,2,…)的性质,给出了奇下标第二类契贝谢夫多项式的一组积和式及二个推论.  相似文献   

8.
盖根堡多项式以及斐波那契数和鲁卡数的一些恒等式   总被引:35,自引:0,他引:35  
通过对盖根堡及契贝谢夫多项式性质的研究,得到了盖根堡多项式,契贝谢夫多项式以及关于斐波那契数和鲁卡数的一些有意义且可以具体计算的恒等式。  相似文献   

9.
冯小宁 《科技信息》2011,(25):I0366-I0366,I0333
可靠性预测评估方法很多,其中最基本的方法有:解析法、模拟法、新型算法,其中解析法中又包括故障模式后果分析法(FMEA)、最小路法、网络等值算法、故障扩散法、基于马尔科夫模型的解析法、故障遍历算法;模拟法中包括时序蒙特卡罗模拟法;新型算法中包括人工神经网络算法(ANN)、模糊数学评估法、贝页斯方法、灰色预测方法等。  相似文献   

10.
介绍了本体和语义网,提出了基于本体的语义网在数字图书馆中的一个应用模型——自动文本分类器。  相似文献   

11.
提出一种基于多重假设检验的特征加权朴素贝叶斯分类算法, 该算法通过特征选择方法得到多个特征词集合, 再按多重假设检验错误率为每个特征词集合配以不同的权重系数并参与到分类器的构建中. 该方法已经应用到市长公开电话的文本分类中, 通过构建的3个特征加权朴素贝叶斯分类器实现了投诉文本的计算机自动分类, 且相对传统方法提高了分类器的效率和精度.  相似文献   

12.
基于权值调整的文本分类改进方法   总被引:14,自引:0,他引:14  
文本分类是文本挖掘的基础与核心 ,可广泛应用于传统的情报检索和 Web信息的检索与挖掘等。提出了一种利用权值调整思想对向量空间法 (VSM)和朴素 Bayes分类器 (NBC)进行改进的文本分类方法 ,并探讨了利用 EM算法进行无导师 Bayes分类的方法 ,设计和实现了一个中英文文本分类系统 CZW。 3组实验数据表明 ,用某些评估函数调节单词权值可有效提高 VSM和 NBC等文本分类模型的精度 ,并且训练文本规模越大 ,改进的效果越明显。 NBC的分类精度最高可达 86 %。  相似文献   

13.
采用朴素Bayes算法建立中文文本自动分类器, 并研究相关参数的选择问题, 以实现中文文本的高效分类. 首先在模型训练阶段, 采用N-gram模型处理训练数据集提取特征向量; 然后使用朴素Bayes算法建立文本分类器; 最后在模型测试阶段, 为提高分类准确率, 使用词频反文档频率算法对测试样本进行特征向量提取. 实例分析结果表明, 在提取训练集特征向量时, 2-gram模型和4-gram模型的特征提取效果最佳; 在选取特征向量长度时, 长度为25 000的特征向量可使分类准确率出现最大增幅并保证较高准确率; 在确定特征项词性方面, 同时选取动词和名词可使分类器准确率达到最高, 仅选取动词时准确率最低.  相似文献   

14.
采用朴素Bayes算法建立中文文本自动分类器, 并研究相关参数的选择问题, 以实现中文文本的高效分类. 首先在模型训练阶段, 采用N-gram模型处理训练数据集提取特征向量; 然后使用朴素Bayes算法建立文本分类器; 最后在模型测试阶段, 为提高分类准确率, 使用词频反文档频率算法对测试样本进行特征向量提取. 实例分析结果表明, 在提取训练集特征向量时, 2-gram模型和4-gram模型的特征提取效果最佳; 在选取特征向量长度时, 长度为25 000的特征向量可使分类准确率出现最大增幅并保证较高准确率; 在确定特征项词性方面, 同时选取动词和名词可使分类器准确率达到最高, 仅选取动词时准确率最低.  相似文献   

15.
 提出了1种基于PCA(主成分分析)的贝叶斯判别器用于检测灰度面部图像.为检测面部图像,首先用PCA减低训练图像的维数以为判别器提供教好的图像描述.训练图像包括面部图像和非面部图像并给出正确标识,用EM算法学习图像的特征向量.在构建好学习模型后,用贝叶斯后验概率检测未知样本.模型参数估计和判别原则都是基于最大似然度.在估计了概率密度函数后,贝叶斯判别器可产生最小的误差,为分类的教优准则.本方法用2356副面部图像和3780非面部图像作为学习样本,学习过程获取面部图像与非面部图像的差异而构建判别模型.训练图像包括不同位置,不同表情,不同亮度条件的同一对象图像.训练模型用于检测205副面部图像,实验结果在文章第4部分给出.  相似文献   

16.
为了解决电子商务环境中由于信息的保密性使协商参与者无法获得对手协商偏好从而影响协商性能的问题,提出一种基于分类器融合的自动化协商决策模型.该模型融合支持向量机和贝叶斯分类器,通过结合2种分类器的优点,提高对协商偏好的分类学习效果.在准确估计对手协商偏好的基础上,采用粒子群优化算法搜寻最优协商反建议.实验数据分析表明,新方法的效果优于单一分类器,并且在有噪声的小规模训练样本集下,仍然保持较高的协商总效用.  相似文献   

17.
朴素贝叶斯分类方法是一种广泛使用的分类算法,在独立性假设不完全满足的情况下计算效率和分类效果均较为理想.通过分析全局特征向量中各特征与类别属性之间的联系,提出将组合特征置换多源特征,用组合特征的共现率对多源特征进行概率调整的新方法,在不同数据集的实验中,调整后的朴素贝叶斯分类器(FRNB)的分类精度均好于传统朴素贝叶斯分类器.测试结果表明,改进后的算法是有效可行的.  相似文献   

18.
张稳  恰汗&#;合孜尔  苗刚 《科技信息》2007,(29):228-229,234
本研究采用JSP技术,对多项式回归、指数曲线拟合及正交多项式曲线拟合三种数学模型的算法复杂度、绝对平均误差、误差方差进行研究分析,从而探索一种适合于高校毕业生就业率统计与分析的数学模型。  相似文献   

19.
提出一种新的学习无约束贝叶斯网络分类器的算法(RE-BNC).该算法基于粗糙集理论,在保证分类精度不变的前提下,先对冗余属性变量进行约简,降低属性变量维数,然后构建一个无约束优化模型用来学习较好的初始种群,降低搜索空间,再结合进化算法学习分类器的网络结构.与其他常见的8种分类器算法相比较,实验结果表明该算法设计合理,且分类效果较好.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号