首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
基于改进分类模型的文本分类系统实现   总被引:1,自引:0,他引:1  
提出一种基于改进的分类模型的文本分类系统来实现文本的自动分类.针对传统的特征提取算法不能很好区分特征词在类内和类间分布情况的缺陷,该系统利用方差对该算法作了改进,用改进的特征提取算法量化各个特征词的权重,为了降低特征向量的维数,采用为每个类建分类器的分类模型,利用遗传算法来修正各个类特征词的权重,直到为每个类训练出能够代表本类的特征向量,最后用这些类的特征向量进行分类.通过在同一数据集上进行对比实验,说明本文提出的改进分类模型的文本分类系统是正确可行的.  相似文献   

2.
提出一种基于多重假设检验的特征加权朴素贝叶斯分类算法, 该算法通过特征选择方法得到多个特征词集合, 再按多重假设检验错误率为每个特征词集合配以不同的权重系数并参与到分类器的构建中. 该方法已经应用到市长公开电话的文本分类中, 通过构建的3个特征加权朴素贝叶斯分类器实现了投诉文本的计算机自动分类, 且相对传统方法提高了分类器的效率和精度.  相似文献   

3.
采用朴素Bayes算法建立中文文本自动分类器, 并研究相关参数的选择问题, 以实现中文文本的高效分类. 首先在模型训练阶段, 采用N-gram模型处理训练数据集提取特征向量; 然后使用朴素Bayes算法建立文本分类器; 最后在模型测试阶段, 为提高分类准确率, 使用词频反文档频率算法对测试样本进行特征向量提取. 实例分析结果表明, 在提取训练集特征向量时, 2-gram模型和4-gram模型的特征提取效果最佳; 在选取特征向量长度时, 长度为25 000的特征向量可使分类准确率出现最大增幅并保证较高准确率; 在确定特征项词性方面, 同时选取动词和名词可使分类器准确率达到最高, 仅选取动词时准确率最低.  相似文献   

4.
采用朴素Bayes算法建立中文文本自动分类器, 并研究相关参数的选择问题, 以实现中文文本的高效分类. 首先在模型训练阶段, 采用N-gram模型处理训练数据集提取特征向量; 然后使用朴素Bayes算法建立文本分类器; 最后在模型测试阶段, 为提高分类准确率, 使用词频反文档频率算法对测试样本进行特征向量提取. 实例分析结果表明, 在提取训练集特征向量时, 2-gram模型和4-gram模型的特征提取效果最佳; 在选取特征向量长度时, 长度为25 000的特征向量可使分类准确率出现最大增幅并保证较高准确率; 在确定特征项词性方面, 同时选取动词和名词可使分类器准确率达到最高, 仅选取动词时准确率最低.  相似文献   

5.
针对三维模型的分类问题,提出了一种基于核主成分分析(Kernel-Principal Components Analysis,K-PCA)的三维模型分类算法。该算法首先选择形状直径函数(Shape Diameter Function,SDF)作为特征描述符来提取三维模型的特征向量;然后使用核函数将原始特征向量映射到高维空间中并在该空间上进行PCA得到新的特征向量;最后使用KNN算法并计算未知模型与已知类别的k个模型之间的l2范数以实现模型的分类,确定未知模型的类别。实验结果表明,该算法能够很好的识别三维模型的几何特征,能准确的区分不同类别的三维模型,具有较高的分类准确率。  相似文献   

6.
提出一种基于分块小波的人脸识别新算法.在充分考虑提取局部特征,又克服小样本问题的基础上,提出分块小波的概念.首先,对小波分解后的低频子图进行分块,提取局部特征,从而降低图像维数并除去冗余噪声;将其先后进行PCA和LDA变换,得到组合特征向量;最后,根据KNN的快速分类能力及SVM在少数类别分类上的优势,提出KNN+SVM融合分类器对组合特征向量进行分类识别.研究结果表明:该方法识别率高,识别速度快,具有一定的实用价值.  相似文献   

7.
该文在类别区分词特征选择方法的基础上,针对维吾尔文中的生气、高兴、难过、惊讶等句子的情感类别提出了类别区分词与情感词典相结合的方法,进行了句子情感分类研究。结合维吾尔语文本句子中的情感表达特点,利用类别区分词特征选择方法,提取了最有类别区分能力的特征词,并进行了情感分类。通过人工抽取方法收集了维吾尔文句子中能表达情感的关键词,并建立了一个基础情感词典。将该词典与类别区分词结合在一起作为特征,对维吾尔文句子的情感类型有效地进行了分类。实验结果表明类别区分词与情感词典相结合方法的分类效率优于只用类别区分词特征选择方法。  相似文献   

8.
针对传统特征选择算法的不足, 提出一种新的特征选择算法. 该算法能综合度量一个特征在类内和类间的重要性, 并在3个不同的数据集上利用2个分类器与5个现有的特征选择方法进行了对比实验. 实验结果表明, 该算法进一步降低了特征向量空间的维度, 并有效提高了分类器的分类性能.  相似文献   

9.
支持向量机(Support Vector Machine,简称SVM)是一种有效分类方法.不同特征选取算法对分类器影响不同,结合支持向量机特点,提出了一种基于最大间隔的支持向量机特征选取算法.利用该算法,对Iris测试数据集进行了特征选取并仿真,实验结果表明,该算法不但能够有效去除噪音数据,而且提高了分类器推广与泛化能力.  相似文献   

10.
采用类别相似度聚合的关联文本分类方法   总被引:1,自引:0,他引:1  
针对基于关联规则的分类方法在分类时仅考虑规则的置信度并使用规则修剪技术,导致分类器的分类精度难以进一步提高的问题,提出了一种基于类别相似度聚合的关联文本分类方法.该方法采用修改的χ2统计技术提取各类别的特征词;为保证规则匹配的精度和速度,使用CR-tree存储分类规则,并给出了CR-tree的构建与匹配算法;采用向量内积来计算文本类别分量与类别标志向量的相似度,进而使用规则置信度和类别相似度的聚合值作为文本分类的依据.基于实际网络文本的实验表明,该方法仅需提取30个特征词,分类结果的微平均值即可达到92.42%,优于未经剪枝的ARC-BC分类器及KNN、Bayes分类器;在分类耗时方面,该方法与未经剪枝的ARC-BC分类器持平,表明该方法引入的相似度与聚合值的计算开销在可接受的范围内.  相似文献   

11.
利用无穷小量的等价和正项级数的比较判别法,证明了判断级数敛散性的两个命题。  相似文献   

12.
中国的新一代天气雷达能够提供丰富的降水产品,但缺少反映大气热力和动力状况的产品。利用新一代天气雷达的基数据,计算出局地的温度平流、相对螺旋度、散度、垂直速度和散度垂直通量,并详细研究分析2016年南京地区的两次降水过程中,这些参量与降水演变的关系。研究表明,这些参量的变化都对降水系统的变化有良好的相关性和指示意义,温度平流通过改变局地大气热力结构和稳定度而影响系统发展;相对螺旋度、散度、垂直速度和散度垂直通量反映了局地大气的动力特性,并通过动力过程而影响降水系统的发展。层状云降水的"下暖上冷"温度平流或对流型降水中雷暴后部的"下冷上暖"温度平流结构,有利于降水的加强;相对螺旋度的变化比降水的变化提前2. 5~3. 5 h;超过3 km的散度分布直接影响降水系统的发展;系统内4 km以上的垂直上升速度对降水加强最显著;对流层中上层的散度垂直通量的负值与降水加强相关。可见,这些参量可以用于降水系统发展的雷达临近预报。  相似文献   

13.
今天,在平等问题上,我们正遭遇着前所未有的冲突:一方面,面对着现实中的极大不平等,人们呼唤平等,并将之看作现代社会制度所应当追求的价值目标和基础;另一方面,在理论上,关于要不要平等以及要什么样的平等的问题,却存在着严重的分歧,这就使得对平等分歧的思考成为必要。  相似文献   

14.
给出一种判别正项级数收敛或发散的方法,它优于通常所用的达朗贝尔(D′Alembert)判刑法。  相似文献   

15.
坐标变换的不变量   总被引:6,自引:0,他引:6  
本文证明了两个非常重要的同宿分支量,发散量积分和Melnikov向量,均为C^2坐标变换的不变量,从而它们均为系统的内蕴量。  相似文献   

16.
本文对Bender等提出的,关于非谐振子基态能微扰级数发散的问题进行了讨论,并籍助于变分法和Sturm-Liouvelle理论证明了非谐振子基态能是有界的.  相似文献   

17.
作者对轫致射的散射矩阵S(T,-T)进行了计算,这里2T指轫致辐射中的相互作用。计算结果发现:运用S(T,-T)计算散射同时不再有红外发散。  相似文献   

18.
利用粗糙集、知识库的理论引入了粒度、结构差离度、贴近度、中心差离度、边缘差离度等的概念,给出了数据集之间的距离公式.利用距离公式,分析了数据集之间的分类及识别问题,为计算机中的数据集分类、识别提供了又一有力的方法.  相似文献   

19.
新的广义距离与多模态医学图像配准   总被引:2,自引:0,他引:2  
分析了Shannon互信息、Kullback-Leibler距离和Shannon不等式之间的相互关系,并根据不等式理论,提出了广义距离度量的新概念及其定义. 在此基础上构造了多模态图像配准的一类新测度--算术-几何均值距离、Cauchy-Schwartz距离和Minkowski广义距离. 从计算速度、噪声容忍性、测度函数图形的特点和图像窗口大小影响等几个方面,通过MR和PET医学图像的实验分析,验证了新配准测度的有效性.  相似文献   

20.
为了进一步提高光纤传输激光的效率,通过改善中红外光纤输出激光时的光斑及发散角的大小设计了双透镜和两种三透镜光学聚焦系统,并得到相应的光斑图形.运用MATLAB软件对实测的光斑进行模拟计算,得到了光斑的强度分布图,通过分析计算不同聚焦系统中的不同位置处光斑的大小,计算井得到了光束发散角.实验结果表明,3种方案中凸凹凸三透镜聚焦系统效果最佳,输出的光斑直径为0.33 mm,光束的发散角为042°,提高了耦合效率,降低了传输能量的损耗.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号