首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 875 毫秒
1.
提出了加权主成分分析法和三种新的权函数;通过实验研究了在五种权函数下加权线性判别分析(WLDA)和加权主成分分析(WPCA)对多分类问题的分类结果的影响.  相似文献   

2.
莫莉敏 《科技信息》2009,(33):68-69
本文提出了基于局部特征自适应加权2维主成分分析(2DPCA)表情识别方法。该方法采用分块来融合基于整体模板的分类方法和基于几何特征的分类方法,通过虚拟样本自适应地计算出不同特征对识别的不同贡献,并加权到分类器中。  相似文献   

3.
为了提高邮件分类的准确性和分类速度,提出一种基于加权子图和支持向量机相融合的邮件分类方法.首先通过收集邮件分类样本数据,利用加权子图提取邮件特征,并实现加权,然后采用核主成分分析选择邮件的最优特征子集,最后输入到支持向量机中进行学习,并采用布谷鸟算法搜索支持向量机参数,建立最优邮件分类器.仿真实验结果表明,该邮件分类方法不仅提高了邮件分类的正确率,而且分类速度明显加快,可以较好地满足网络邮件在线分类要求.  相似文献   

4.
地理加权主成分分析可判别各主成分的方差贡献的空间变动,并诊断出影响各主成分空间变化的变量.本文在结合传统主成分分析与地理加权主成分分析技术,选取经济发展水平综合评价指标,对江苏省63个县、市的经济特征进行主因子提取.得到以下主要结论:主成分分析提取得到3个主成分,分别表征经济增长方式、经济结构与经济动力;蒙特卡罗检验在0.05水平下,显著性拒绝主成分的特征值与因子载荷在空间变化上的平稳性假设;地理加权主成分的因子载荷主导着不同地区的经济结构特征,且呈集中连片分布特性,地理加权主成分的方差贡献率存在着明显的南北分异态势.可见,地理加权主成分分析可以有效识别各主成分的局域空间变化效应,诊断出影响地区经济特征空间变化的主要变量,有利于深化对社会经济要素空间的分异特征和内在机理的认知与理解.  相似文献   

5.
分析了加权马氏距离判别分析中的权值问题,提出了用熵理论来确定加权马氏距离中权值的方法。实证分析显示基于熵理论的加权马氏距离要优于基于主成分的加权马氏距离。  相似文献   

6.
加权主成分分析法在公路网综合评价中的应用   总被引:3,自引:0,他引:3  
城市公路网的分析与评价对于公路网规划项目开发、实施决策具有重要的理论价值和现实意义.建立了基于加权主成分分析法的公路网综合评价模型,并给出了评价案例评价结果表明,利用加权主成分分析法评价公路网可以将主成分分析法的客观分析和层次分析法的主观分析有机地结合起来,其评价结果更加全面、更加符合客观实际情况。  相似文献   

7.
基于加权主元分析(WPCA)的人脸识别   总被引:9,自引:0,他引:9  
将特征加权和主元分析相结合,提出了一种新的加权主元分析方法;这种方法先根据加权重建误差最小化,计算出各类训练样本的加权子空间,然后计算测试样本点到各加权子空间的距离,并根据该距离进行分类识别.最后,通过对剑桥ORL数据库进行的试验证明,该方法与传统的主元分析相比可以在不增加运算量的情况下大大提高识别率.  相似文献   

8.
利用主成分分析法改进距离判别分析法,然后将该方法应用于膨胀土胀缩等级分类中,建立膨胀土胀缩等级分类的加权距离判别分析模型。选取黏粒含量、粉粒含量、液限、塑限和塑性指数等5项指标作为膨胀土胀缩等级判别因子,利用已经测得的膨胀土数据为训练样本进行学习,建立相应的判别函数。然后对待判样本进行判别分类,该判别分类结果与实测分类结果100%吻合。研究结果表明,加权距离判别方法完善了距离判别分析法理论,该方法分类性能良好,预测精度高,在实际工程应用中有广阔的前景。  相似文献   

9.
针对协变量为函数型、响应变量为标量的一元函数型回归模型,提出一种自适应加权截断法来解决主成分基展开时的项数选取问题.首先,分别依据方差解释百分比(PVE)和关联变异解释百分比(PAVE)对函数型主成分个数进行截断,然后对各自截断出的主成分个数进行加权求和,通过优化算法获得使估计误差达到最小的最优权重,进而得到最终的主成...  相似文献   

10.
[目的]针对协同训练算法在视图分割时未考虑噪声影响和两视图分类器对无标记样本标注不一致问题,提出了基于加权主成分分析和改进密度峰值聚类的协同训练算法.[方法]首先引入加权主成分分析对数据进行预处理,通过寻求初始有标记样本中特征和类标记之间的依赖关系求得各特征加权系数,再对加权变换后的数据进行降维并提取高贡献度特征进行视...  相似文献   

11.
基于特征相关的改进加权朴素贝叶斯分类算法   总被引:1,自引:0,他引:1  
朴素贝叶斯分类算法的特征项间强独立性的假设在现实中是很难满足的.为了在一定程度上放松这一假设,提出了基于特征相关的改进加权朴素贝叶斯分类算法,该算法采用一种新的权重计算方法,这种权重计算方法是在传统词频反文档频率(TF-IDF)权重计算基础上,考虑到特征项在类内和类间的分布情况,另外还结合特征项间的相关度,调整权重计算值,加大最能代表所属类的特征项的权重,将它称之为TF-IDF-FC权重计算.与基于传统TF-IDF权重的加权朴素贝叶斯分类算法和其他常用加权朴素贝叶斯分类算法比较,如基于属性加权的朴素贝叶斯分类算法,这种算法的分类效果均有一定的提高.  相似文献   

12.
 利用不同基因组全序列中寡聚核苷酸频率组分差异信息构建系统树,并与传统方法的建树结果比较,分析以寡聚核苷酸频率组分差异信息构建系统树的可行性及适用范围。在获得194种原核生物基因组全序列寡聚核苷酸频率数据的基础上,依据寡聚核苷酸组分的保守性构建权重矩阵,对寡聚核苷酸组分差异加权,并尝试用绝对值距离、Lance距离、欧氏距离三种方法计算距离矩阵,再用距离法构建系统树。结果显示,该方法对科以下分类单位的建树与传统方法的建树基本一致,而对科以上的分类单位较难区分。首次利用寡聚核苷酸频率保守性进行加权,通过非比对的算法用基因组全序列建树。  相似文献   

13.
结合Logistic回归分类,该文提出一种新的构造证据理论基本信度分配函数的方法,并将其应用于多特征图像分类.该方法首先以多类Logistic回归分类法输出的后验概率与样本分类正确率建立证据权重系数,然后构造出加权的基本信度分配函数,最后利用加权D-S证据融合判别所属类别.实验结果显示:该方法既能提高图像分类的正确率,又能改正使用单特征分类导致的分类正确率的不稳定的缺点.  相似文献   

14.
提出了一种面向情绪分类的融合词内部信息和情绪标签的词向量学习方法。在CBOW模型的基础上,引入词内部成分和情绪标签信息,以适应微博情绪表达的不规范,同时丰富词向量的情绪语义。对于输入文本,按照词的TF-IDF权重对词向量进行加权求和,以作为文本向量表示。以上述词向量或文本向量作为情绪分类器的输入,采用机器学习的分类方法(LR、SVM、CNN),验证本文情绪词向量在情绪分类任务上的实验效果。实验表明,情绪词向量与原始CBOW词向量相比,在准确率、召回率、F值等各项指标上都有更好的表现。  相似文献   

15.
加权概念格是针对属性的重要程度,通过引入内涵权值而形成的一种格结构。采用加权概念格作为分类规则提取工具,通过引入加权外延支持度,给出了一种新的分类规则的提取算法CRAAF-WCL。最后,利用恒星光谱数据作为形式背景,实验验证了该算法具有较高的分类效果。  相似文献   

16.
当前中文微博情感分析的主流做法是将情感极性分类结果的好坏作为评判的标准。从提高微博情感判别准确度的目的出发,尽量多考虑影响微博情感的元素。在统计微博中情感词的基础上,加入了微博表情这一重要元素,采用与文本情感值加权的方式参与微博情感计算,使得对含有表情的微博情感判定结果有了一定程度的提高;在语义规则部分,基本涵盖了汉语中最常用的几种句型规则和句间关系规则,使得对复杂语句的情感分析更加准确。同时,还对每条微博的情感给出了具体的数值,并在正确率、召回率、F 值的基础上,提出合格率这一指标,对微博情感判别方法得到的数值准确性进行评价。通过搭建 Hadoop 平台对测试集的1万条数据进行测试,验证了融合算法的有效性。  相似文献   

17.
基于权值调整的文本分类改进方法   总被引:14,自引:0,他引:14  
文本分类是文本挖掘的基础与核心 ,可广泛应用于传统的情报检索和 Web信息的检索与挖掘等。提出了一种利用权值调整思想对向量空间法 (VSM)和朴素 Bayes分类器 (NBC)进行改进的文本分类方法 ,并探讨了利用 EM算法进行无导师 Bayes分类的方法 ,设计和实现了一个中英文文本分类系统 CZW。 3组实验数据表明 ,用某些评估函数调节单词权值可有效提高 VSM和 NBC等文本分类模型的精度 ,并且训练文本规模越大 ,改进的效果越明显。 NBC的分类精度最高可达 86 %。  相似文献   

18.
针对在线医疗评论文本具有行业专业性强、差异性大、不够规范等特点,提出一种基于特征加权词向量的在线医疗评论情感分析方法.利用Word2vec方法构建词向量模型,抽取情感词集合完善医疗服务领域情感词典,根据句法关系识别主题词与情感词的依存关系,引入期望交叉熵因子,建立特征加权词向量模型,分析在线医疗评论的情感倾向.实验结果表明扩充的医疗服务情感词典在分析性能上的准确率、召回率以及F1值均高于基础情感词典,引入期望交叉熵因子后,基于特征加权词向量的情感分析方法在SVM分类上表现出更好的效果,体现了其在在线医疗评论挖掘领域的良好效用.   相似文献   

19.
针对LDA(Latent Dirichlet Allocation)主题模型生成的大量topic,很大部分topic内部词语相关度很低,可解释性差,对语言模型后的应用效果带来一定的影响.针对这一问题,该文提出了一种基于主题加权LDA模型的情感分类方法,该模型实现不同主题中内部相关的词语特征加权计算,能够消除不同主题内具有相关度词语的相互影响.实验结果表明,与传统LDA模型分类方法对比,该文提出的基于主题加权LDA模型的情感分类方法平均F1值提高了6.7%~8.1%,验证了该文提出的方法是有效的,提高了分类效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号