排序方式: 共有88条查询结果,搜索用时 15 毫秒
71.
针对传统的特征选择算法只专注于特征间的相关性和冗余性而没有考虑特征之间交互作用的问题,提出一种基于交互信息的混合特征选择(hybrid feature selection based onmutual information,MIHFS)算法,该算法以K-最近邻算法的分类准确率作为衡量所选特征分类性能的评价指标,有效地去除了冗余和不相关的特征,保留了具有交互作用的特征。为了评估该算法的性能,从分类准确率、所选特征数量以及算法稳定性三方面,与最大相关最小冗余、联合互信息等7种特征选择算法在8个数据集上进行了实验比较和分析。实验结果表明:MIHFS算法具有较强的稳定性,不仅有效降低了特征空间的维数,而且在所选特征的分类性能方面明显优于其他特征选择算法。最后将MIHFS算法与灰色关联分析法-逼近理想解的排序技术法相结合并应用到高邮凹陷永安地区戴一段地质评价中,其评价结果准确率为80%,与实际钻探结果基本吻合,具有较高的可靠性,能够有效指导油气地质评价。 相似文献
72.
KNN算法是一种思想简单且容易实现的分类算法,但在训练集较大以及特征属性较多时候,其效率低、时间开销大.针对这一问题,论文提出了基于模糊C-means的改进型KNN分类算法,该算法在传统的KNN分类算法基础上引入了模糊C-means理论,通过对样本数据进行聚类处理,用形成的子簇代替该子簇所有的样本集,以减少训练集的数量,从而减少KNN分类过程的工作量、提高分类效率,使KNN算法更好地应用于数据挖掘.通过理论分析和实验结果表明,论文所提算法在面对较大数据时能有效提高算法的效率和精确性,满足处理数据的需求. 相似文献
73.
在K近邻和逆K近邻理论基础上提出了K近邻团的概念。通过度量对象间的相似度,任意两个元素都互为K近邻和逆K近邻的对象集合构成一个K近邻团。利用同一个K近邻团中的对象彼此都具有较高相似性的特点,选取不同的K值对目标集合进行聚类。通过实验证明了该方法的有效性。 相似文献
74.
75.
提出了超长方体与KNN相结合的分类算法.在训练阶段,该算法为训练集中的每一个类别构造多个超长方体,区域分离每一类训练样本.在测试阶段,该算法首先检查测试样本是否被某一个超长方体包围,如是则其类别被识别出,否则用KNN方法确定其类别.实验采用四个真实数据集进行测试.实验结果表明基于超长方体与KNN的分类算法在四个数据集全部优于两个基于多球覆盖的分类方法,是一种有效的分类方法. 相似文献
76.
从分类算法和特征基因选择两个方面研究基因表达数据的分类,将传统的Support Vector Machines(SVM)算法和K-nearest neighbor(KNN)算法两者结合成为一种应用于基因表达数据分类的算法,并针对基因表达数据分类数据集“样本少,维数高”的特点,提出了一种改进的基于相关性的递归特征消除算法(简称为C-RFE),消除了数据冗余.实验结果表明,新方法可有效提高分类准确率和特征选取的效率. 相似文献
77.
对3种常用的文本分类方法进行了分析和比较,并进行了对比实验,结果表明支持向量机是进行文本分类较好的方法.最后讨论了支持向量机在文本分类中存在的缺点. 相似文献
78.
郑成勇 《五邑大学学报(自然科学版)》2007,21(1):16-20
利用小波变换对训练图像和待识别图像进行小波分解,提取低频分量,通过行扫描转化为列向量,作为特征向量;在此基础上,提出利用多元线性回归分析方法,利用最小二乘法获得训练特征与待识别特征之间的线性模型,经由残差分析确定待识别样本的类别.利用ORL人脸库,与支持向量机(SVM)分类器和K-最近邻分类器(KNN)进行了对比实验,实验结果表明本文算法识别精度跟SVM相当,优于KNN. 相似文献
79.
在经典特征选择算法的基础上,提出一种带专业词库的特征选择方法.在训练分类模型的时候,适当加重属于专业词汇的特征的权重.这种方法能够有效地避免特征选择时误删有用的低频词,因此,适合用于短文本的分类(电子邮件等).实验结果表明,本方法在抽取特征维数较少时,分类准确率提高约3%. 相似文献
80.
由三维扫描仪对牙齿进行扫描, 得到散乱的点云模型, 首先通过构建K D树的方法对每个点进行K邻域搜索; 然后根据这种邻域关系, 利用最小二乘原理拟合平面, 估算出每个点的法向量信息; 接着确定点云边界, 选取极值点作为初始点并建立种子三角形; 最后采用基于多约束的局部最优三角网格生长算法, 从种子三角形开始, 以边为扩展条件, 逐层搜索点并建立新的三角形; 在此过程中添加了四个约束条件, 能够较好的选取扩展点并对已存在的三角形边向外扩展, 从而形成互相邻接的三角形网格, 实现了牙齿表面的重建. 相似文献