期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

唐敏姜灵敏阳爱民《郑州大学学报(理学版)》2007,39(2):122-127

提出一种新的基于区域模糊特征的图像检索方法(Region-Based Image Retrieval with Fuzzy Features,RBIRFF).先将图像分割成区域后,利用模糊集理论计算每个区域的模糊特征,再利用区域特征间相似度计算方法,进行图像相似度测量.最后,按照相似度的降序排列图像,得到检索结果.介绍了RBIRFF原型系统的设计和实现,并用实验测评了其检索性能.提出的方法对大型图像数据库的快速和准确检索,有广泛的应用前景. 相似文献

2.

基于决策树归纳的聚类方法与实现

王喆陆楠周春光《吉林大学学报(信息科学版)》2003,21(2):132-137

采用一种改进后的决策树归纳聚类算法和交互式CLTree(Clustering based on decision Trees)剪枝，对商业数据的某些问题实现了聚类挖掘。对交易数据的实际酸类分新表明，该方法不仅可以处理数值型属性，还可以处理枚举型属性。实验结果表明，该方法在处理很合类型数据时具有良好的挖掘效果。对商业数据聚类分新，可以得到合理的市场分段，预测顾客的购买行为。相似文献

3.

一种面向医学短文本的自适应聚类方法

栗伟许洪涛赵大哲刘积仁《东北大学学报(自然科学版)》2015,36(1):19-23

针对电子病历中疾病诊断文本同义词识别和命名标准化问题,提出了一种自适应的文本聚类方法.首先提出了一种新的基于集合的文本相似性度量算法;然后采用基于相似度分布的文本聚类算法实现同义文本识别,该算法能够自动确定类簇个数;最后采用基于序列模式的中心概念提取算法实现了疾病命名的标准化,同时对聚类簇进行合并和优化,进一步提升了聚类的准确性.测试结果表明,所述方法具有较高的准确率和聚类效率,在病历文本的预处理、分类和分析中具有广泛意义. 相似文献

4.

一种基于矩阵变换的层次聚类算法 总被引：1，自引：0，他引：1

刘志勇邓贵仕《郑州大学学报(理学版)》2010,42(2)

针对K-means算法需预先确定聚类数的缺陷,提出一种基于矩阵变换的层次聚类(NHC)算法,通过对矩阵行列的排序、变换,把矩阵分块成子矩阵聚类,以熵作为评价聚类结果标准.实验表明,NHC算法的执行效率和聚类精度高于传统的HCM(hard C-means)算法. 相似文献

5.

基于属性相似度的连续型特征选择方法

王宏威李国和《渤海大学学报(自然科学版)》2014,(4):350-355

特征选择作为模式识别领域的研究热点,是一种重要的降维方法.对于连续型特征,目前主要采用离散化方法或特征分类能力的"相关性"评估进行特征选择.引入区间数相似度的概念,提出一种连续型特征选择方法.该方法以区间数相似度为基础,定义每个特征的属性相似度,以此作为特征选择的启发信息,对特征全集进行排序,选择特征子集,实现特征选择.相关实验表明了该方法的有效性. 相似文献

6.

一种新型的文本无监督特征选择方法

何中市徐浙君《重庆大学学报(自然科学版)》2007,30(6):77-79,83

结合文档频数DF(Document Frequency)和特征相似度FS(Feature Similarity)方法,提出一种新的无监督特征选择方法DFFS.该方法利用文档频数过滤掉90%的特征之后,再借助特征相似度移除尽可能多的冗余特征.采用K-均值方法,对比DFFS方法与其他3种常用特征选择方法(DF,TC,TS)的聚类性能.实验一:当特征数量由6 000减少到1 047时,DF方法的聚类性能急剧下降,而DFFS方法则有提高,甚至当特征数量进一步减少到350时,DFFS方法也没有下降.实验二:在保持10%～2%的特征时,DFFS方法优于其他3种方法,特别是在只保留2%的特征时,DFFS方法的明显优于其他方法. 相似文献

7.

一种基于KNN算法的文本降维方法研究

李桂芳杨增良《山东师范大学学报(自然科学版)》2010,25(4)

针对文本向量空间中特征项间的关联性及冗余性,提出了一种KNN算法运用于文本向量空间降维的方法,应用向量聚合理论和特征选择以降低特征空间维数,使得降维后的特征项更具有类别代表性.实验证明,KNN算法运用于文本降维方法中,有效地降低了向量空间的维数,提高了文本分类的精度. 相似文献

8.

一种新的彩色图像特征检测中相似度计算方法

方欣《科学技术与工程》2006,6(20):3287-3290

现代数字图像处理技术中处理的大多是彩色图像。很多处理场合都需要直接实时地对彩色图像进行处理,这样就可以避免彩色图像灰度化过程中的细节损失,也有利于提高算法速度。在基于色彩分布的彩色图像特征检测过程中,需要对色彩空间进行颜色的量化,也需要对不同像素点的颜色值进行比较,并作出合适的相似性和异性计算。论述了一种新的色彩距离,计算方法,大大提高了彩色图像特征提取的准确率与速度。相似文献

9.

一种基于条件熵的特征选择算法 总被引：1，自引：0，他引：1

渠小洁《太原科技大学学报》2010,31(5)

特征选择是一种处理维数约简的有效方法。以条件熵为特征子集评价条件,采用随机搜索和启发式搜索相结合的搜索策略,设计了一种新的特征选择方法。该方法不仅能够求得经典启发式特征选择方法的选到特征子集,还可以得到一些与其不同的满足条件特征子集,同时在多数情况下可以减少时间消耗。实验研究表明了提出的算法的有效性。相似文献

10.

基于相似度加权的模糊聚类方法

刘丽华《云南师范大学学报(自然科学版)》2008,28(5)

模糊聚类分析主要用于研究样本的分类问题.在引入加权相似系数和加权距离系数的计算公式的基础上,提出了一种既能考虑到样本之间的值贴近程度,又能考虑到样本之间的形贴近程度的改进统计量-相似度,用相似度矩阵替代传统的相似矩阵,得到了模糊聚类分析方法的改进.实验结果表明改进的模糊聚类分析方法是有效的. 相似文献

11.

文本聚类中的特征选择方法

龚静曾建一《吉首大学学报(自然科学版)》2008,29(2):39-41

介绍了3种用于文本聚类的特征选择方法：文档频度、单词权、单词熵.用一个中文文本语料库对这3种特征选择方法进行了比较实验,实验结果表明在文本聚类中单词权的特征选择方法具有最好的选择结果. 相似文献

12.

基于特征选择和聚类的分类算法

郭凯文潘宏亮侯阿临《吉林大学学报(理学版)》2018,56(2):395-398

针对目前特征选择算法应用于数据分类精度不理想的问题, 提出一种基于最大相关最小冗余的特征选择算法, 该算法结合特征选择算法和聚类分析算法对特征进行处理, 将分类中冗余的特征去除. 利用支持向量机对一组心脏病患者实际测量得到的数据进行分类实验, 实验结果表明, 该方法可有效筛选影响分类的特征, 进而提高分类准确率. 相似文献

13.

基于ReliefF和聚类的特征选择方法及其在无线电信号识别中的应用

杜利敏陈河山徐扬裴峥《河南大学学报(自然科学版)》2014,44(3):347-350

无线电信号识别在无线电监测中占有重要地位,为了提高信号识别率,针对C波段信号特征数据的特点,提出一种基于ReliefF和聚类的特征选择方法.该算法首先用ReliefF算法去除与分类不相关的特征,再对余下的特征根据相关度强弱进行特征聚类,最后根据特征权重大小和相关度强弱删除冗余特征,选出代表性特征.实验结果表明,该算法有效地减少了数据维数,并且提高了信号识别率. 相似文献

14.

文本聚类中的特征降维方法研究

毛嘉莉《西华师范大学学报(哲学社会科学版)》2009,(4):365-368

文本聚类的关键是对高维的特征集进行降维．本文对常用的一些特征选择、特征抽取等主流特征降维方法进行了介绍,分析了它们各自的特点及其适用范围．相似文献

15.

采用机器学习的聚类模型特征选择方法比较

赵玮《华侨大学学报(自然科学版)》2017,(1):105-108

针对机器学习聚类模型在特征选择时存在的问题,首先,对特征选择在聚类模型中的适用性进行分析并对其进行调整和改进.然后,基于R语言中的递归特征消除(RFE)特征选择方法和Boruta特征选择方法进行特征选择算法设计.最后,应用聚类内部有效性指标,对在线品牌忠诚度聚类模型优化结果进行分析,进而对特征选择方法进行比较研究.结果表明:Boruta特征选择方法更具优势. 相似文献

16.

结肠压力数据的自组织聚类分析 总被引：8，自引：0，他引：8

迟冬祥颜国正王文兴林良明张根福史熠宋安《上海交通大学学报》2003,37(2):277-280

结肠测压对结肠运动障碍疾病，如慢传输型便秘（Slow Transit Constipation,STC）的诊断有较高的价值，但由于它是介入性检查，实施起来很不方便。为此，对实际采集的结肠压力信号进行特征提取，采用自组织特征映射的方法进行结肠压力信号的自聚类和识别。结果表明，这种方法可以区分正常与异常的结肠压力信号，与初始的医疗诊断相符合，可以作为判断肠道运动性能的辅助诊断手段，为根据结肠压力信号进一步识别肠道的动力性能、诊断STC奠定了基础。相似文献

17.

基于DF算法改进的文本聚类特征选择算法

樊东辉王治和陈建华许虎寅《甘肃联合大学学报(自然科学版)》2012,(1):51-54

通过研究文本特征选取中权重的计算问题,提出了一种利用特征词的熵函数加权的权值的计算方法,不但考察了特征词的文档频数,而且考察了它们在文档中出现的次数,使选出的特征子集更具有较好的代表性.实验表明,改进后的算法对聚类结果有了一定的改进. 相似文献

18.

Gen-Cluster:一个基因表达数据的高维聚类算法 总被引：1，自引：0，他引：1

熊贇邱伯仁张坤朱扬勇《复旦学报(自然科学版)》2008,47(2):135-146

基因表达数据聚类是分析基因之间共调控关系的重要手段.挖掘子空间中表达值存在差异但变化趋势保守的序列已成为基因表达数据聚类的主要研究内容之一.在N-同维趋势相似定义的基础上,提出了一个基因表达数据的高维聚类算法Gen-Cluster,将基因表达值转化为序列形式,采用无重复投影且无候选生成的序列模式挖掘策略自底向上挖掘N-同维趋势模式,并解决了OP-Cluster算法不能挖掘含有项集的序列模式问题,最终得到表达值变化趋势保守的基因序列形成的N-同维趋势簇.实验采用Breast Tumor和MicroRNA表达数据集,验证挖掘结果是有效的,且较OP-Cluster算法表现更高效率,并涵盖其结果. 相似文献

19.

基于粗糙集的高维分类型数据子空间聚类算法

孙浩军游俊斌吴廷发《汕头大学学报(自然科学版)》2012,(4):46-53

现有的优秀的聚类算法大多是处理低维数据的,但是对于高维数据,由于其分布特性与低维情形有很大的差异,这些算法失效.为解决高维分类型数据聚类问题,提出了一种基于粗糙集的高维分类型数据子空间聚类算法,基于粗糙集的上、下近似集的类边界描述,确定了类边界范围,然后采用相容度来调整类边界,聚类的过程采用增长子空间的思想,从低维到高维迭代地搜子空间类簇.最后通过在soybean、zoo数据集上的对比实验,实验结果表明了算法不仅可行,而且精度高. 相似文献

20.

特征选择方法中的信号分析方法研究 总被引：4，自引：1，他引：3

何劲松施泽生《中国科学技术大学学报》2001,31(1):74-78,56

特征选择是模式识别领域中最重要的环节,也是最根本的论题。论文从随机信号的傅立叶分析中自相关函数与谱密度函数之间的对应关系出发,提出了一种基于自相关函数的特征选择方法,并以实验方式进行了有效性验证。其研究意义还在于将这一特征选择方法与人工智能中的归纳学习方法相结合,其归纳性能比传统的熵最小化准则更为优越。相似文献