共查询到20条相似文献,搜索用时 484 毫秒
1.
针对文本特征选择中原始特征空间维数过高,提出一种基于类别相关性及遗传算法的文本特征选择方法.有效地降低了特征空间的维数,提高了分类准确率.实验验证了该方法的有效性. 相似文献
2.
多标签特征选择能够有效去除冗余特征并提升分类精度, 是解决"维数灾难"问题的有效方法. 然而, 已有的多标签特征选择算法是对所有标签选择出相同的特征, 忽略了标签与特征之间的内在联系. 事实上, 每个标签都具有反映该标签特有属性的特征, 即类属特征. 提出一种基于图拉普拉斯的多标签类属特征选择(multi-label label-specific feature selection based on graph Laplacian, LSGL)算法. 对于每个类别标签, 基于拉普拉斯映射获得数据的低维嵌入, 再通过稀疏正则化获得数据空间到嵌入空间的投影矩阵, 接着通过分析矩阵系数确定每个标签相应的类属特征, 最后使用类属特征进行分类. 在 5 个公共多标签数据集上的多标签特征选择与分类实验结果证明了所提算法的有效性. 相似文献
3.
多标签特征选择能够有效去除冗余特征并提升分类精度,是解决“维数灾难”问题的有效方法.然而,已有的多标签特征选择算法是对所有标签选择出相同的特征,忽略了标签与特征之间的内在联系.事实上,每个标签都具有反映该标签特有属性的特征,即类属特征.提出一种基于图拉普拉斯的多标签类属特征选择(multi-label label-specific feature selection based on graph Laplacian,LSGL)算法.对于每个类别标签,基于拉普拉斯映射获得数据的低维嵌入,再通过稀疏正则化获得数据空间到嵌入空间的投影矩阵,接着通过分析矩阵系数确定每个标签相应的类属特征,最后使用类属特征进行分类.在5个公共多标签数据集上的多标签特征选择与分类实验结果证明了所提算法的有效性. 相似文献
4.
正常生长的异养生物膜密度D随生物膜厚度d增加而变化,D与d之间具有双自然对数拟和关系,可以lnd=DflnD lnm或d=m·D-Df来表示;d=m·D-Df表征了异养生物膜密度的空间变化具有分形特征,其分维数可用豪斯道夫维数表示,豪斯道夫维数Df值的变化反映了生物膜的密度分布特征及生物膜系统演化特征. 相似文献
5.
6.
为了解岩石损伤变形破坏过程中产生的声发射信号的级频维数特征,利用先进的MTS815岩石力学性能试验系统和PAC的DISP-II声发射仪,对大理岩试样进行了常温下力学性能的实验研究和理论分析,系统地分析了岩石变形破坏过程中的声发射特征及其力学机制.研究结果表明:在同一应力水平下,随着嵌入空间维数m值增大,声发射过程的关联维数也相应增加,而自相似程度随着m值的增大而减弱;级频分形维数随着岩样所受应力的增加呈降低的趋势,试件破坏时级频分形维数达到某一最小值,这体现了岩样破坏前损伤局部化特征. 相似文献
7.
8.
针对文本向量空间中特征项间的关联性及冗余性,提出了一种KNN算法运用于文本向量空间降维的方法,应用向量聚合理论和特征选择以降低特征空间维数,使得降维后的特征项更具有类别代表性.实验证明,KNN算法运用于文本降维方法中,有效地降低了向量空间的维数,提高了文本分类的精度. 相似文献
9.
基于人工鱼群算法的储粮害虫特征选择 总被引:2,自引:1,他引:1
储粮害虫特征选择是粮虫图像识别中的一个核心问题.提出基于人工鱼群算法的特征选择,并给出了基于二进制编码寻优的实现方法.以交叉验证训练模型的识别率作为特征子集的性能评价准则,将人工鱼群算法应用于粮虫的特征选择.该算法从粮虫的17维形态学特征中自动选择出面积、周长等7个特征所组成的最优特征子集,采用参数优化之后的SVM分类器对90个粮虫样本进行分类,识别率达到95.5%以上,并与PCA法、GA法和原始特征法进行对比,结果表明人工鱼群算法降低了特征空间的维数,提高了分类器的识别率,证实了基于人工鱼群算法的粮虫特征选择是可行的. 相似文献
10.
多标记学习的嵌入式特征选择 总被引:2,自引:0,他引:2
维数约减是数据挖掘领域的关键技术.传统的降维方法主要解决单标记学习问题.由于多标记学习问题的复杂性,多标记降维方法很少.直接应用未监督的降维方法到多标记学习中,忽略了类标信息.而通过分解多标记问题为单标记问题,应用现有的有监督降维方法到多标记学习中,忽略了类标间的关系.现有的多标记有监督的降维方法是基于依赖最大化的维数约简(multi-label dimensionalityreduction via depen dence maximization,MDDM),它是一种特征抽取的方法.目前还没有多标记的特征选择方法.因为在多标记学习中如何评估特征,是一个很有挑战性的问题.本文提出一个嵌入式的特征选择方法MEFS(multi-label embedded feature selection),其中采用预报风险准则作为特征的评价准则.在公开评测的yahoo网页分类数据集上进行了两个实验:(1)分析多标记学习的性能指标对特征评估的影响;(2)比较MEFS与MDDM,PCA(主成份分析),LPP(局部保留投影)的降维效果,实验显示MEFS的性能优于新近提出的MDDM等一些流行的多标记降维方法. 相似文献
11.
针对基于颜色特征的图像检索中的图像特征降维问题,提出了自适应局部保持映射(ALPP:Adaptive Locality Preserving Projection)的图像特征降维算法.在考虑了每个特征向量与其近邻关系的基础上,通过研究贝叶斯准则在图像分类中的作用,将聚类引入降维算法中,解决特征空间维数的自适应确定问题.使降维结果既保证了最大化地消除高维向量间的相关性和冗余度,又不破坏原始数据近邻间的拓扑结构.实验结果表明,对Coral图像库,应用HSV直方图特征,在查询返回图像为50幅的情况下,基于ALPP算法图像检索的查准率为67.7%,查全率为57.3%.相对PCA(Principal Component Analysis)算法的查准率(45.8%)和查全率(49.2%),具有较高的检索精度. 相似文献
12.
基于分形理论的吉林省城市体系空间结构特征研究 总被引:2,自引:1,他引:1
运用分形理论,对吉林省城市体系空间结构进行了定量分析;通过计算空间聚集维数和空间关联维数,分析了其空间结构特征.在上述分析的基础上对城市体系优化提出了几点建议. 相似文献
13.
14.
利用多时间尺度(Δt=1,2,3,6月)对福州市区近60 a来降雨序列进行混沌分析,以相空间重构、相空间嵌入维数m、饱和关联维数D2、饱和关联维数D2与相空间嵌入维数m的比值和最大Lyapunov指数λ等参数揭示了福州市区降雨序列的混沌特征.结果表明:各种时间尺度的相空间重构m都为8、饱和关联维数D2分别为3.19,3.24,3.15和3.13,D2/m分别为0.400,0.405,0.394和0.391,最大Lyapunov数λ分别为0.33,0.50,0.34和0.25,体现了各种时间尺度下福州市降雨量存在着混沌现象;通过对比分析,得出以Δt=6时的时间尺度分析降雨序列的混沌特征较好. 相似文献
15.
16.
阐述了样本维数与样本量成比例趋于无穷时,大维随机矩阵特征向量子空间的极限特征.指出当随机矩阵列的谱具有谱分离的特征时,其特征向量子空间具有一定的渐进特征. 相似文献
17.
设M是n维完全交复流形,E是M上的一个丰富线丛.证明了如果E的整体截面空间的维数为n+1,那么M同构于n维射影空间. 相似文献
18.
何伟 《淮阴师范学院学报(自然科学版)》2005,4(2):163-167
用分形理论研究了江苏省淮安、宿迁两市的城镇体系空间分布特征.容量维数和信息维数表明:两市的县级及县级以上的城镇空间分布是分形的,但城镇空间分布演化受到一些无序因素的较大干扰,城镇空间分布处于分形变化之中. 相似文献
19.
为解决小样本回归时引起的过学习问题并提高回归精度,提出一种基于非线性空间特征选择的支持向量机.该方法依据矩阵相似度量或从研究的实际问题出发,绕过核技巧,直接将原始输入空间映射为适宜的非线性空间.该方法运用遗传算法在维数较多的非线性空间中搜索对输出影响最大的一些特征,达到降低输入空间维数的目的,从而避免过学习问题,并可获得简明的非线性回归函数. 相似文献
20.
汪杏枝 《湖北师范学院学报(自然科学版)》2006,26(4):19-20
在线性空间V中,对于一些真子空间的并集合M来说,一定存在着V的非零子空间V0使得M∩V0={0},并且这些V0的最大维数可确定。 相似文献