首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
一种用于乳腺癌诊断的免疫分类算法   总被引:3,自引:0,他引:3  
基于人工免疫识别系统AIRS(Artificial immune recognition system)和核函数提出免疫分类算法Kernel-AIRS。Kernel-AIRS遵循AIRS算法框架,利用核函数将输入空间投影到高维核空间,以核空间距离来度量抗体?抗原的亲和度,提高算法对非线性可分问题的分类准确率。采用Kernel-AIRS定义核空间距离测量方法和规一化方法,分析抗体刺激度和核函数参数与分类准确率之间的关系,研究属性缺失样本对算法分类准确率的影响,并应用Kernel-AIRS算法诊断乳腺癌,分类准确率采用10次交叉验证评价。研究结果表明:Kernel-AIRS算法对排除属性缺失样本数据集分类的准确率为97.3%,对包含属性缺失样本数据集分类的准确率为96.9%,分类准确率较高,适用于乳腺癌的诊断。  相似文献   

2.
为了减少基于矩阵核范数极小化(NNM)的矩阵填充模型和原始矩阵的秩极小化(RM)矩阵填充模型之间的偏差,提出了一种新的非凸矩阵填充模型。相对于核范数,其能够更好地逼近原始的秩极小化问题。此外,考虑到非凸模型的优化困难,文中结合增广拉格朗日法和迭代重赋权重法去求解提出的矩阵填充模型。为了验证算法的有效性,在人工数据集上进行了大量实验,并将其应用于图像修复这一重要的计算机视觉领域。实验结果表明,提出的算法能够处理不同类型的缺失图像,且其恢复精度明显高于现有的矩阵填充模型。  相似文献   

3.
杨程  颜海泉  董正方 《科学技术与工程》2023,23(25):10910-10917
钢筋混凝土(RC)柱在地震力的作用下会发生不同的破坏模式,不同的破坏模式会有不同的损伤特点。所以,有必要针对不同地震破坏模式提出有效的判别方法。首先基于SMOTE算法使数据样本达到均衡,其次根据ENN算法,筛选了判别弯曲破坏和非弯曲破坏、弯剪破坏和剪切破坏的最佳参数;再次通过TomekLinks算法合理剔除噪音样本重构均衡数据,最后基于kNN算法建立了两阶段kNN模型,达到了准确判别RC柱地震破坏模式的目的,并通过与传统kNN模型、传统经验方法进行对比分析,验证了模型的优异性。研究结果表明:该方法通过选取筛选最佳参数,在提高判别准确率的同时简化了传统机器学习判别模型;本模型提出的两阶段kNN模型对三种破坏模式的判别准确率均可达90%以上,比传统kNN模型高10%左右,比传统经验判别方法高20%左右。  相似文献   

4.
针对中医临床在对有病个体分类时获得的数据很可能是不均衡的、缺失的,而且这种数据往往偏向于无病的个体这一问题,采用病例匹配最近邻填充算法(P-KNN算法)填充缺失值,同时使用基于风险预报准则特征选择的非对称Bagging(PRIFEAB)算法处理睡眠情绪类疾病的不均衡数据和特征选择问题。在中医临床采集的经络电阻数据上的实验结果显示,PRIFEAB算法改善了曲线下面积,并且选择的特征也符合中医学相关理论,同时P-KNN算法比平均值填充算法具有更好的性能。  相似文献   

5.
QENNI:一种缺失值填充的新方法   总被引:1,自引:0,他引:1  
针对k最近邻填充算法(kNNI)在缺失数据的k个最近邻的选择上可能存在偏好,提出一种新的缺失填充算法:象限近邻填充算法QENNI(quadrant-encapsidated-nearest-neighbor-based imputation),它仅仅使用缺失数据象限方向的最近邻数据填充该缺失值,避免了kNNI中选取的k个最近邻点有偏好这一情况。另外,此算法对于低维数据集可以是无参的,即消除了对参数的依赖。实验结果表明,QENNI算法的填充准确性要优于kNNI算法。  相似文献   

6.
针对现有云计算加密数据库分类算法的高时间开销问题,提出一种安全有效的基于Yao式乱码电路云计算隐私保护的kNN分类算法,该方法既能保护数据隐私和查询隐私,又能隐藏数据访问模式,同时又能保证高效查询处理的工作。该算法由4部分组成:加密kd树搜索阶段、kNN检索阶段、结果验证阶段和多数类选择阶段。通过加密索引搜索方案来过滤与查询无关的数据,隐藏了最终的类标签和数据访问模式,提高云计算中数据查询处理的效率。通过Yao式乱码电路来支持有效的kNN分类,保护云计算中数据隐私和查询隐私,同时减少了kNN分类的时间开销。对Yao式乱码电路kNN分类方法的安全性进行了分析。实验结果表明,在分类时间方面,所提算法的性能优于现有PPkNN方法和SkNNCI方法。  相似文献   

7.
层次聚类算法是运行复杂度较高的聚类算法,基于不相似性测度的层次聚类算法不适合稀疏高维数据.结合核函数特点,提出了一种基于核函数的层次聚类算法.利用该算法,对稀疏高维数据进行了层次聚类对比,实验结果表明,该算法提高了层次聚类的准确率.  相似文献   

8.
主流句子分类算法采用单一词向量表示模型获得文本表示,导致了对文本的映射能力不足.对此,通过融合多种词向量的文本表示以提高分类的准确率.针对多核学习在融合不同核函数时,常规的核函数系数寻优方法存在的训练时间长、难以求得局部最优解等问题,提出了一种新的核函数系数寻优方法,该方法基于参数空间分割与广度优先搜索不断逼近核系数的最优值.以支持向量机(support vector machine,SVM)为分类器,在7个文本数据集上进行了分类实验.实验结果表明,多核学习分类效果明显优于单核学习,并且所提出的寻优方法在训练次数少于常规方法时也能获得了好的分类效果.  相似文献   

9.
提出一种基于语义核函数的问题分类算法,该算法基于问题的语法结构构建支持向量机(SVM)核函数.首先,将给定的问题解析为语法树结构,用语法树的子树表示该问题;然后,从词法、语法、语义三个层面提取问题的特征,构成更加丰富的特征空间;接着,基于问题的语法树构建核函数;最后,使用潜在语义索引方法并结合问题的词法、语法以及语义特征,通过语义核函数将特征空间映射到更有效的空间中进行问题分类.TREC数据集上的实验结果表明,通过词法、语法以及语义增强的问题特征空间可以提高分类准确率.  相似文献   

10.
不完备数据聚类是聚类分析中的一个重要问题.现有的不完备数据聚类算法对缺失值仅填充一次进行聚类,没有充分利用数据的已知信息,致使填充效果不佳,影响了聚类的有效性.文章提出了一种基于动态填充的不完备数据聚类算法.首先利用均值填充法对缺失数据进行初始完备化,然后利用K-means算法对填充后的数据集进行聚类,同时用含缺失值对象所在类的类中心的相应属性值对其再次填充,直到聚类结果不再变化时停止.该算法在多个UCI数据集上进行了实验验证,结果表明算法是有效的.  相似文献   

11.
基于投影寻踪的kNN文本分类算法的加速策略   总被引:1,自引:1,他引:0  
传统的k近邻(k-nearest neighbors,kNN)文本分类中,由于文本被表示成向量空间模型后维数非常高,且训练文本的数目巨大,kNN分类算法通常被视为是一种虽然有效,但并非高效的文本分类算法。针对传统kNN分类算法效率低下的问题,提出了一种基于投影寻踪思想的kNN分类算法加速策略。基本思想是:通过投影的方法缩减训练集的规模,同时在寻找k近邻过程中对文本进行降维处理,从两方面着手降低算法的计算开销。实验数据表明,优化后的kNN算法比传统kNN算法在时间性能上有较大的提升,同时保证了分类的精度。  相似文献   

12.
冷泳林  张清辰  鲁富宇 《河南科学》2014,(11):2259-2262
数据采集过程中存在大量缺失数据,即不完整数据.传统方法在聚类不完整数据时采用填充或丢弃缺失数据方式实现数据的聚类.依据不完整信息系统理论提出一种基于K-means的不完整数据聚类算法,算法首先将数据集划分成完整数据集和非完整数据集两部分,对完整数据集采用K-means算法进行聚类,然后将不完整数据依据设计的相似度度量方法划分到对应的簇中,实现数据集的聚类.实验结果表明,提出的方法能够高效、精确地实现不完整数据聚类.  相似文献   

13.
针对目前缺失数据填充算法精度低、运行效率低、内存占用率大的特点,提出一种新的不同类别非完整大数据中缺失数据填充算法。通过2个定理阐述了缺失数据填充算法的原理,给出信息熵的计算过程。输入根据数据集构建的决策表和不同类别非完整大数据中缺失数据的最大值、最小值、填充步长。求出其他类指标和某类指标的相关性,得到数据集,求出权重系数;计算初始数据库的信息熵,通过相关理论或经验对缺失数据区间下限进行设定;用一个很小的区间数据取代缺失数据,根据给出的步长不断扩大区间范围,绘制出每一步信息熵状况,将其与初始数据库信息熵相比,实现缺失数据填充。实验结果表明,所提算法精度高、运行效率高、内存占用率低。  相似文献   

14.
针对数据分类交叉空间易错分问题,提出一种基于加权特征子空间的支持向量机核函数方法。该方法利用加权特征子空间与稀疏表达等相关理论进行支持向量机核函数优化,首先利特征子空间重叠率与数据的信息熵对数据特征进行加权,再通过对L_1范数正则项的加权处理调节异类数据间的稀疏性和同类数据间的稠密性;最后对处理好的数据进行分类测试。仿真实验表明该算法能够在一定程度上提升分类效果,以达到优化核函数的目的。  相似文献   

15.
提出了一种基于中文关键字符串核函数的分类算法,并在农业文本上进行了分类性能测试.实验结果表明,与传统的中文分类算法相比,基于中文关键字符串核函数的分类算法准确率更高.  相似文献   

16.
针对目前缺失数据填充算法精度低、运行效率低、内存占用率大的特点,提出一种新的不同类别非完整大数据中缺失数据填充算法。通过2个定理阐述了缺失数据填充算法的原理,给出信息熵的计算过程。输入根据数据集构建的决策表和不同类别非完整大数据中缺失数据的最大值、最小值、填充步长。求出其他类指标和某类指标的相关性,得到数据集,求出权重系数;计算初始数据库的信息熵,通过相关理论或经验对缺失数据区间下限进行设定;用一个很小的区间数据取代缺失数据,根据给出的步长不断扩大区间范围,绘制出每一步信息熵状况,将其与初始数据库信息熵相比,实现缺失数据填充。实验结果表明,所提算法精度高、运行效率高、内存占用率低。  相似文献   

17.
针对评估数据缺失的问题,提出了一种新的缺失数据填充方法.从信息熵的角度对评估系统进行描述,并提出一种建立在区间值信息系统上的加权广义信息熵,对这种信息熵的非负性、单调性和极值性进行证明.在此基础上,通过研究评估系统数据缺失前后信息熵的变化情况,建立一种基于加权广义信息熵的缺失数据填充方法,并从知识粒度的角度论述加权广义信息熵的机制.通过实例分析与现有的部分算法进行比较,进一步证明文中算法对评估系统缺失数据填充的有效性.  相似文献   

18.
为了提高地震数据的重构效果,提出了一种基于非下采样Contourlet变换(NSCT)自适应阈值的插值方法。该算法对缺失地震数据进行变换,并利用NSCT变换系数计算N次迭代对应的阈值。每次迭代时自适应选取阈值对各方向各尺度的NSCT系数进行处理,利用未缺失地震数据填充到反变换后的缺失地震数据中,完成缺失地震数据的重构。实验结果表明,利用NSCT变换的平移不变性和自适应阈值处理,对均匀丢失和随机丢失的地震数据进行插值重构,能得到更好的插值效果。  相似文献   

19.
针对低信噪比条件下非平稳、非线性和非高斯信号的时频特征分析,提出了一种基于自适应最优抛物线核函数的Wigner-212维时频表示算法.采用依赖于特定时频点的二维时频局部模糊函数替代传统Cohen类高阶时频分析中通用的全局时频模糊函数;利用自适应核处理技术获得局部模糊函数的最佳抛物线核函数,以最大限度地抑制交叉项的影响,提高算法的时频分辨率和信号自适应性;通过合成信号和水声信号的仿真实验进行时频分析,并与现有时频算法加以对比.结果表明,在低信噪比条件下,所提出算法对瞬态信号的检测优势明显,能够取得优良的时频特征解析效果.  相似文献   

20.
低秩表示算法,如低秩表示(Low-Rank Representation, LRR),鲁棒核低秩表示(Robust Kernel Low-Rank Representation, LRRRKLRR),在处理高维数据方面展现了广阔的应用前景,然而这些方法并不适合高阶数据,传统的低秩表示算法通常只对数据的某一特征属性进行降维。在本文中,我们提出了基于张量分解的鲁棒核低秩表示算法(Kernel Low-Rank Representation by Robust Tensor Decomposition, RTDKLRR),该算法能够处理高阶非线性的张量数据,对噪声更加鲁棒。本文首先对RTDKLRR算法设计目标函数并给出约束条件,其次,设计迭代规则对目标函数进行优化。在合成数据集和真实数据集上的实验结果表明,我们的算法优于同类算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号