排序方式: 共有35条查询结果,搜索用时 46 毫秒
11.
偏标记学习是近几年提出的新机器学习框架,已有的逻辑回归偏标记算法尚不能解决数据不平衡问题.建立了一种可以解决数据不平衡的逻辑回归模型偏标记学习算法.基本思想是在多元逻辑回归模型中定义新的似然函数以达到处理不平衡数据的目的.算法先根据训练集中各个类别样本所占比例定义了一个新的似然函数,之后通过逼近和求导等数学手段推导得到了能够求解的光滑的逻辑回归偏标记学习模型.在UCI数据集和真实数据集上的仿真实验表明,所提算法在数据存在不平衡问题时提高了样本的平均分类精度. 相似文献
12.
抗菌肽是广泛存在于生物体内的一类具有广谱抗菌作用的天然多肽,因其不易导致细菌耐药性,已成为医药界开发新型抗菌制剂的主要选择,识别出更多的抗菌肽并预测其抗菌功能具有重要意义.提出了一种基于多标签直推学习的抗菌肽及其抗菌功能的预测方法,该方法利用K-spaced氨基酸对组成方法提取多肽特征,采用多标签学习框架和加权近邻图构建直推预测模型,通过对有标签训练样本和无标签待测样本的共同学习来提升预测性能.该方法不仅能够识别多肽是否为抗菌肽,还能同时预测出抗菌肽所具有的单种或多种抗菌功能,且适用于对多效抗菌肽和普通抗菌肽的预测.数值实验表明,与已有的iAMP-2L预测方法相比,所提方法在全局预测精度和多标签预测性能上均有较大提升. 相似文献
13.
一种新的蛋白质亚细胞定位预测训练集构造方法 总被引:1,自引:0,他引:1
设计了一种新的蛋白质亚细胞定位预测训练集构造方法.该方法针对传统预测方法缺乏足够的实验标记数据的问题,基于主动学习策略从非实验标记蛋白质数据中主动选择有效数据,并与原有的实验标记数据共同训练预测模型,以提高基准分类器的预测精度.结合支持向量机分类器,该方法在病毒蛋白质独立测试集上进行了预测实验,测试结果表明,该方法能够有效地提高基准分类器的预测能力,性能优于现有的病毒蛋白质预测系统. 相似文献
14.
提出了基于新的目标函数的模糊聚类建模方法.改进的模糊聚类方法把模糊模型结构辨识和参数辨识融为一体.首先,通过新的目标函数的最小化确定模糊模型的输入空间,即确定模糊规则和规则数、参数.然后对经模糊聚类得到的模糊前件推理矩阵进行QR分解,通过分析秩亏损确定重要的聚类规则.为了证明这种建模方法的性能,对非线性系统进行了仿真建模研究,仿真结果证明所提出方法是一种有效的、精确的模糊建模方法. 相似文献
15.
全基因组选择是一种用于改良动植物育种群体中数量性状的方法,通过使用覆盖整个基因组的分子标记信息对复杂性状进行预测,从而帮助筛选出更适合培育的亲本.基于长牡蛎的单核苷酸多态性(SNP)位点信息,提出了一种预测长牡蛎肥满度分布参数的全基因组选择的新方法.首先,采用一种基于不同评价准则的二次特征选择方法,挑选与肥满度相关性较高的SNP位点;其次,利用所挑选的SNP位点信息构建具有正则化项的高斯通用加性模型对每个长牡蛎样本肥满度分布参数进行预测;最后,在长牡蛎数据上将所提方法和一些现有方法进行了验证比较.实验结果表明,所提方法具有更好的拟合精度和更低的均方误差,并能对样本性状稳定性进行有效的评估. 相似文献
16.
组蛋白修饰是生物体中普遍存在的一种现象,能够以不同的调控方式影响基因表达,且随着高通量测序技术的飞速发展,大量的测序数据使得探究组蛋白修饰信号与基因表达水平之间的内在联系成为可能.由于基因表达数据存在零膨胀现象,提出了一种基于广义线性模型框架的主从模型,能够以较高精度从组蛋白修饰信号预测基因表达水平.首先通过人类全基因组注释文件中的基因位点信息,筛选出包含完整基因位点信息的表达数据;其次,根据基因位点信息,定位并提取出组蛋白修饰数据中基因特定位点的特征信息,构建设计矩阵;最后结合响应变量数据零膨胀的特点,构建主从模型,以GM12878细胞系为例,与现有的多种回归算法进行对比,验证了所提模型的有效性. 相似文献
17.
准确获取交通流量变化点,对后续的交通流预测、分类及多时段控制具有重要意义.鉴于交通流时间序列的非负性及异方差性,采用Gamma分布拟合交通流时间序列,并对其进行有效分割.针对多元交通流时间序列,首先利用非负主成分分析方法实现降维并提取特征序列,之后利用最大似然估计得到Gamma分布参数,通过不同参数的Gamma分布拟合特征序列的不同片段,并由赤池信息准则(AIC)确定最优分割边界及分割阶数.实验结果表明,所建立的分割模型能够反映不同时段的交通流变化,与现有分割方法相比,取得了更好的分割结果. 相似文献
18.
实时多媒体网络中,带延迟与延迟抖动约束的斯坦利树问题是一个研究热点.这种带约束的斯坦利树被证明是NP-完全问题.提出了一种基于禁忌搜索的带延迟与延迟抖动约束最小代价组播路由算法.实验结果表明,该算法对于实际网络是有效的.这种方法使得IP组播把数据同时发送到组成员时有效地利用了网络资源.Abstract: The delay and delay variation-bounded Steiner tree problem is animportant multicast routing issue in real-time multimedia networks.Such a constrained Steiner tree problem is known to be NP-complete.A multicast routing algorithm is presented,which is based on tabu search to produce routing trees having a minimal network cost under delay and delay variation constraints.The approach makes IP multicast utilize resources efficiently in delivering data to a group of members simultaneously. 相似文献
19.
实际系统中通过采样得到的数据的噪声、干扰和变量之间耦合等不确定因素,使得描述系统的模糊关系矩阵列间可能存在严重的相关性.为了解决输入空间重构的模糊建模问题,提出利用目标函数确定非线性系统的结构和参数,实现对模糊模型结构简化,删除冗余规则.结构确定过程中采用了UD矩阵分解方法,大大降低了计算量.最后,证明了算法的收敛性,仿真结果表明了方法的有效性. 相似文献
20.
针对不完整基因表达数据的聚类问题,提出了一种多目标NSGA-Ⅱ框架下缺失值填补与聚类协同优化的算法.算法根据欧式距离确定不完整基因的近邻基因,以缺失值的最近邻区间为约束,采用混合编码将缺失值填补与聚类中心优化融入NSGA-Ⅱ进化过程,通过将数据集的统计信息与聚类结果共同作为缺失值填补因素,提升不完整基因表达数据的填补准确度及聚类性能.在多个基因表达数据集上的实验结果表明,所提算法得到了更接近真实表达值的填补结果及更紧凑的聚类效果,且聚类结果具有统计显著性. 相似文献