首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
刘国平  姚莉秀  杨杰  王猛 《上海交通大学学报》2005,39(10):1676-1679,1684
针对膜蛋白类型预测中普遍存在的不平衡样本问题,分析一般支持向量机(SVM)在处理不平衡样本时的缺陷,引入加权SVM来补偿由于训练集中的类别差异引起的分类结果偏向于多样本类别的问题.采用统计预测中的一致测试、交叉校验和独立测试方法进行测试.实验表明,不平衡处理后的效果非常理想,该方法可以成为现有方法一个有效的补充分析工具.  相似文献   

2.
利用统计学习理论中的支持向量机(SVM),基于氨基酸组分含量预测生物膜蛋白类型。使用文献中2059个训练集和2625个检验集膜蛋白序列数据,运用统计预测中的校准检验,留一法交叉检验和独立数据集检验方法进行分类预测。结果表明,SVM对膜蛋白类型预测具有明显的优越性,该算法对当前已有方法起到重要的补充作用。  相似文献   

3.
关键蛋白质的识别有助于了解细胞存活的基本需求,并为疾病治疗找到新方法,但是蛋白质自身携带着复杂的生物特性,仅依赖网络拓扑特性不能精准地判断其关键性.因此,提出一种新方法来提高识别关键蛋白质的准确率.首先,考虑网络拓扑特性以及蛋白质在不同亚细胞中的重要程度,定义了SNC方法;其次,利用蛋白质在亚细胞与复合物信息中的特性定义了SIDC方法;最后,通过融合网络拓扑结构和多源生物信息,提出了关键蛋白质识别算法CTB.在YDIP、YMIPS和Krogan数据集上利用精准率-查全率等多种评估方法进行实验,结果表明CTB算法提高了识别关键蛋白质的性能.  相似文献   

4.
故障诊断对电力系统的稳定运行至关重要。当配电网的拓扑结构发生较大变化时,难以获取大量带有标签的暂态数据,导致传统的故障预测模型精度难以提高。针对此问题,提出一种将特征迁移和深度学习相结合的配电网故障诊断新方法。首先,采集配电网不同线路的零序电流构造故障特征集;其次,引入加权半监督迁移成分分析(semi-supervised transfer component analysis, SSTCA)方法,利用混合核函数将不同拓扑结构下的特征样本映射到同一特征空间中,缩小数据间的分布差异性;最后,将映射后的源域样本输入卷积神经网络中进行分类训练,并测试映射后的目标域样本。通过Simulink仿真表明,在改变配电网拓扑结构的新场景下,所提的特征迁移方法与其他方法相比,对目标域故障定位精度最高,达到98%以上。  相似文献   

5.
王强  陈浩  刘炼 《科学技术与工程》2022,22(4):1456-1464
随着大规模新能源并网以及新装置的不断应用,电力系统暂态稳定问题日益复杂,为进一步提升暂态稳定评估(transient stability assessment, TSA)的精确性和可靠性,提出一种基于多层CatBoost的TSA方法。首先,以电力系统故障前的稳态运行变量作为输入特征,采用一种最大相关最小冗余(maximal relevance minial redundancy, mRMR)集成方案,从输入特征中筛选出多组不同的关键特征集。然后,利用这些关键特征分别单独训练多个CatBoost模型,建立多个CatBoost驱动的TSA模型,并结合多个训练好的CatBoost模型构建TSA综合模型。在暂态稳定分析时,综合多个CatBoost模型的分析,通过多数投票表决方式判定最终评估结果。最后,在IEEE 39节点系统和某省级电力系统上进行性能测试实验。测试结果表明:所提出的TSA综合模型不仅具有极高的预测精度,而且拥有良好的泛化能力和鲁棒性。  相似文献   

6.
Protein homo-oligomers play an important role in various vital activities. Successful prediction of protein homo-oligomers directly from primary sequence is very beneficial to understand their protein function. In this paper, a total of 14 238 homo-oligomeric protein sequences are predicted by IB1 algorithm. 10-fold cross-validation test is applied to test the predictive capability of the proposed method. The predictive results show that overall prediction accuracy is 90.46%, which is at least 9% higher than that of previous results; furthermore,the sensitivity and Matthew’s correlation coefficient for each class of homo-oligomers are also improved significantly. The results show that IB1 algorithm is effective and feasible,and very suitable for predicting protein homo-oligomer types.  相似文献   

7.
G von Heijne 《Nature》1989,341(6241):456-458
Positively charged amino acids have been shown to be important elements in targeting-peptides that direct proteins into mitochondria, nuclei, and the secretory pathways of both prokaryotic and eukaryotic cells. The 'positive-inside' rule, which observes that regions of polytopic (multi-spanning) membrane proteins facing the cytoplasm are generally enriched in arginyl and lysyl residues whereas translocated regions are largely devoid of these residues, implies that the distribution of positively charged amino acids may also be a major determinant of the transmembrane topology of integral membrane proteins. If this is indeed the case, it should be possible to predictably alter the topology of a polytopic protein by site-directed insertions and/or deletions of positively charged residues in critical locations. I now describe a derivative of Escherichia coli leader peptidase, a polytopic inner-membrane protein, that switches from sec-gene-dependent membrane insertion with a Nout-Cout transmembrane topology to sec-gene-independent insertion with a Nin-Cin topology in response to the addition of four positively charged lysines to its N terminus.  相似文献   

8.
相关疾病基因的发现和预测是人类基因组研究的重要目标.近些年,一些研究者通过基于网络结构的方法来解决这个难题.然而,大多数方法在推理过程中仅使用了局部的网络信息,并且仅限于推理单一基因的关联.并且这些方法很少考虑到疾病-基因关联网络的网络拓扑性.笔者提出一种改进的基于二部图网络结构推理(improved network-based inference)的计算方法.该方法基于已知的疾病-基因网络拓扑相似性来发现更多潜在致病基因.文中使用的是OMIM数据库中的203种疾病的数据,通过留一交叉验证法验证实验,并获得了88.9%的AUC值.与文中提到的另外两种方法相比,该文方法能够有效地预测潜在致病基因.  相似文献   

9.
物流网络较为复杂,当前预测方法只采用一种方法对物流网络中多地区配送需求进行预测,无法保证预测精度。提出一种新的需求预测方法, 通过两个或两个以上不一样的预测方法,对物流网络中多地区配送需求进行预测,构建物流网络中多地区配送需求组合预测模型,对不同方法进行加权组合,通过熵值法对组合预测模型的组合权重进行计算,充分利用不同预测方法的优点,获取较优的预测结果。通过残差检验和后验差检验,对组合预测模型的配送需求预测能力进行评价。实验结果表明,所提方法具有很高的预测精度。  相似文献   

10.
地震破坏预测研究对于建筑结构减灾规划、震前风险预测、震后应急评估有着重要意义。传统的方法因为受到震害资料数量的限制以及计算精度和能力的制约,一般基于经验只考虑少数因素对结构破坏的影响。通过使用随机森林算法,设计了一个综合考虑地震动、结构和场地等多维度信息的分类方法,用以预测建筑物的地震破坏程度。本文研究框架基于新西兰国家地震委员会所收集的27次地震详细破坏资料,处理得到14.2万条高质量建筑物损失数据,考虑了谱加速度、建筑形状、层数等16个影响因素,将4种不同的损伤状态作为模型的学习标签进行地震破坏预测训练。结果表明,随机森林算法在6种分类算法中性能最佳,经过学习曲线法调参、代价敏感学习之后,经过优化得到的随机森林模型对于测试集的整体预测精确率可以达到75.4%,对4种损伤标签的召回率分别达到了88.2%、55.0%、60.7%和70.8%,远好于其他方法。当只考虑对结果影响最重要的前12个因素,该模型的预测精度仍然能够达到73.7%。可见,基于此框架所训练的预测模型具有良好的精度与适用性,同时该框架对于中国震害资料大数据库的研究具有较高的参考价值。  相似文献   

11.
【目的】蛋白质自由能不仅能准确地反应蛋白质的交互,而且对药物设计有巨大帮助。因此,选择建立精确的蛋白质自由能回归模型是非常有必要的。【方法】收集135对蛋白质复合物并计算600个特征,通过最小冗余最大相关(mRMR)选择与蛋白质自由能显著相关的特征并去除冗余特征,从而得到最小冗余最大相关的特征集,用筛选后的特征建立6种回归模型,并对选择后的特征进行移除对比分析特征的重要性;最后通过10折交叉验证对比得到最佳模型,预测蛋白质自由能。【结果】相对于其它方法,本研究所建立的模型在预测135对蛋白质复合物的性能,相对于其它方法有着较高的相关系数和较低平均绝对误差。【结论】本实验所用方法比其他方法选出的模型有更好的预测精度。  相似文献   

12.
结合P2P网贷平台的特点,融合Logistic回归和Tabnet模型,提出一种P2P网贷违约预测方法。采集人人贷平台借贷数据,并对数据进行清洗与加工预处理;通过信息价值法和相关性分析,对众多解释变量进行筛选,以借款状态作为因变量,采用Tabnet神经网络进行训练,根据训练得到的特征重要性选择关键的解释变量;将Tabnet神经网络预测结果作为新的训练数据集,构建Logistic回归模型;将人人贷数据集输入Logistic回归学习与训练,以训练好的Logistic回归用于网贷违约预测。实验结果表明,Tabnet模型的网贷违约平均预测准确率和精确率分别为9958%、9547%,Logistic回归的平均准确率和精确率分别为9872%、9221%,而融合模型的平均准确率和精确率分别为9960%、9672%;在3个测试集上的准确率标准差分别为0001 4、0000 6、0000 5,精确率标准差分别为0034 4、0013 3、0013 2。表明融合Logistic回归与Tabnet的网贷违约预测方法具有Logistic回归模型的可解释性与稳定性,可提高单一模型的预测精确度。  相似文献   

13.
About 20%-30% of genome products have been predicted as membrane proteins, which have significant biological functions. The prediction of the amount and position for the transmembrane protein helical segments (TMHs) is the hot spot in bioinformatics. In this paper, a new approach, maximum spectrum of continuous wavelet transform (MSCWT), is proposed to predict TMHs. The predictions for eight SARS-CoV membrane proteins indicate that MSCWT has the same capacity with software TMpred. Moreover, the test on a dataset of 131 structure-known proteins with 548 TMHs shows that the prediction accuracy of MSCWT for TMHs is 91.6% and that for membrane protein is 89.3%.  相似文献   

14.
为了解决复杂沉积构造环境导致未钻区域的地应力定量预测难度大的问题,根据层速度、地应力、叠后地震信息之间的定量关系,运用BP神经网络、模拟退火等智能算法提出了用于不同工况条件的两种油气田地应力三维预测方法.在完钻井数量较多、实测信息较丰富的工区使用BP神经网络算法,利用地震数据空间速度信息与岩石力学方法建立地应力三维数据...  相似文献   

15.
针对网络流量具有强烈的非线性和不确定性导致传统统计方式或者机器学习方法难以准确预测的问题,为进一步提升网络流量预测精度,在传统时序序列预测模型的基础上设计实现了一种局部上下文信息增强的注意力机制,通过卷积计算将输入转换为注意力机制中的Query和Key,从微观角度对时间序列进行解释,提高了预测模型的局部感知能力。进而将提出的注意力机制分别与长短期记忆人工神经网络和门控循环单元两个时序预测模型相结合并将结合后的模型用于某运营商提供的两个不同网络流量数据集进行网络设备流量预测。实验结果表明基于局部上下文信息增强注意力机制的预测模型具有更好的预测效果。  相似文献   

16.
传统移动Ad Hoc网络(mobile Ad Hoc network,MANETs)黑洞攻击解析模型存在网络拓扑结构固定、网络传输性能预测精确度低的问题.针对使用按需路由协议的MANETs网络,提出一种基于随机拓扑近似技术的黑洞攻击解析改进模型(improved black hole attack analytical model,IBAAM).IBAAM协议使用随机模型代替传统解析模型使用的n元2立方体模型,并将网络结构扩展至随机拓扑结构,使用最短跳距离概率描述表示网络拓扑结构的随机拓扑信息,再使用K均值聚类法实现跳距离文件配置以求解任意拓扑结构下的攻击概率问题,从而在不利用任何实际拓扑先验信息条件下有效预测MANETs网络平均丢包数目.IBAAM实验结果表明,在多种不同固定Ad Hoc拓扑结构下,IBAAM的网络丢包预测精确度在仿真结果的95%置信区间内,能够有效预测网络传输性能.  相似文献   

17.
提出一种蛋白质亚细胞定位预测方法.该方法以位置特异性得分矩阵和基因本体抽取对应特征,结合支持向量机构建多标签分类模型.充分考虑了蛋白质进化信息对其亚细胞定位的影响,并基于文本分类中涉及到的卡方检验的对数变换思想,构建基因本体注释信息的加权系数对其进行加权处理,从而提高预测的准确率.采用支持向量机作为基分类器构建多标签分类模型,进一步提高预测的准确率.通过在目前该领域两个常用的真实数据集上进行的一系列测试结果表明,该方法能有效提高蛋白质亚细胞定位预测的准确率.  相似文献   

18.
利用神经网络技术实现了从阴极射线管(CRT)的R、G和B空间到CIE的标准色度空间的转换.用拟牛顿法训练网络模型,建立了从CRT的R、G和B到CIE的X、Y和Z色度空间变换的3 10 10 3神经网络模型.采用7点LOG空间分布方案的343个训练样本建模的试验表明,收敛性与训练时间及模型精度均优于前人采用3~4个隐层的方案,343个训练样本、216个检验样本和64组测试样本的平均转换精度分别为0.6个CIELUV色差单位,说明该模型的泛化能力很好.  相似文献   

19.
针对传统线性支持向量机在训练数据集时均等对待每一维输入特征,以及在原始空间直接分类造成预测准确率低的问题,提出低阶多项式数据映射和特征加权相结合的方法,来提高线性支持向量机的分类性能。该方法首先将每个样本映射到多项式核对应的2 阶显式特征空间,从而增加样本的隐性信息,然后使用模糊熵特征加权算法计算每一维特征的权重,通过权重衡量特征对分类结果的贡献大小。从不同数据库选取7个数据集进行测试,在训练时间和预测准确率2个方面将该方法与核支持向量机、线性支持向量机的其他改进算法进行比较。结果显示,随着数据集规模的扩大,训练时间降低一个数量级,预测准确率在一些数据集上取得与核支持向量机相接近的效果。结果表明:所提方法可以有效提高线性支持向量机的整体性能。  相似文献   

20.
Advances in wireless technologies and positioning technologies and spread of wireless devices, an interest in LBS (Location Based Service) is arising. To provide location based service, tracking data should have been stored in moving object database management system (called MODBMS) with proper policies and managed efficiently. So the methods which acquire the location information at regular time intervals then, store and manage have been studied. In this paper, we suggest tracking data management techniques using topology that is corresponding to the moving path of moving object. In our techniques, we update the MODBMS when moving object arrived at a street intersection or a curved road which is represented as the node in topology and predict the location at past and future with attribute of topology and linear function. In this technique, location data that are corresponding to the node in topology are stored, thus reduce the number of update and amount of data. Also in case predicting the location,because topology are used as well as existing location information, accuracy for prediction is increased than applying linear function or spline function.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号