首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 35 毫秒
1.
梁桂兆  梅虎  杨善彬  周原  周鹏  李志良 《科学通报》2006,51(14):1644-1648
收集了23种氨基酸1262种结构信息, 经主成分分析得新的-氨基酸拓扑描述子得分(SATD)矢量. 将其用于125个不同长度肽的结构表征, 分别以支持向量机(SVM)和偏最小二乘(PLS)建立肽定量序列-迁移模型(QSMM). 结果表明, SATD描述子所含信息量大, 易于操作, 能较好地表征125个肽结构. 与PLS相比, SVM在对电泳迁移率建模预测中表现出较强的拟合能力和良好的预测能力.  相似文献   

2.
利用高斯核函数将低维空间的非线性回归转化为高维空间的线性回归,建立了基于核偏最小二乘回归的电力负荷预测模型,克服了非线性因素对预测模型的不利影响.应用武汉市的实际数据进行了验证,结果表明,基于核偏最小二乘回归的电力负荷预测与线性偏最小二乘回归相比,具有更好的预测性能.  相似文献   

3.
王海燕  张爱茜  孙成  王连生 《科学通报》2008,53(19):2292-2297
基于分子全息技术, 研究了41种有机磷化合物甲酯化后气相色谱保留指数与分子全息结构之间的关系, 应用偏最小二乘回归技术建立了分子全息定量结构-色谱保留相关模型, 非交叉验证系数r2 = 0.994, 交叉验证相关系数q2LOO = 0.984. 随机选出30种有机磷化合物作为训练集, 其余作为测试集来验证分子全息QSRR模型的预测能力和稳健性. 在最佳建模条件下对训练集进行偏最小二乘回归分析, r2为0.995, q2LOO为0.982. 用训练集数据所建立的QSRR模型预测测试集中有机磷化合物的色谱保留指数, 结果表明, 基于训练集所建立的QSRR 模型可以对测试集的有机磷化合物的气相色谱保留指数进行很好的预测. 利用HQSRR模型的色码图, 探讨有机磷分子中的不同侧链基团对其色谱保留性质的影响, 以及有机磷化合物在固定相上的色谱保留机制.  相似文献   

4.
沈金城  张松  孙之荣 《科学通报》2007,52(13):1536-1541
亚细胞定位与蛋白质的功能紧密相关. 本研究提出了一种新的编码方式, 试图根据那些与亚细胞定位相关的蛋白质分子功能信息, 结合氨基酸二肽组成以提高亚细胞定位预测的性能. 结果显示, 在使用支持向量机和RH数据集的测试中, 该方法的预测精度有了显著的提高, 同时对于蛋白质序列N端的不准确性也具有一定的鲁棒性.  相似文献   

5.
人工神经网络具有高度的非线性映射能力,通过样本的学习,实现输入与输出之间的非线性映射.通过对比两种人工神经网络BP和RBF,结合南水北调东线一期工程一刘老涧站土样作样本,结果表明采用BP神经网络预测膨胀趋势结果更准确,具有较强的可推广性.  相似文献   

6.
从分子的三维空间结构出发, 按照不同类型原子之间静电和立体作用得到一种新的分子结构表达方法——三维原子场相互作用矢量(3D-VAIF). 利用该矢量对20种天然氨基酸空间结构性质进行计算, 通过主成分分析获得单个氨基酸的特征描述子——氨基酸结构信息得分(SSIA). 分别使用58个血管紧张素转化酶抑制剂、48个苦味二肽以及31个缓激肽对SSIA的性能进行了测试, 所得模型的复相关系数R2cum和交互检验复相关系数Q2LOO分别为0.789, 0.773; 0.856, 0.837和0.838, 0.815. 结果表明将SSIA用于肽类似物定量序列活性建模(定量序效建模, QSAM)效果优于传统氨基酸描述子.  相似文献   

7.
应用分子全息对多氯代二苯并呋喃的QSRR研究   总被引:2,自引:0,他引:2  
基于分子全息技术, 研究了135种多氯代二苯并呋喃化合物(PCDFs)气相色谱保留指数(GC-RI)与分子全息结构之间的关系, 应用偏最小二乘(PLS)回归技术建立了分子全息定量结构-色谱保留(QSRR)模型. 交叉验证相关系数q2LOO=0.998, 非交叉验证系数r2 = 0.998. 随机选出100种PCDFs化合物作为训练集, 其余作为测试集, 来验证分子全息QSRR模型的预测能力和稳健性. 采用最佳模型的建模条件对测试集进行PLS分析, q2LOO为0.997, r2为0.998. 用训练集数据所建立的QSRR模型预测测试集中PCDFs化合物的色谱保留指数, 结果表明基于训练集所建立的QSRR模型可以对测试集中PCDFs化合物的气相色谱保留指数进行很好的预测.  相似文献   

8.
对于电力系统负荷预测的复杂性,为提高短期预测的准确性,采用以人工神经网络为基础,提出了一种利用神经网络与模糊理论相结合进行负荷预测的模型.该算法克服了传统BP算法的训练速度慢、存在局部极小点的缺点,使预测精度大有改善.实例计算表明了该算法的改进成果和可行性.  相似文献   

9.
王月平  闫婉露  郭琼  何严萍 《科学通报》2013,58(10):916-921
采用分子全息定量构效关系(HQSAR)方法, 研究了34个HIV-1逆转录酶抑制剂S-DABOs类化合物的结构与活性之间的关系. 讨论了分子碎片大小、碎片区分参数以及分子全息长度对模型的影响. 以26个化合物构成的训练集所建最优模型的交叉验证相关系数q2为0.755, 相关系数r2 为0.949. 对8个化合物构成的测试集进行了预测, 其预测相关系数rpred2为0.95, 表明所建模型不仅有较高的拟合能力, 还有良好的预测能力. 最后, 利用HQSAR模型的色码表示, 探讨了对S-DABOs类似物的活性起重要作用的结构与片段, 为此类化合物的进一步结构改造与优化提供理论指导.  相似文献   

10.
采用本实验室新近提出的三维全息原子场作用矢量(3D-HoVAIF)对33个嘌呤衍生物进行定量结构保留相关(QSRR)的研究, 运用逐步回归(SMR)筛选变量后, 用偏最小二乘(PLS)回归建模与交互校验复相关系数, 标准偏差分别为 =0.966与 =0.860及SD=0.112, 均优于文献值, 色谱保留预测模型具有良好的稳定性和预测能力. 研究结果表明: 3D-HoVAIF能较好地表征该类分子结构信息, 有物化意义明确及结果易于解释等特点, 值得进一步推广应用.  相似文献   

11.
太阳耀斑是剧烈的太阳活动现象之一,耀斑的预报对人类活动有着重要的实用价值.为进一步提高太阳耀斑的预报准确率,本文在综合考虑太阳黑子活动区参量、10.7 cm太阳射电流量等预报因子的前提下,提出了结合主成分分析和支持向量机的太阳耀斑预报模型.本模型的太阳黑子活动区参量包括黑子群面积、黑子群的Mc Intosh分类、活动区日面经度延伸、可见黑子数和黑子群的磁分类.本文首先对上述参量进行了合适的属性编码并归一化建模所需数据集,然后利用主成分分析方法提取出主要特征,应用支持向量机方法建立了耀斑预报模型.最后,本文将该模型预报结果与其他预报模型的结果进行了对比,结果验证了结合主成分分析和支持向量机的太阳耀斑预报模型是一种有效的预报模型.  相似文献   

12.
于海瀛  乔显亮  杨萍  丁光辉  陈景文 《科学通报》2006,51(20):2369-2372
有机污染物在空气颗粒物与空气之间的分配系数(Kp)对于描述其在大气中的行为具有重要意义, 是进行生态风险评价的基础数据. 基于18种正构烷烃、21种多氯联苯、16种二英类化合物和13种多环芳烃的Kp值, 采用理论分子结构描述符和偏最小二乘(PLS)回归, 建立了Kp的多参数线性自由能关系(LFER)模型. 该模型具有较好的稳健性和预测能力, 可用于结构类似化合物Kp值的预测, 并有利于对分配机理的解释. 结果表明, 色散力是影响有机化合物在空气和颗粒物相间分配的主要因素, 电荷转移作用和分子位阻大小对Kp值也有一定影响. 同时, 对不同种类化合物分别建模, 结果表明, 影响几类化合物分配的机理相似, 偶极-偶极、偶极-诱导偶极作用对正构烷烃、PCBs和PCDD/Fs 的KP值有微弱的贡献.  相似文献   

13.
李志良 《科学通报》1995,40(17):1632-1632
多元分析与滤波校正已广泛用于多组分同时或选择测定,但其中许多方法均基於线性加和性原理,而此定量原理受各种理化因素制约并非总能满足.神经网络NN如反传算法BP则处理方式完全不同,毋需知道或采用任何形式的输入/输出关系模型,它依据一定学习规则处理问题,特别对因果关系不明确、知识背景不清楚、推量规则不确定的问题求解具独到之处.我们曾用NN研究定量构效关系、化学模式识别、生化反应建模、复杂机理剖析及多元光谱分析等,  相似文献   

14.
人工神经网络在全球气候变化和生态学中的应用研究   总被引:4,自引:0,他引:4  
近年来, 随着计算机技术和人工智能的发展, 人工神经网络(ANN)的应用领域不断被开拓. 同时, 人们对全球气候变化和生态环境问题也日益关注, 如全球变暖、El Niño和La Niña出现频繁、大气环流异常等, 使得人工神经网络方法在全球气候变化和生态学研究中得到了广泛的应用. 虽然人工神经网络仍存在一些不足和风险, 如模型的参数要求更高的灵敏度、网络结构的选择一般更依赖于个人经验和神经网络对短期的预测研究精确度往往高于中长期预测, 但全球变化研究中尤其要重视交互作用的影响和长期实验等. 不过, 神经网络在处理非线性问题上仍然优于许多传统的方法. 因此, 在全球气候变化和生态学研究中人工神经网络具有很大的应用潜力, 它能在实测过程可能十分困难或者使用不完整的数据难以实现的情况下, 完成其他方法完成不了的问题. 可以预料人工神经网络将在全球气候变化和生态学研究中得到更多的应用和发展.  相似文献   

15.
周鹏  李志良  田菲菲  张梦军 《科学通报》2006,51(11):1259-1263
将天然氨基酸149个疏水性质经主成分分析得到了一种新氨基酸描述子——氨基酸广义疏水标度(GH—scale).用GH—scale结合遗传偏最小二乘(GPLS)算法对152个HLA—A*0201限制性CTL表位进行定量构效关系(QSAR)研究.所建模型拟合及交叉检验复相关系数分别为R^2cum=0.813和Q^2=0.725.研究表明,疏水作用在CTL表位与HLA—A*0201结合过程中扮演极其重要角色,而锚定残基是该类作用发生最显著的部位.  相似文献   

16.
提出了一种优化有机朗肯循环(organic Rankine cycle,ORC)控制系统设定值的方法.由于ORC系统中存在扰动及工况点的变化,有必要根据运行工况实时调整控制回路设定值,以提高ORC系统的能量转换效率.首先,回顾ORC系统性能分析及优化等相关文献,探讨了ORC控制系统设定值优化问题;然后采用基于遗传算法的最小二乘支持向量机(Genetic Algorithm-Least Squares Support Vector Machine,GA-LSSVM),确定了ORC过程控制系统的最优设定值.仿真结果表明当ORC系统的工况发生变化时,由GA-LSSVM算法可以快速确定ORC控制系统的最优设定值.  相似文献   

17.
显微拉曼光谱法定量检测碳氧血红蛋白饱和度   总被引:2,自引:0,他引:2  
张平丽  孟耀勇  肖军  廖昱博 《科学通报》2012,(14):1222-1226
采用显微拉曼光谱技术对不同饱和度碳氧血红蛋白(HbCO)进行测定,通过偏最小二乘法(PLS)和间隔偏最小二乘法(IPLS)建立模型,得出线性回归方程.结果表明,经过筛选变量信息所建立的间隔偏最小二乘模型(IPLS),当血红蛋白系列样品中碳氧血红蛋白含量为0~100%时,线性相关系数的平方为0.99,检测限为5.37%,完全能满足临床和法医学上CO中毒程度的检测.此方法具有快速、简便、直接、对样品无损等优点,有望成为检测碳氧血红蛋白饱和度的新方法.  相似文献   

18.
张冰洁  刘国庆  蔡禄 《科学通报》2014,(11):953-959
减数分裂重组并非均匀发生在基因组上,而是在一些区域有着较高的重组频率(重组热点),在另一些区域重组频率较低(重组冷点).重组的发生不仅与序列特征有关,还依赖于染色质的结构.准确鉴定重组热点和冷点对于认识重组发生的分子机制以及基因组进化规律具有重要意义.本文首先在实验数据的基础上识别2 kb尺度的重组冷热点,然后采用多样性增量结合二次判别分析(IDQD)和支持向量机(SVM)算法,基于一系列与DNA序列、结构及其热力学稳定性以及染色质结构相关的特征对酵母的重组冷热点进行了分类预测.结果表明,预测模型能够有效区分重组冷热点;从预测结果的敏感性、特异性和总精度来看,IDQD算法优于SVM算法.  相似文献   

19.
中药材产地的近红外光谱自动鉴别和特征谱段选择   总被引:13,自引:0,他引:13  
以白芷和丹参为例, 用近红外漫反射光谱数据、应用多类支持向量机方法对中药材产地及生长条件进行自动鉴别, 并进一步用递归支持向量机等方法选择对分类最有效的特征谱段, 结果在仅用5个和8个特征谱段的情况下在独立的测试集上达到了92%的识别正确率. 这一研究不但为建立快速准确的中药材产地自动鉴别系统提供了技术原型, 也为进一步探索不同产地的中药材在化学成分上的细微差异及研究它们与药效的关系奠定了基础.  相似文献   

20.
《科学通报》2021,66(3):284-299
机器学习的目标是设计可以根据先验知识和观测数据不断改进其性能的算法.该算法可以帮助机器从大量的数据中提取知识,从而提升其在特定任务上的性能.作为数据驱动的方法,机器学习可以有效利用高通量实验技术产生的大批量生物数据,实现合成生物体的功能预测与智能化设计,改变合成生物学的研究范式.本文首先介绍机器学习在合成生物学领域广泛应用的几个模型及方法,如支持向量机、神经网络、生成式对抗网络、深度强化学习等.然后介绍机器学习方法在合成生物学领域的典型应用,如启动子预测、酶催化设计、代谢途径构建、基因线路设计等.本文综述面向合成生物学的机器学习方法及应用,并试图启发读者如何选择和设计机器学习方法用于合成生物学的研究.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号