首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 265 毫秒
1.
通过分子结构预测血脑屏障通透性是一个颇具挑战性的课题.建立了一个预测化合物分子的血脑屏障分配系数(logBB)的QSAR模型.该模型由表示分子大小、拓扑性质和脂水分配性质的QSAR参数组成.模型被用来预测52个化合物的血脑屏障分配系数,并通过测试集(从52个化合物种选取10个)进行验证,预测值-实验值的相关系数平方(R2)为0.974,均方差(MsE)为0.017 2.验证结果显示该模型大大优于传统使用的多元线性回归模型.因此,该模型可以用于预测药物分子和类似药物分子的血脑屏障通透性.  相似文献   

2.
支持向量机算法用于烷基苯的热容和标准焓值的预测   总被引:4,自引:0,他引:4  
建立了有关烷基苯结构和它们的热容、标准焓值之间的定量构效关系模型。根据烷基苯的分子结构式,其每个结构分别采用含有6数字的编码来表示。本文建立的定量构效关系模型分别采用了多元线性回归、多元非线性回归和支持向量机算法。所有的化合物被分为训练集和测试集。对每个模型的训练集和测试集的相关系数、平均绝对误差和均方差进行了计算,并对三个模型的预测效果进行了对比讨论。在烷基苯的热容、标准焓值的预测上支持向量机算法略优于另两种方法,显示出了支持向量机算法在预测化合物物理化学性质方面的优越性。  相似文献   

3.
基于支持向量机的中长期电力负荷预测研究与应用   总被引:4,自引:3,他引:1  
采用一种新的机器学习方法——支持向量机,建立了中长期电力负荷预测模型.阐述了支持向量机的基本内容,对影响电力负荷诸多因素的样本集进行了标准化处理和主因素分析(PCA).采用Libsvm训练了数据集,并与灰色预测GM(1,1)模型、多元线性回归模型、模糊ISODATA聚类模型和BP神经网络进行对比.结果表明,此算法有更高的准确性,可为电力负荷预测提供有效依据.  相似文献   

4.
金融股票市场是一个极其复杂的演化系统,因此对股价波动进行准确预测是投资者理性规避投资风险的重要渠道。本文首先通过构建科学性较强的自回归移动平均与支持向量机(ARIMASVM)模型分析一维金融时序数据的线性成分,对我国股价波动进行样本内预测并与真实数据作比较,再利用改进的支持向量机(TGDSVM)模型基于金融面板时序数据处理线性预测后剩余的非线性成分信息。采用平均绝对误差(MAE)、均方根误差(RMSE)、平均绝对比例误差(MAPE)、回归指数(WIA)、百分标准误差(SEP)与Nash系数六个预测精度指标检验五只股票日收盘价的预测精度。仿真结果表明:改进的时间相关序列(ARIMA-TGD-SVM)股票价格混合预测模型可以很好的弥补传统支持向量机(SVM)模型对解决多分类问题存在困难和对大规模训练样本难以实施的不足,并有效解决其利用欧式距离表征时序数据内部真实相互关系不足的缺陷,能够为股市预测提供理论依据和实际应用奠定基础。  相似文献   

5.
以密度、基于分子表面的弱电场参数、投影参数及氢键供体数等11个结构描述符为输入,通过支持向量机(SVM)方法对99个活血化瘀类药物活性建立了构效关系的分类模型。全部化合物被随机分为包含85个化合物的训练集和包含14个化合物的测试集,使用十重交互检验方法选择最优的惩罚函数及核函数参数值,研究表明这个模型对活血化瘀类药物的活性有很好的预测效果(训练集中准确率为100%,测试集中准确率为92.9%),显示出了支持向量机算法在研究中药构效关系方面有很好的应用前景。  相似文献   

6.
针对害虫发生量数据的小样本、非线性特点,提出一种最小二乘支持向量机的害虫预测方法.首先采用多元线性回归分析法选择害虫发生量的影响因子,然后通过遗传算法对最小二乘支持向量机参数进行优化,最后建立害虫发生量与影响因子之间复杂的非线性关系模型.采用二代玉米螟百株幼虫虫量对模型性能进行检验,结果表明,相对于多元线性回归、BP神经网络模型,最小二乘支持向量机提高了二代玉米螟发虫量的预测精度,是一种有效的害虫变化预测方法.  相似文献   

7.
构建55个药物分子与其血脑屏障通透性(logB)之间的定量结构-性质关系模型,探讨影响药物血脑屏障通透性的结构因素.应用CODESSA软件计算55个化合物的组成、拓扑、几何、静电和量子化学等结构参数,通过启发式方法筛选得到最佳的结构参数,并建立线性回归模型;用所选的4个结构参数作为支持向量机的输入,建立非线性的支持向量机回归模型.预测结果表明:支持向量机回归模型性能(R2=0.89,MSE=0.06)要优于启发式回归模型的性能(R2=0.82,MSE=0.11).描述符HASA2,NO,FPSA3和E(CH)都是影响logB的主要结构因素.支持向量机模型简单快速,在药物设计中可以用来预测候选药物的logB值.  相似文献   

8.
为了快速精确地利用基本物性指标预测湿陷性黄土的湿陷性系数,基于多种数据挖掘方法提出了离散型二项式系数组合预测模型。首先,采用相关系数法和随机森林重要性指数法综合选取模型基本物性指标为饱和度、干密度、液性指数和天然含水量;然后,分别利用多元线性回归、BP神经网络、支持向量机回归(SVR)和随机森林(RF)回归对黄土湿陷性系数进行预测,并将预测结果进行组合,得到4种单一模型、2种传统组合模型和离散型二项式系数组合模型预测结果;最后,利用6种不同精度指标对上述7种预测模型展开精度分析。结果表明:组合预测模型精度整体高于单一预测模型,且提出的离散型二项式系数组合模型各精度指标均为最优,平均相对误差为3.43%。可见提出的离散型二项式系数组合模型可为湿陷性黄土地区的工程设计提供参考。  相似文献   

9.
熊洁仪  袁哲明 《江西科学》2009,27(2):236-239
为提高药物定量构效关系(QSAR)模型预测精度,发展了一种新的QSAR建模方法SVR—CKNN。该法基于支持向量机回归(SVR)自动筛选化合物结构描述符,以k-最近邻建立多个子模型实施组合预测(CKNN)。应用于49种HIV-1蛋白酶抑制剂QSAR研究,留一法预测结果表明SVR—CKNN预测精度明显优于多元线性回归(MLR)、逐步回归(SLR)、偏最小二乘回归(PLS)和神经网络(BP—ANN)等传统模型。SVR—CKNN基于结构风险最小,具非线性、适于小样本、泛化推广能力强、稳定性好、不依赖操作者经验等诸多优点,在药物设计等研究中应用前景广泛。  相似文献   

10.
针对BP神经网络和遗传算法对果酒生物活性物质预测存在速度慢和精度低的缺点,建立了基于支持向量回归机(SVR)的果酒生物活性物质预测模型。鉴于支持向量机模型的精度和泛化能力很大程度取决于不敏感损失系数ε、惩罚系数C和RBF核函数的宽度系数γ三个参数,模型采用粒子群算法对三个参数同时进行优化,实现了果酒生物活性物质的非线性预测。仿真结果表明:基于PSOSVR算法的果酒生物活性物质预测模型性能优于所比较的BP神经网络模型和支持向量回归机模型,能有效提高果酒生物活性物质的预测精度和稳定性。  相似文献   

11.
针对非线性结构响应预测的支持向量机(SVM)近似模型的参数选取问题,提出了应用粒子群算法进行参数优化,建立了具有最优参数的SVM近似模型,并与以训练集数据建立常规的SVM、二阶响应面(RSM)和径向基神经网络(RBFNN)近似模型进行对比.结果表明:以优化参数建立的SVM近似模型比常规的SVM近似模型有更好的预测能力;可以避免RSM和RBFNN近似模型中的过拟合现象,具有更优的推广能力.最后,将最优参数的SVM近似模型用于船舶结构优化中,取得了具有良好工程实用性的优化结果.  相似文献   

12.
用MEDV描述子对102个酚的分子结构进行表征,对MEDV矢量和其气相色谱保留指数之间建立了分子结构-色谱保留值定量关系(QSRR).多元线性回归十参数模型的复相关系数达到了0.943 6,逐步回归九参数模型复相关系数为0.943 6,交互检验的R CV值为0.844 8,表明模型对样本具有一定的稳定性和预测能力.  相似文献   

13.
利用Matlab分别用后退的回归分析算法、BP神经网络算法、支持向量机算法和组合预测算法对民航团队销售数据进行预测和比较分析,为民航销售人员提供更加精准的预测信息,从而获得更高的航线收益.分析结果显示:后退的回归分析算法比常用的多元线性回归精准性提高,但是数据结果并不具有可靠性.神经网络算法、支持向量机算法和组合算法比常用的回归分析算法预测的精准度有了明显的提高.支持向量机算法预测精度相对神经网络算法稍低,但是却拥有更强的泛化能力.组合预测算法能避免单一预测方法的误差,更加适合航线销售人员的实际操作.  相似文献   

14.
采用分子动力学MM+和半经验AM1算法优化并计算24种芳烃类化合物的16种量子化学参数,通过主成分分析法和回归分析法对化合物的量子化学参数进行筛选,所得最佳参数与芳烃类化合物对发光菌的急性毒性进行定量构效关系研究(QSAR)。所建多元线性回归方程的确定系数(R2)和留一法交叉检验系数q2分别为0.83和0.990。毒性实验值与预测值的相关性较好,模型具有良好的稳定性和预测能力。  相似文献   

15.
在利用多元线性回归理论确定飞机机翼标定试验的载荷-应变关系时,对试验数据的精度和容量要求较高,针对这一问题,提出了一种基于支持向量机的机翼载荷确定方法。采用某型飞机机翼地面标定试验数据和飞行实测数据进行实例验证,结果显示两种载荷模型获得的载荷-时间历程整体上较为一致,支持向量机载荷模型的校验误差小于多元线性回归模型,表明支持向量机可作为获取机翼载荷的一个更加有效的手段。  相似文献   

16.
基于GF-2的乔木生物量估测模型研究   总被引:1,自引:0,他引:1  
以福建省将乐林场为研究区,使用野外实测样地数据,结合福建省二类调查数据,获取了共192个样地的生物量数据,其中杉木纯林112个,马尾松纯林80个.对覆盖研究区的2景GF-2影像进行预处理,提取光谱信息、植被指数、纹理特征及地形因子,筛选与样地生物量相关性较高的因子作为建模的自变量,采用支持向量机、随机森林及多元逐步回归3种方法分别建立了杉木和马尾松生物量模型.结果表明:支持向量机、随机森林模型拟合效果均比多元逐步回归模型好,其中随机森林模型决定系数R2最高,2种样地的R2分别为0.65和0.72,估计精度也最高,分别为65.28%和76.82%;杉木样地3种模型的均方根误差分别为64.27、48.16和77.03,马尾松样地3种模型的均方根误差分别为54.79、48.18和65.63,其中随机森林模型的最低.在3种模型中,随机森林模型为乔木生物量的最优模型.   相似文献   

17.
利用分子力学和量子化学方法计算出烷基硫醇类化合物的分子结构描述参数,用多元线性回归法建立化合物在不同极性色谱柱上的QSRR模型。烷基硫醇类化合物在不同极性色谱柱上的气相色谱保留指数与其拓扑指数之间具有较好的线性关系。建立的不同极性色谱柱上的烷基硫醇类化合物的色谱保留QSRR模型预测此类化合物的色谱保留值,具有较好的稳定性和准确性。  相似文献   

18.
根据非氢原子类型分类、基于非氢原子相对电负性和非氢原子间距离等进行计算得到的分子电性距离矢量(MEDV)为描述子,对16种氟化酚类化合物的结构进行了表征.运用多元线性回归(MLR)方法,研究并建立了氟化酚类化合物定量结构与生物毒性关系的5变量模型,其复相关系数(R)为0.914.上述模型对16种氟化酚类化合物毒性的预测值与实验值能较好吻合,留一法交互检验的复相关系数(RCV)为0.856.结果表明所建模型具有良好的稳定性和预测能力.  相似文献   

19.
应用支持向量回归算法(SVR),以按非氢原子分类的分子电性距离矢量(H-MEDV)为参数,通过参数的优化,建立了几种更强的预测模型,预测了卤代苯和苯酚衍生物的毒性,并根据H-MEDV参数原理对预测结果进行了初步探讨.各预测模型的标准误差分别为0.305、0.267、0.275、0.228、0.362、0.238,均低于采用多元线性回归(MLR)和逐步回归(SMR)法的预测结果,说明支持向量回归算法在小样本、多变量的样本建模预报问题上具有一定的优势.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号