首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
中药材具有相当高的声誉,而这一混合物体系极具复杂性,对其进行鉴别意义深远.红外光谱因专属性强重现性好,广泛用于中药材鉴别.利用中红外光谱进行同种中药材产地鉴别,首先进行平滑滤波和导数光谱预处理,再基于费舍尔判别分析进行鉴别.同时利用近、中红外光谱对同种中药材进行产地鉴别,首先对原始近红外、中红外、近中红外组合数据预处理,再基于费舍尔判别分析进行鉴别.利用近红外光谱对不同类别产地药材进行鉴别,方法一将类别和产地双标签映射为单标签,用费舍尔判别分析鉴别单标签,再逆推原类别产地,方法二分别基于类别和产地进行费舍尔判别分析.仿真和实际实验说明费舍尔判别分析有效.  相似文献   

2.
基于SVM预测的金融主题爬虫   总被引:2,自引:2,他引:0  
随着Internet上信息的爆炸,利用通用搜索引擎检索用户相关的信息变得越来越困难,而主题爬虫成为WEB上检索主题相关信息的重要工具.目前大部分基于分类器预测的主题爬虫的训练数据是不同类别网页的内容,但是在实际预测过程只能根据父网页中的一些链接信息进行预测,所以造成主题爬虫的预测的准确率较低.本文使用SVM分类器对标注了类别的URL以及上下文和锚文本进行训练,并分别使用了DF和信息增益两种不同的特征选择方法进行特征筛选,对影响分类器的各种因素进行了实验对比,并对分类器进行了在线的实验.实验证明这种方法在实际预测过程中效率很高.  相似文献   

3.
采用傅里叶变换红外光谱(FTIR)对不同枸杞样品产地进行鉴别.常规预处理方法和小波变换对红外光谱原始数据进行了预处理.对比常用的窗口移动平滑预处理、标准正态变换以及多元散射校正,说明小波变换是一种有效实用的光谱预处理方法.对已预处理后的红外光谱数据进行主成分分析和聚类分析,结果 18份枸杞样品聚为主产地和非主产地两大类,取得了较满意的分类效果.这种红外光谱技术结合聚类分析法被证明是可靠的,可作为枸杞产域鉴别的一种现代化方法.  相似文献   

4.
运用红外光谱技术结合主成分分析和系统聚类分析快速鉴别大叶三七的产地.利用红外光谱测定了13个不同产地的大叶三七的红外光谱原始数据,对比标准正态变换、一阶导数校正、多元散射校正等常规预处理方法与小波变换处理的降噪效果,得知小波变换处理能大大降低原始红外光谱中的噪音和一些不需要的信息.利用小波变换后的红外光谱的标准化数据实现主成分分析和系统聚类分析来鉴别大叶三七的产地,主成分分析和系统聚类分析结果一致,可将13个不同产地大叶三七分为云贵高原、秦岭以南、秦岭以北等3类,即云南昭通(3号)、山西绵山(6号)、云南文山(11号)聚为一大类;陕西太白山(1号)、青海互助(2号)、云南迪庆(4号)、云南大理(5号)、甘肃麦积山(8号)、湖北神农架(9号)、甘肃六盘山(13号)聚为一大类;安徽黄山(7号)、陕西汉中(10号)、四川马边县(12号)样品聚为一大类.实验结果表明:红外光谱技术结合主成分分析和系统聚类分析可以快速、科学地进行大叶三七的产地鉴别,此法可以为中药材产地鉴别提供参考.  相似文献   

5.
随着Internet上信息的爆炸,利用通用搜索引擎检索用户相关的信息变得越来越困难,而主题爬虫成为WEB上检索主题相关信息的重要工具。目前大部分基于分类器预测的主题爬虫的训练数据是不同类别网页的内容,但是在实际预测过程只能根据父网页中的一些链接信息进行预测,所以造成主题爬虫的预测的准确率较低。本文使用SVM分类器对标注了类别的URL以及上下文和锚文本进行训练,并分别使用了DF和信息增益两种不同的特征选择方法进行特征筛选,对影响分类器的各种因素进行了实验对比,并对分类器进行了在线的实验.实验证明这种方法在实际预测过程中效率很高。  相似文献   

6.
电力设备的负荷曲线随着时间而变化,其本质上是时间序列数据.为此提出了一种新的通过负荷曲线识别电力设备的方法,该方法在多个粒度划分出的负载曲线上使用卷积神经网络作为基分类器构造出一个集成学习器来提高分类精度.首先我们对原始数据进行不同粒度的划分,得到若干不同的新数据集.其次使用这些新的数据集训练不同的基学习器,并根据验证集上的精度得到不同基学习器的权重.将测试样本按照相同的粒度划分方式得到不同的测试数据集,使用不同的基分类器对这些测试数据集进行测试,得到对应的预测标签.最后对不同基分类器预测的标签进行加权,并选出权重最大的那个标签作为预测标签.在实际的电力负荷数据上将该模型与单个CNN模型进行对比,实验结果表明,该模型具有更高的设备识别精度.  相似文献   

7.
收集大量网站的包含30个特征属性的数据,用k-means属性聚类方法将特征属性划分为不同类别,利用不同类别中的属性数据训练基础分类器,通过集成各基础分类器的结果对未知网站进行预测.采用简单投票和贝叶斯投票对结果进行组合预测,结果表明,k-means属性聚类方法大大增加了基础分类器的差异性,提高了分类检测的精度,其中基于贝叶斯投票策略的集成模型具有很高的检测精度.  相似文献   

8.
近红外光谱分析技术在烟叶产地鉴别中的应用   总被引:4,自引:0,他引:4  
为研究近红外光谱分析技术在鉴别烟叶产地中的可行性,以云南8个不同产地的880个烟叶样品为基础,通过TQ analyst分析软件的定性分析方法建立预测各烟叶产地的近红外模型,并应用该模型对100个烟叶样品进行了实际产地预测.结果显示,上述方法建立的预测模型对云南烟叶产地的鉴别准确率达90%.研究表明,应用近红外光谱分析方...  相似文献   

9.
高速公路实时交通状态的准确判别是科学制定交通管理策略的重要基础.本文以实测的高速公路交通流三特征参数的数据作为输入,引入熵权法刻画参数之间重要程度的差异,利用改进的FCM算法对特征参数进行聚类,根据不同交通状态的结果,建立基于多分类器支持向量机的交通状态判别模型,并分别采用网格搜索法、遗传算法和粒子群算法对支持向量机参数进行优化,从而提高模型的判别准确率.最后选取实际数据对本文模型进行验证,判别结果的分类准确率可达96.3980%.  相似文献   

10.
目的 采用傅里叶变换红外光谱(FT-IR)和高效液相色谱(HPLC)方法对37批不同品种和产地的大黄药材进行分析。方法 分别采用FT-IR和HPLC测量37批大黄药材的红外光谱和液相指纹图谱,并对结果进行聚类分析。从每一产地中选择一批药材,分析红外原始光谱,并对原始光谱进行二阶导数处理,根据所得二阶导数光谱对各产地大黄进行分析;同时对HPLC指纹图谱进行相似度分析。结果 FT-IR和HPLC两种方法聚类分析结果基本一致。通过分析不同产地的大黄药材原始红外光谱特征峰能够区分各产地大黄品种,但无法区分其产地,而二阶导数特征峰有明显的位置、形态和强度上的差异,能够将不同产地大黄药材鉴别出来。HPLC指纹图谱相似度分析无法将其产地进行区分。结论 与HPLC指纹图谱相比,FT-IR能够更加全面的反映大黄药材的化学成分,并对其品种和产地进行区分。  相似文献   

11.
用户属性在个性化服务中具有重要的作用,利用手机数据进行用户属性预测逐渐成为新方向.利用手机应用类别均使用时长和应用类别个数,提出了基本属性与辅助属性的概念.首先对所有未标注样本的辅助属性离散化,将辅助属性基于类别的海灵格距离作为基本属性的特征权重,将基本属性与权重的乘积作为特征训练集成分类器中的各个基分类器,并引入随机森林中的带外样本准确率作为基分类器的权重,得到最终的分类结果.实验结果表明,本文所给出的集成分类器框架能够提高用户属性预测的效果.  相似文献   

12.
近红外漫反射聚类法无损快速测定淀粉品质   总被引:3,自引:1,他引:2  
提出一种基于近红外光谱技术和聚类分析法对不同种类的淀粉进行无损快速鉴别的方法,研究了近红外光谱结合聚类分析法快速鉴别淀粉种类的可行性.采集样品在12 500~4 000cm-1范围内的近红外漫反射光谱,利用光谱模式识别法中的聚类分析法对图谱进行定性分类鉴别.光谱经一阶导数预处理后,采用聚类分析法可准确无误地将样品分为2类,分类准确率达到100%.同时采用预测集的样品验证所建模型的准确性,经实验得出预测准确率也是100%.实验结果表明,近红外漫反射光谱结合聚类分析法可以为快速无损鉴别淀粉种类提供一种准确可靠的方法.  相似文献   

13.
收集6个产地凌霄花样品的近红外光谱,构建支持向量机(SVM)模型进行产地鉴别.运用竞争自适应重加权采样(CARS)算法提取特征波长变量,在此基础上建立CARS-SVM产地判别模型.将该判别模型与线性判别分析、偏最小二乘判别分析和簇类独立软模式法3种模型进行比较.结果表明,SVM模型对不同产地凌霄花样品的鉴别结果良好,经CARS提取特征波长后,波长变量数从1 557减小至52,所构建的CARS-SVM模型对6个产地样品的判别准确率较高,明显优于上述3种模型.因此,近红外光谱技术可快速准确判别凌霄花的产地,为凌霄花的产地鉴别与质量评价提供一种新的方法.  相似文献   

14.
淫羊藿具有增加心脑血管血流量,促进造血和增强免疫功能等功效.淫羊藿的药效受产地的影响,为确保其质量,需对淫羊藿产地进行快速鉴别.为此,采用激光诱导击穿光谱(Laser-induced breakdown spectroscopy,LIBS)结合化学计量学方法对淫羊藿产地实现快速准确鉴别.通过获取6个产地淫羊藿样品的LIBS光谱数据,对比研究两种光谱数据降维方法,基于主成分分析(Principal component analysis,PCA)的特征提取和基于原子光谱数据库的特征谱线选择,并结合线性判别分析、k近邻、随机森林(Random forest,RF)和支持向量机(Support vector machine,SVM)4种机器学习算法,实现不同产地淫羊藿样品的鉴别,最终建立产地溯源算法模型.在PCA可视化中,相同产地淫羊藿样品的光谱数据具有明显的聚类效果.开发的模型均能够实现淫羊藿产地的准确鉴别,其中PCA-SVM模型的分类效果最好,测试集分类准确率为99.17%.此外,采用RF模型计算所选元素谱线的重要性,结果表明Si元素(SiⅠ251.61 nm)是区分不同产地淫羊藿的最重要...  相似文献   

15.
采用HPLC-UV测定36个麻黄药材的指纹图谱,应用化学计量学进行图谱预处理和数据预处理,建立并验证不同种类、不同产地和不同采摘时间的麻黄药材的反向传播人工神经网络(back-propagation artificial neural network,BP-ANN)和判别分析(discriminant analysis,DA)判别模型.研究结果显示,所建BP-ANN模型的预测准确率为83.3%~94.4%、DA模型的性能指标为82.8%~88.5%,可见所建方法能有效判别不同种类、不同产地和不同采摘时间的麻黄药材.该方法基于麻黄药材物质基础的整体性质,判断客观,为其他药材的分析提供了参考.  相似文献   

16.
《河南科学》2016,(1):22-27
针对数据集中类样本不均衡、样本标注代价大的问题,结合聚类算法、委员会投票思想和TSVM算法,提出一种基于聚类和协同标注的TSVM算法,该方法利用聚类算法进行子集划分,保证每个子集都包含良好的空间信息,对样本的标注采用多个分类器进行投票,提高标记准确率,减少错误的累积和传递,提高标注准确率,增强最后分类器的泛化性能.KDDCUP99数据集上的实验结果表明该方法对未知攻击有较高的检测准确率.  相似文献   

17.
针对数据集中类样本不均衡、样本标注代价大的问题,结合聚类算法、委员会投票思想和TSVM算法,提出一种基于聚类和协同标注的TSVM算法,该方法利用聚类算法进行子集划分,保证每个子集都包含良好的空间信息,对样本的标注采用多个分类器进行投票,提高标记准确率,减少错误的累积和传递,提高标注准确率,增强最后分类器的泛化性能.KDDCUP99数据集上的实验结果表明该方法对未知攻击有较高的检测准确率.  相似文献   

18.
为获得改进的分类算法BP_Adaboost,利用思维进化算法(MEA)和列文伯格-马夸尔特算法(LM)结合改进的BP神经网络作为弱分类器,由改进的弱分类器集成得到MEA-LM-BP_Adaboost算法.提出了基于MEA-LM-BP_Adaboost算法的首轮融资时总票房分类预测方法,该方法包括变量选取及操作化处理、网络参数优化、MEA改进弱分类器、LM算法改进弱分类器、MEA-LM-BP_Adaboost算法的流程设计、待预测电影验证6个部分.选用2013~2018年的245部国产电影作为样本验证该预测方法和模型,测试集分类准确率可达73.3%.最后在模型准确率、稳定性、K折交叉验证3方面进行模型整体性能比较,结果表明本文提出的模型整体性能最好.  相似文献   

19.
四种地格达类蒙药材的鉴别研究   总被引:2,自引:0,他引:2  
目的:比较四种地格达类蒙药材的品种质量差异.方法:以甲醇、乙醚、石油醚为系统溶剂,用超声提取制备供试液,对它们进行薄层色谱和紫外光谱分析,并对药材粉末进行红外光谱分析.结果:薄层色谱图中既有Rf值相同的斑点,又有Rf值不相同的斑点;紫外光吸收带形基本不一致,而且相对吸收度不同;红外光谱由于在4 000-2 000 cm^-1区域的噪音比较大,故取2 000-500 cm-1区域进行比较.结果,红外光谱吸收度和吸收峰位差别明显.结论:可以根据薄层色谱、紫外光谱和红外光谱的分析结果,对四种地格达类蒙药材能准确地进行鉴别.  相似文献   

20.
Hadoop具有海量数据并行存储能力和高效并行计算架构,但缺乏数据建模和数据统计能力.针对Hadoop架构的数据统计分析能力的局限性,结合R语言和Hadoop框架的优点,提出一种基于R+Hadoop环境的大数据分析及预测方法.以甘肃惠森药业电子商务平台"药材盈"采集的大数据为例,通过采用Hadoop集群并行处理中药材文本数据、RHadoop进行预处理并获取样本数据、R语言对样本数据建模,获得较为可靠的预测中药材市场价格的模型,对中药材市场价格的变化规律及影响因素进行分析和预测.采用线性模型和决策树模型对中药材大数据进行建模,并通过实验验证和比较得到预测中药材市场价格的最佳模型.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号