首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 734 毫秒
1.
可在线增量自学习的聚焦爬行方法   总被引:9,自引:0,他引:9  
将Web爬行看作执行序列动作的过程,结合改进的快速Q学习和半监督贝叶斯分类器,提出一种新的具有在线增量自学习能力的聚焦爬行方法.该方法从获取的页面中抽取特征文本,根据特征文本评估页面的主题相关性,预测链接的Q值,然后基于Q值过滤无关链接.当得到主题相关页面时产生回报,将回报沿链接链路反馈,更新链路上所有链接的Q值,并选择相应的特征文本作为训练样本,增量地改善主题评估器和Q值预测器.实验结果表明,该方法具有很快的自学习能力,获取的页面数目和精度均优于离线聚焦爬行方法,更符合Web资源发现的要求.  相似文献   

2.
提出了一种由遗传算法和改进互信息公式相结合的特征选择方法.将遗传算法中的特征评价函数换为改进互信息公式来对特征进行选择,结合了过滤式和封装式这2种特征选择方法的优点.实验部分采用另外2种特征选择算法与本文所提方法分别进行特征选择,将这3种方法所得到的特征子集用于概率神经网络、BP神经网络分类器上,通过比较对应的分类精度,检验各种特征选择方法的效果. 实验结果显示,所提出的特征选择方法能更为有效的实现特征选择,所取得的特征子集具有更好的泛化特性.  相似文献   

3.
利用低码率视频压缩标准(例如H.261、H.263)编码的视频数据在互联网上传输时,丢包将导致图像质量急剧恶化,文中建议了一种新的错误掩盖方法以弥补丢包对图像质量的影响。该方法针对每一个丢失宏块,根据其相邻区域的运动特征自适应地选择时域掩盖算法和空域掩盖算法,从而弥补了单纯使用一类错误掩盖法的缺点,与其他错误掩盖方法的RSNR值比较,该方法能够达到更好的图像质量,适应于视频会议和远程教育等实时应用的要求。  相似文献   

4.
采用密闭微波方法快速消解煤、煤灰试样中的汞,并使用汞还原原子荧光光谱法进行测定.通过大量实验,比较了不同的酸体系及微波消解过程.其中煤样中汞的测定,选择体系为V2O5-HNO3-H2SO4-H2O2.灰样中汞的测定,选择体系为HNO3-HCl-HBO3.该方法能有效地将样品中的汞全部溶出,消化时间缩短至1h以内,并保证较低的分析空白,方法准确度经标准参考物质及加标回收实验验证,结果令人满意.  相似文献   

5.
针对在复杂背景和部分遮挡情况下提取面部特征轮廓的困难,提出了一种基于统计模型的随机方法.该方法将面部特征轮廓作为动态随机过程的状态序列,并应用统计方法建立人脸整体形状模型和特征形状模型,分别构造面部特征间和面部特征内控制点样本的预测方程,最后利用序列蒙特卡洛方法估计随机状态.该方法给出了面部特征提取的随机描述,打破了确定性方法对单高斯分布和轮廓形状线性变化的依赖性,实现了轮廓的准确可靠提取.对100幅正面人脸图像的实验结果表明,轮廓定位相对误差仅为2.7%.对标准人脸检测数据库中传统算法很难处理的复杂背景和部分遮挡情况,该方法能够正确定位面部特征轮廓.  相似文献   

6.
珍珠水解液中钙离子含量的离子选择电极测定方法   总被引:1,自引:0,他引:1  
用离子选择电极法分别对标准溶液中钙离子含量,电极检测性能及pH值对离子选择电极的影响等进行了一系列测定和讨论,提出了离子选择电极测定珍珠水解液中钙离子含量的方法.同时将离子选择电极法和原子吸收法测定样品的结果加以了比较.该方法所用仪器易普及,适用于中小型企业进行产品的测试.  相似文献   

7.
提出了一种改进的人工免疫系统算法——逐级反向选择算法,与Forrest提出的反向选择算法比较,在探测子的生成效率上有了本质性的提高.该算法将反向选择过程和克隆选择过程有机地结合在一起.将逐级反向选择算法用于具体的入侵检测,检测效果有明显的提高。  相似文献   

8.
张云鹏  盖强 《应用科技》2011,(7):26-28,34
为了研究滚动轴承信号的非平稳特征,应用时频分析技术是一种较好的选择.研究了S变换,该方法是将短时傅里叶变换同小波变换结合起来发展的一种新算法.对多种时频分析方法进行了比较,得出S变换优于其他方法的一些特点,提出基于S变换的滚动轴承信号瞬态特征检测方法.结果表明,S变换能够以较高时频分辨率表示轴承振动中的非平稳特征,能反映出信号时频谱真实的物理意义,并且计算速度快.诊断结果验证了该方法可以用于滚动轴承的故障诊断.  相似文献   

9.
针对红外电厂目标识别问题,提出了基于贝叶斯数据融合的多尺度目标识别方法.该方法研究了前视成像末制导过程中图像目标尺度变化引起的视点角度和特征尺度变化规律,建立了分层次的时空特征模型,根据显著性选取目标特征,采用贝叶斯网络把不同尺度下的显著性特征进行融合,得到正确的识别结果.实验表明,该方法能将多尺度目标的不精确、不完整的特征进行融合处理,从而完成了目标的可靠识别.  相似文献   

10.
人耳图像的自动识别是一种新的生物特征识别技术.将主元分析法(PCA)应用于人耳图像识别,分别应用BP神经网络和最近邻域法进行分类识别,给出了具体的网络设计与性能比较分析.实验结果表明,应用PCA方法提取人耳图像特征,选择合适的分类器和网络结构,可以取得满意的识别效果.  相似文献   

11.
针对特征选择过程中特征评价指标单一性的问题, 基于集成学习中的极端梯度提升算法, 提出一种新的特征选择算法. 该算法首先应用极端梯度提升算法中构建集成树模型的指标作为特征选择的特征重要性度量指标, 然后利用一种新的双向搜索策略, 权衡了多种特征重要性对结果的影响, 并优化了评价过程的效率. 通过11个不同维度的标准数据集进行测试, 实验结果表明, 该算法能增加特征子集的多样性, 加快特征选择的速度, 并在中维和低维数据集上均具有较高的计算效率, 且能处理高维数据集.  相似文献   

12.
在数据流分类学习过程中,类不平衡和概念漂移是两大挑战问题.在分析传统特征选择算法和代价敏感学习方法的基础上,将代价敏感学习算法的思想引入特征选择算法中,设计并实现了一种基于代价敏感的Relief F剪枝的数据流分类算法,不仅能删除冗余的特征,而且适应动态变化的数据流环境.与经典的算法进行分析比较,结果表明所提算法可显著提升分类效果.  相似文献   

13.
针对机器学习聚类模型在特征选择时存在的问题,首先,对特征选择在聚类模型中的适用性进行分析并对其进行调整和改进.然后,基于R语言中的递归特征消除(RFE)特征选择方法和Boruta特征选择方法进行特征选择算法设计.最后,应用聚类内部有效性指标,对在线品牌忠诚度聚类模型优化结果进行分析,进而对特征选择方法进行比较研究.结果表明:Boruta特征选择方法更具优势.  相似文献   

14.
集成学习中特征选择技术   总被引:1,自引:0,他引:1  
集成学习和特征选择是当前机器学习领域中的研究热点.集成学习通过重复采样可产生个体学习器之间差异度,从而提高个体学习器的泛化能力,特征选择应用到集成学习可进一步提高集成学习技术的效果,该研究有3个方面:数据子集的特征选择、个体学习器的选择和多任务学习.该文对近几年集成学习中特征选择技术的研究进行回顾,尤其对以上3个方面的研究分别进行总结,提出一些共性的技术指导以后的研究.  相似文献   

15.
基于元启发式算法--乌鸦搜索算法(CrSA), 提出一种改进的基于乌鸦搜索算法的特征选择算法(IFSCrSA), 以解决目前特征选择问题中存在的不足. 通过与传统的机器学习特征选择算法和基于进化计算的特征选择算法进行比较, 结果表明, IFSCrSA能在数据集中选择辨识度较强的特征, 不仅大幅度降低了特征子集的规模, 而且提高了分类准确率.  相似文献   

16.
基于元启发式算法--乌鸦搜索算法(CrSA), 提出一种改进的基于乌鸦搜索算法的特征选择算法(IFSCrSA), 以解决目前特征选择问题中存在的不足. 通过与传统的机器学习特征选择算法和基于进化计算的特征选择算法进行比较, 结果表明, IFSCrSA能在数据集中选择辨识度较强的特征, 不仅大幅度降低了特征子集的规模, 而且提高了分类准确率.  相似文献   

17.
特性选择是文本分类、机器学习以及模式识别领域的重要问题之一.特征选择能在保证数据完整性的情况下减少高维数据的特征维数,同时提高分类的精度.以往提出的基于同义词词林的特征选择方法虽然能有效避免提取出的特征值在概念上的重复性,但并未考虑到权值最优的特征向量构成的子集可能并非是最优的.为了解决此问题,结合同义词和遗传算法,提出了一种新的基于同义词词林的文本特征选择方法.该方法首先对特征词进行同义词过滤、合并,在降低特征向量维度的同时避免了同义词带来的影响.然后采用改进的遗传算法选出具有较好适应度值的特征向量.实验结果表明,这种方法较之以往提出的方法,在保证特征选择准确率的基础上能明显地减小特征向量的维度.  相似文献   

18.
基于路径和基于知识表示的推理是当前知识图谱领域两大主流推理方法,二者的融合算法可以提高知识推理的准确率,但是依旧存在表示学习的时候效率低下、预测准确率低、模型过拟合等若干问题.本文方法针对这些问题提出了基于路径选择的表示学习方法.对路径特征信息进行进一步的过滤和筛选,保留关键路径,在路径信息和知识表示的结合过程中使用平衡参数对缺失路径信息的三元组进行处理.使用公开数据集对模型进行测试,实验表明模型可以有效提高泛化能力和准确率.   相似文献   

19.
基于规则学习的文本分类算法RIPPER具有易理解、易优化、高效率等特点,但是当规则所涉及的特征项很多的时候,上述优点不复存在。基于层次的规则学习算法hRIPPER采用了层次架构对RIPPER进行了改进,但其对特征项的过滤仍然有限。针对RIPPER,hRIPPER在规则学习过程中出现的问题,对规则学习的分类算法进行改进,提出了一种改进的基于规则学习的文本分类算法iRIPPER,在规则学习的同时进一步过滤噪音特征项。实验证明,该方法不但有效地提取了特征项,生成较少的规则,提高了算法的准确率和召回率,而且缩短了生成规则的时间,从而改进了规则学习分类算法的性能。  相似文献   

20.
电力系统暂态稳定性的破坏可以对电力系统的安全稳定运行产生严重冲击,准确、快速地暂稳评估方法能够提高电力系统的安全防御能力。极限学习机由于其速度快、泛化性能好被应用到电力系统暂态稳定评估中。为了提高极限学习机的评估性能,利用基于差分进化算法的优化方法和序列浮动后向特征选择算法对极限学习机暂态稳定评估性能进行提升。首先对输入特征通过主元分析降维并利用序列浮动后向算法进行特征选择,再将最优特征集输入差分进化极限学习机进行暂态稳定评估,最后在新英格兰10机39节点系统中进行验证分析,结果表明,所提模型与其他极限学习机模型相比,大大提升了其在暂态稳定分类评估中的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号