共查询到10条相似文献,搜索用时 125 毫秒
1.
针对垃圾邮件、不良网页和某些即时消息的威胁,本文以建立一个高效、智能的内容过滤防火墙为目标,提出一个集过滤与监控于一体的智能内容过滤防火墙模型,并依托该模型,实现了一个原型系统。该系统模型具有良好的结构,易于扩展,设计并实现的智能内容过滤系统具有友好的用户交互界面,良好的过滤效果,该系统的研究有助于对内容安全产品的开发,可以有效保障局域网内的内容安全。 相似文献
2.
主题蜘蛛的设计与实现 总被引:1,自引:0,他引:1
针对多媒体资源在网上的分布特点,采用链接类型过滤、网页内容过滤、链接内容过滤三层过滤和临时页面存储、目标页面存储、中间链接存储、更新存储四层存储机制,设计并实现了一个对包含多媒体资源(音频、视频和Flash动画)的网页进行搜集的主题蜘蛛.实验结果显示,该主题蜘蛛能有效提高查准率. 相似文献
3.
4.
基于MapReduce的网络爬虫设计与实现 《山东科学》2015,28(2):101-107
针对单机爬虫效率低、可扩展性差等问题,本文设计并实现了一种基于MapReduce的网络爬虫系统。该系统首先采用HDFS和HBase对网页信息进行存储管理,基于行块分布函数的方法进行网页信息抽取;然后通过URL和网页信息相似度分析相结合的去重策略,采用Simhash算法对抓取的网页信息进行相似度度量。实验结果表明,该系统具有良好的性能和可扩展性,较单机爬虫相比平均抓取速度提高了4.8倍。 相似文献
5.
针对焦炉集气管压力具有多变量、耦合、时变性等特点,设计焦炉集气管压力增量式在线子空间多变量预测控制策略.在增量式子空间预测控制的基础上,引入滚动窗口子空间辨识方法,设计子空间预估器模型的更新策略,实现了在线子空间自适应预测控制.应用在线子空间辨识方法对焦炉集气系统现场数据进行辨识,取得了较好的预测精度;利用子空间预估器模型进一步建立焦炉集气系统的状态空间模型,在考虑输入约束、模型时变和干扰的情况下,该模型表现出了很好的控制精度和性能. 相似文献
6.
基于网页分块技术主题爬行器的实现 总被引:1,自引:0,他引:1
针对目前通用搜索引擎搜索到的结果过多、 与主题相关性不强的现状, 提出一种基于网页分块技术的主题爬行器实现方法, 并实现了一个原型系统Crawler1. 实验结果表明, 本系统性能较好, 所爬网页的相关度在55%以上. 相似文献
7.
近似集动态更新方法的性能评测与规则获取 总被引:1,自引:1,他引:0
对属性集变化时特性关系下粗糙集扩展模型中近似集动态更新的方法进行性能测试,验证了该方法的有效性和适用性;并依此方法设计了一个伪增量规则提取的系统,可以直接用来为决策服务. 相似文献
8.
增量学习是处理数据流的有效方式。文中针对已有增量分类算法只是作用于小规模数据集或者在集中式环境下进行的不足,提出了一种基于Hadoop云计算平台的增量分类模型,以解决大规模数据集的增量分类。该增量分类模型主要基于选择性集成学习思想,设计相应Map函数对不同时刻的增量样本块进行学习,以及设计Re-duce函数对不同时刻的分类器进行选择性集成以实现云计算平台上的增量学习。仿真实验表明该方法具有更好的性能,且能较好地解决数据流中的概念漂移问题。 相似文献
9.
Web信息抽取与语义检索框架 总被引:1,自引:1,他引:0
提出了一种Web信息抽取与语义检索框架,采用定制本体模型,针对Web网页特点设计了抽取与语义标引策略,并在检索过程中引入语义推理机制,从而改善了信息检索的效果.最后介绍了基于Jena实现的该框架的原型系统. 相似文献
10.
通过对热轧动态设定型AGC控制系统模型进行理论分析,针对工程实际提出了一种基于μ综合的鲁棒控制方法.当系统中存在轧机刚度摄动时,热轧动态设定型AGC控制仍能实现期望的控制性能.通过引入表征系统性能的虚拟块,应用主环定理将动态设定型AGC系统在模型摄动下设计满足性能要求的控制器问题转换为广义系统的鲁棒稳定性问题,实现了系统鲁棒性能.它克服了使用H∞方法解决该问题的鲁棒性能缺点,其设计目标真实反映控制目标,方法更加有效.依据现场数据的仿真实验表明,基于μ综合的鲁棒控制方法比H∞方法具有更好的鲁棒性能. 相似文献