首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
陈玉娥 《科技信息》2012,(30):55+57-55,57
本文首先从网页文档中抽取出关键词建立用户模型,然后从语义的角度出发,基于"知网"进行词语相似度计算,进而判定搜索引擎返回的网页与用户模型的相似度从而达到过滤信息的目的。实验表明,系统比传统的利用向量空间模型进行信息过滤具有更好的精度。  相似文献   

2.
基于本体语义的定题爬虫   总被引:3,自引:0,他引:3  
定题爬虫能迅速获取网络上特定主题的大量信息,对专业搜索引擎及数据挖掘应用都具有重大价值.针对目前通用的基于关键词主题过滤策略的不足,在概念聚集思想启发下,提出了基于本体语义的主题过滤策略.同时根据网页具有不同位置不同信息重要性的特点,提出了改进的加权特征项权值计算公式,实现基于语义的网页实时过滤.为进一步提高爬虫的工作效率提出链接相关度预测算法.对比实验表明此策略具有可行性.  相似文献   

3.
提出了一种基于多Agent的Web个性化信息检索系统的模型(WPIRS-MA),该模型利用多智能Agent技术,结合用户的关键词描述,挖掘用户潜在的兴趣和特征,在各Agent的协调下,完成信息检索、过滤和聚类.框架分析表明该模型具有良好的灵活性、智能型和扩展性.基于5个站点的Web文档测试分析结果表明,该模型可以保证良好的关键词集的正确率,用户查询满意度达到80%以上.  相似文献   

4.
归纳了抗中文主动干扰关键词过滤技术研究的基本情况,总结了国内外相关研究现状和技术水平,分析了传统信息过滤存在问题,最后给出了抗中文主动干扰关键词过滤的发展趋势预测.  相似文献   

5.
基于本体的信息过滤需求模型构造   总被引:1,自引:0,他引:1  
在信息过滤系统中,由于缺乏语义模型作为支撑,基于关键词的用户需求模型难于准确地反映出用户的真实需求,成为影响过滤性能的主要瓶颈.提出了以本体构造用户需求模型的方法:采用领域相关度和领域一致度组合方法来确定查询关键词在特定领域的重要程度,建立查询关键词到本体概念的映射,然后利用本体的概念及属性构造用户需求模型.这种基于本体的用户需求模型构造方法能提高过滤系统性能.  相似文献   

6.
信息过滤技术是当前研究的热点。本文先分析了向量空间模型和布尔逻辑模型及其它们的优缺点,在此基础上提出了基于语义和学习机制的信息过滤模型,该模型是对字项文档矩阵使用奇异值分解[1](Singular-Value Decomposition,SVD)的方法来实现信息过滤的,并详细分析了此模型的优缺点。  相似文献   

7.
提出一种加入时间因素的个性化信息过滤技术.在建立用户模型时,根据用户行为动态确定用户兴趣类别的数量并建立(调整)相应兴趣类别的特征向量.通过在表示用户兴趣类别的特征向量中添加时间因素,可以兼顾用户的短期和长期兴趣,跟踪用户的兴趣变迁.在信息过滤时,首先计算文档与用户兴趣类别的相似度,并根据时间参数调整最终得分.本系统每秒钟能学习文档267篇,为402篇文档评分;在召回率为70%时,精确率为57%.  相似文献   

8.
庞雅丽  王彩芬 《甘肃科技》2007,23(3):124-126,171
本文分析了个性化信息过滤及其实现系统的体系结构,讨论了用户需求文档及其应用的机制,分析了当前主要的过滤算法,并总结了国内外信息过滤的研究进展情况,提出了个性化信息过滤研究的重点问题。  相似文献   

9.
Open Bookmark——基于Agent的信息过滤系统   总被引:11,自引:0,他引:11  
为解决搜索引擎等传统网络信息服务系统的不足 ,提出了一个基于 Agent的信息过滤系统—— OpenBookm ark,它提供了一个开放性的信息组织环境。 OpenBookm ark使用向量空间法和社会过滤两种信息过滤方式帮助用户获取有用信息。向量空间法采用关键词向量描述用户的信息需求 ,通过计算信息之间的相似度 ,从信息数据库中提取符合用户兴趣的信息推荐给用户 ,并根据用户的反馈信息调整关键词向量。系统采用信息 Agent获取用户的信息需求 ,以实现个性化的主动信息服务 ,Agent之间采用 Agent通信语言进行信息协作 ,实现社会过滤。在开放式信息服务系统中使用信息过滤的方法 ,可以帮助用户有效地获取信息。  相似文献   

10.
针对传统的透明加密驱动技术所带来的文件损坏、应用程序兼容性差、与杀毒软件等类似技术存在严重冲突等问题,提出一种基于分层文件系统的文档透明加解密方案,通过使用多层次的文件过滤驱动,实现对文件的多重过滤功能,保证文件加密过程中的高效率,高稳定性,高兼容性.  相似文献   

11.
分析了电子邮件过滤系统的实现方案及关键技术,实现了一种基于内容和地址的电子邮件实时过滤系统.系统利用中文文档信息处理中的文档特征向量提取技术,作为邮件过滤的依据。系统运行在Linux或WindowsNT/2000平台上。经过实际运行测试,证明系统性能稳定,达到了预期设计目标。  相似文献   

12.
一种基于内容的信息过滤改进模型   总被引:10,自引:0,他引:10  
根据过滤系统的不同过滤目的,将信息过滤分为两类:(1)基于满足用户信息需求的用户兴趣过滤;(2)基于保障数据安全和社会安全的安全过滤.在详细分析了这两类信息过滤的异同之后,指出了安全过滤研究的特殊性及其主要研究内容.在现有用户兴趣过滤系统模型的基础上,提出了一个基于内容的信息过滤模型,并对模型中新增模块进行了试验.研究结果表明,新增模块能够很好地实现基于内容过滤系统的高精度,证明了该过滤模型具有一定的实用价值.  相似文献   

13.
为快速有效地过滤不良网页以保障校园网信息安全,创造性地提出了一个基于字频统计和数据挖掘技术的不良网页过滤模式,通过自适应样本库构建不良类类别特征字库,并以此为基础构建智能化的不良类类别模式,用以实现不良网页的过滤.实验表明,该模式能以较快的速度和较高的准确率过滤测试文档集中的不良网页.  相似文献   

14.
为快速有效地过滤不良网页以保障校园网信息安全,创造性地提出了一个基于字频统计和数据挖掘技术的不良网页过滤模式,通过自适应样本库构建不良类类别特征字库,并以此为基础构建智能化的不良类类别模式,用以实现不良网页的过滤.实验表明,该模式能以较快的速度和较高的准确率过滤测试文档集中的不良网页.  相似文献   

15.
个性化Web推荐系统是利用用户的浏览行为定制符合用户结构和内容的过程。在综合应用协作过滤和内容过滤方法的基础上,通过对网站网页关键词的评估,提出了一种新的个性化Web推荐算法,研究了基于网页关键词的个性化模型,网站页面中关键词的权重计算,基于协作过滤的新用户推荐,基于内容过滤的再次推荐方法,以及基于用户群的用户兴趣调整方法。实验证明,本算法能够以较高的效率对用户进行网页推荐。  相似文献   

16.
信息过滤是文本挖掘领域的重要研究内容之一.针对互动型网络媒体信息(如BBS),提出一种新的信息过滤算法,该算法主要从特征提取和分类器构造两方面对Bayesian方法进行改进.在对不良信息的特征提取过程中,根据网络论坛的特征,在计算中文不良信息特征项的权重时,根据关键词出现的位置、次数以及词长等建立一个特征评估函数,并用它来替换TF-IDF公式中的TF项;同时,考虑到网络论坛中的良性信息与不良信息之间的不平衡分布,采用一种不对称的学习策略来设计Bayesian分类器.实验结果及对比分析表明,该算法具有较高的过滤准确率.  相似文献   

17.
网页搜索结果的多样化已经逐渐成为提高网页搜索效率和用户满意度的一个重要因素.文中将多样化问题形式化为信息面覆盖率的最大化问题,提出了一种基于关键词的网页搜索结果多样化方法KDM.该方法首先从与用户查询相关的结果文档中提取出可以描述结果文档所蕴含的信息面的关键词,然后根据关键词的同现性以及关键词对文档的描述能力,计算出结...  相似文献   

18.
探讨了基于文件过滤驱动的文档透明加解密系统的原理,提出了基于证书体系的文档访问权限控制系统实现的方法。对实现文档透明加解密系统中所使用的一些关键技术进行了阐述,特别是基于证书体系的文档访问权限控制技术能够完整解决加密文档的权限访问控制需要。还对安全进程的识别以及对文件加密客户端的安全保护问题提出了规划。  相似文献   

19.
近年来,由于科技突飞猛进的发展和互联网的迅速崛起,不良信息的过滤成为信息过滤的一个重要方向,而信息过滤的关键技术是用户模板的获取.本文对遗传算法作了改进,并将其用于优化用户模板,使用户模板具有关键词自动扩充和自适应能力,进而能有效地进行过滤,提高过滤质量.  相似文献   

20.
在神经生成式摘要任务中,由于输入文档与参考摘要之间不存在显式的对齐关系,通常会导致重复生成相同单词的问题以及生成的摘要与输入文档语义不相关、准确性低的问题.为更好解决该问题,提出了混合过滤编码网络(HFEN)并在HFEN中集成混合过滤编码机制(HFEM)、注意力机制、指针生成器.HFEM分为管道过滤编码机制(PFEM)...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号