首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
基于现有网上论坛信息抽取的不足,提出一种面向属性的论坛自动抽取方法.该方法运用论坛概念模型(Ontology)自动构造包装器,较好地解决了现有的抽取方法准确性差、通用性不强的问题.试验结果表明提出的方法是有效的.  相似文献   

2.
基于关键词的搜索引擎满足了人们一定的需要,但由于其通用的性质,并不能满足用户的个性化需求,为此,设计并实现了一个基于示例的个性化Web信息自动获取系统.该系统采用了一种新的基于少量Web示例网页和语料库词频统计的特征抽取算法和过滤阈值设定方法.实验结果表明,较基于关键词的搜索引擎而言,该系统能充分考虑用户的兴趣偏好(示例),长期、主动地向用户提供更加准确的Web信息获取服务.  相似文献   

3.
信息获取已成为药商经营活动的重要组成部分和市场判断依据,网络大量非结构化、半结构化信息的出现为药商个性化服务提供了技术空间和实证依据.文章通过对个性化服务中文本挖掘的关键技术进行设计,并应用了中药材信息网站文本挖掘流程,把文本挖掘技术应用于中药材信息网站的用户兴趣获取实例中,实现用户兴趣的自动获取功能.  相似文献   

4.
分析了有关信息搜索的工具及其存在的一些问题,提出了一种基于概念的Web信息析取方法,它能自动地从网站中获取数据信息,并且能让用户通过数据库的查询范例来进入网站.该方法能有效地解决在特定的查询类型中所期望的信息问题.  相似文献   

5.
在网络购物过程中,网站信息过于繁杂,用户很难快速地获取感兴趣的信息.信息抽取可以在一定程度上解决这个问题.提出一种基于RDF的信息抽取方法,将网页信息转换为DOM树,计算最大相关度子树,抽取用户感兴趣的信息.实验结果表明,具有较好的信息抽取性能.  相似文献   

6.
鉴于电子商务网站推荐系统的需要,将用户兴趣分为长期兴趣和短暂兴趣,并提出一种基于长期兴趣和短暂兴趣的用户偏好表示法.利用web服务器数据库的数据,采用无监督学习方法,对用户注册信息进行挖掘,提取出用户长期兴趣.基于向量映射,对web服务器日志上的用户使用记录数据和内容数据进行分析,提取用户短暂兴趣.通过用户反馈信息修正"粗糙"用户偏好文档,使得用户偏好文档更新得以实现.最后,应用了实证案例验证了该方法的合理性和有效性.  相似文献   

7.
基于本体的数字图书馆信息过滤研究   总被引:4,自引:0,他引:4  
语义Web的概念正在成为计算机信息处理领域当前研究的热点之一 .本体 (Ontology)将在“语义Web”中起到至关重要的作用 ,它通过提供共享的并精确定义的术语源 ,将语法的互操作扩展到语义的互操作 .信息过滤目的在于依据用户兴趣 ,进行动态信息搜索和匹配以满足用户的需求 ,从而实现个性化服务 .本文提出了一种新的基于本体的数字图书馆信息过滤方法 ,它具有 3个显著的优点 :①采用了混合信息过滤模型 ,克服了基于内容和协作过滤的不足 ;②建立本体驱动的用户模板 ,解决了用户兴趣的获取问题 ;③信息内容采用本体来组织 ,实现语义级查询和高效的匹配机制  相似文献   

8.
基于样本实例的Web信息抽取   总被引:14,自引:1,他引:13  
主要研究了基于HTML文档的信息抽取,提出了一种基于样本实例的Web信息抽取的方法.用户首先选定样本页面和预先定义模式(基于O-R模型),然后对样本页面和其中的样本记录进行标记、学习,形成信息抽取规则,并存入知识库;利用知识库对其他同类页面自动抽取所需的信息,存入数据库中.本方法可用于Web查询,也可用于信息集成的包装器.  相似文献   

9.
由于缺乏足够的反映用户兴趣的知识,以及巨大的在线计算量,导致互联网上现有文章自动推荐系统普遍存在盲目性和低效性的问题.针对以上问题,提出了一种基于聚类和分类的个性化文章自动推荐系统,利用机器学习的方法隐式地获取用户模型,并根据用户模型为用户提供个性化的文章自动推荐服务.该系统包括离线用户模型及用户群获取子系统和在线个性化文章推荐子系统两大部分,前者对文章进行聚类形成聚类兴趣点,构建基于聚类兴趣点的用户模型,并根据用户兴趣聚类形成各兴趣点的用户群;后者对待推荐文章进行分类,搜索到其所属的兴趣点,向该兴趣点的用户群进行主动推荐.理论分析和实验结果表明,该系统能够显著提高有效性和在线响应速度.所述的设计思想和技术也适用于其它互联网个性化信息自动推荐系统.  相似文献   

10.
为了用户方便快速地使用Deep Web中的信息,对在线数据库中的内容进行获取是一种行之有效的方法.本文设计了一种基于领域本体的Deep Web数据库内容获取技术,利用训练数据库训练构建领域本体,通过领域本体中的有效查询项获得查询关键字集,对数据库内容进行查询,最终获得Deep Web内容.通过实验证明,该方法能育效地获...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号