首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 187 毫秒
1.
基于用户兴趣及术语间关系的查询扩展方法   总被引:1,自引:0,他引:1  
针对传统查询扩展方法无法根据不同用户的需求进行检索的不足,提出一种基于用户兴趣和术语间关系进行查询扩展的方法。通过对用户浏览的网页文档及得到的网页日志进行挖掘得到一系列代表用户兴趣的术语,根据与初始查询词存在同义关系的用户兴趣术语及其权重对初始查询词权重进行调整,利用兴趣术语中与初始查询词存在本体关联关系的术语对初始查询进行扩展。实验结果表明,该方法相对于传统查询扩展方法在一定程度上提高了信息检索的查全率和查准率。  相似文献   

2.
基于加权概念网络的用户兴趣建模   总被引:5,自引:0,他引:5  
提出了一种基于加权概念网络(WCN)的用户兴趣建模方法,该方法利用动态学习算法,挖掘蕴含在用户反馈文档中的概念及其概念关系,建立WCN的用户模型,从而捕捉和表述用户兴趣偏好.基于WCN用户兴趣模型,提出了检索提问个性化理解以及文档个性化重评价的实现方法.为了检验提出方法的建模性能,设计了信息过滤仿真试验.测试结果表明,WCN有较好的用户建模性能.  相似文献   

3.
基于用户查询日志的命名实体挖掘的目标是从用户查询日志中挖掘一组具有指定类别的命名实体。为解决已有用户查询日志实体挖掘研究工作中的种子实体不充分的问题,提出了一种基于二部图的半监督排序方法,利用实体之间的关系(实体共享查询模板)来改善实体排序效果。该方法首先基于候选实体和查询模板构建一个二部图,然后基于二部图将种子实体的类别相关性传播到其他候选实体,最后按照类别相关性得分对候选实体进行排序,并进一步给出方法中迭代过程的等价优化框架。实验结果表明本文提出的方法优于基准方法,具有较好的挖掘效果。  相似文献   

4.
Web日志挖掘是Web使用挖掘一个最重要研究领域,数据预处理是Web日志挖掘中的关键技术之一。论述了数据预处理各主要步骤的方法和技术,重点研究了用户识别和会话识别。  相似文献   

5.
目的提高扩展词与用户查询在语义层面上的关联,解决歧义扩展问题。方法基于差分进化算法的语义查询扩展技术先利用领域本体提供的领域背景知识来获取候选扩展词集,然后通过分析用户日志来获取用户检索偏好信息,最后利用差分进化算法确定同用户检索意图最相符的扩展词集。结果比起前沿的局部上下文分析方法,基于差分进化算法的语义查询扩展技术能够确定更高质量的扩展词集。结论利用用户日志和本体中概念间的语义关系作为背景数据来过滤无关的扩展词可以有效提高后续语义扩展过程的效率,差分进化算法能够有效排除同用户检索意图无关的词集并确定高质量的扩展词集。  相似文献   

6.
一种基于引用日志文件的启发式会话识别算法   总被引:1,自引:0,他引:1  
为了将服务器日志分割为多个独一无二的用户的一次访问序列,提出了一种基于引用日志文件的启发式会话识别算法,并给予很好的算法实现.  相似文献   

7.
当搜索日志存在查询词稀疏性和时效性问题时,基于搜索日志的查询扩展方法无法保证查询扩展的质量,无法满足具有时效性查询请求的需求.提出了基于搜索日志与局部上下文的查询扩展方法,通过发掘搜索日志中用户查询词和相关文档的关联关系,抽取查询扩展词,并用局部上下文从相关文档集中提取出频率较大,同时具有时效性的查询扩展词.通过对查询扩展词的查询性能和时效性的计算,该方法为原始查询补充更高质量的查询扩展词.实验结果表明,该方法能够有效地提升准确率和召回率,使原始查询获得更好的查询性能.  相似文献   

8.
Web日志挖掘中的数据预处理技术   总被引:5,自引:0,他引:5  
用户访问网站,Web日志中会记录下大量的用户访问信息,通过挖掘这些日志数据可以获得相关页面、相似用户群体和用户访问模式等信息,Web日志挖掘对于优化网站结构、提供个性化服务和构建智能化网站具有重要作用.数据预处理是保证Web日志挖掘质量的重要基础,预处理主要包括数据清洗、用户识别、会话识别、路径补充和结果评价等工作.概述了数据预处理技术,重点介绍了目前常用的会话划分算法和评价标准,并实现了一个数据预处理系统.  相似文献   

9.
陈红丽 《科学技术与工程》2012,12(8):1928-1930,1935
数据预处理在Web日志挖掘过程中起着至关重要的作用,直接影响日志挖掘的质量和结果。 文中分析了数据预处理的主要过程,并用站点首页结合动态时间阈值的方法对会话识别进行了改进。实验结果表明, 改进后的会话识别方法能更有效的识别出用户的真实会话。  相似文献   

10.
查询推荐是一种帮助搜索引擎更好的理解用户检索需求的方法.基于查询的上下文片段训练词汇和查询之间的语义关系,同时结合查询和URL的点击图以及查询中的序列行为构建Term-Query-URL异构信息网络,采用重启动随机游走(Random Walk with Restart,RWR)进行查询推荐.综合利用语义信息和日志信息,提高了稀疏查询的推荐效果.基于概率语言模型构造查询的词汇向量,可以为新的查询进行查询推荐.在大规模商业搜索引擎查询日志上的实验表明本文方法相比传统的查询推荐方法性能提升约为3%~10%.  相似文献   

11.
利用支持向量回归确定相关Web查询   总被引:1,自引:0,他引:1  
对用户输入的查询请求,如果搜索引擎系统能给出一个相关查询列表,将有助于用户进行查询修正,进而检索到用户所需要的信息.文中提出了一种利用支持向量回归确定相关Web查询的新方法.对一个给定的Web查询,首先从用户的使用记录中抽取候选查询的5个量化指标:被查询的次数、被查询的用户量、用户在反馈结果中的点击次数、与给定查询间的共有词项个数和点击相同网址(URL)的个数;然后用手工标记部分训练数据,进而建立支持向量回归模型,根据相关度的大小确定相关Web查询.实验结果表明该方法具有较高的准确度.  相似文献   

12.
目前互联网技术的研究热点是智能化的、个性化的服务,而传统的Web搜索排序算法和已有的个性化排序已经不能满足政府、企业等用户的信息查询需要.本文将研究核心定位到充分理解用户查询偏好上,提出了基于用户偏好的PageRank算法.文中利用用户互反馈技术修正查询关键词,利用语义相关性技术分析用户查询意图,理解用户偏好.改进的算法完善了搜索查询的可靠性依据,能够较好地挖掘用户的偏好主题,贴近用户的查询目的,提高搜索查询效率和用户满意度.  相似文献   

13.
查询系统是管理信息系统的重要组成部分,普通的查询方法只是针对某一具体的主题,查询结果以报表的形式显示给用户.本文讨论了一种PowerBuilder程序设计中通用查询模块的设计思路与实现方法,该模块可以灵活指定查询条件,实现对任意数据的查询,这对于提高MIS系统的开发效率具有重要意义.  相似文献   

14.
主要对XML路径表达式的优化、查询和过滤算法三个方面进行了研究.运用补路径和缩短路径方法对路径表达式进行优化.通过对路径表达式进行优化来提高查询速度的方法称为路径缩短策略.用简单的路径表达式来代替用户所建立的复杂度表达式的方法称作补路径.用Xpath语言对XML查询进行处理,并对Xpath表达式以及查询处理进行了研究,Xpath查询处理主要通过对XPE-Tree进行匹配以及两次路径连接运算来实现查询处理.XML的过滤系统通过路径表达式来进行模式和内容匹配,在用户信息输入系统之后,生成过滤引擎,过滤引擎与数据流进行匹配,输出用户感兴趣的信息,以此来完成过滤过程.  相似文献   

15.
0 IntroductionWitmhentth ef oerxp slhosairvineg gr ionwfotrhm oaft itohne iWsW aW k,eythe p rroeqblueirme-.When we deal withthe unprecedented amount of data,we areeasylost in browsing them. Thus , handling these data effi-ciently becomes more difficult than before.Consider the application domain publication retrieval ,which are abundant onthe Web and usually demandlongti meto generate the end-results through the query interfaces pro-vided by search engines .It oftenrequires three steps to de…  相似文献   

16.
利用局部分析法,提出一种基于词语之间同义关系的查询扩展方法.该方法利用原始查询术语实现初次查询,然后利用局部分析法得到查询术语在初次查询结果集中的同义词,并实现查询扩展.实验结果表明,该方法能有效提高检索性能.  相似文献   

17.
传统数据库系统用于需要持久稳固的数据存储和复杂查询的应用,然而近几年许多的应用证明这种数据模式和查询范例是不适合的,如传感器数据位置跟踪、工厂装配线管理、金融证券管理、Internet流量监控、Web使用日志、电话呼叫记录、和事务日志的在线分析等,在这些应用背景中信息按照数据值序列的形式自然产生,都需要及时地处理大规模的潜在快速的异步的数据流.本文回顾近来数据流管理系统领域的相关工作和流项目的研究情况;分析了连续查询处理的新需求和挑战;重点研究包括数据模式,系统结构,连续查询语言,调度方法,相关算法和查询评价等关键技术.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号