首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
通过分析用户的查询日志, 模拟用户与搜索引擎之间的交互过程, 提出一种基于查询加权的用户建模方法。首先, 对查询日志进行会话分割; 然后, 利用会话中用户查询出现的次数、持续时间及所点击的URL排名等行为信息, 计算查询权重; 最后, 采用兴趣投票的方式, 完成用户模型的构建。在AOL (美国在线)查询日志数据集上的测试结果表明, 基于查询加权的用户建模方法在用户兴趣预测上取得较好的效果。  相似文献   

2.
在分析、优化和整合Web表单结构的基础上,形式化地描述了表单;基于一种新型的本体构造方法,对表单建立了语义模型;这种模型可用于机器自动识别表单、准备数据和提交查询,也有助于获取查询结果的语义;最后举例说明了表单建模过程.实验证明这种建模方法是可行的,为自动查询动态Web内容奠定了基础.  相似文献   

3.
在线位置服务技术日益普及,用户能够很容易获得他们的地理位置信息.随之产生了各类有关空间关键字的查询,这些查询可以提供定位服务的基本查询功能.研究了基于位置的偏好查询处理技术,旨在为用户找到一个目的地,找到的结果应该满足指定的特性,并且靠近满足用户提出的偏好.同时,提出一种新颖的查询框架,该框架通过对IR-tree的节点扩展给出预计算信息表,根据扩展的IR-tree能够减少搜索空间并提出准确计算方法来有效地回答基于位置的偏好查询.在真实数据集上进行实验验证了提出方法的有效性.  相似文献   

4.
随着XM L逐渐成为In ternet数据表示与数据交换的标准,存储与查询XM L数据变得日益重要;面向对象的方法具有很强的建模能力,将面向对象的特征引入到XM L中来提高XM L语言的建模能力也变得非常重要;如何快速准确的存储和查询面向对象的XM L数据成为挑战性的课题.对面向对象的XM L数据的查询处理技术进行了研究,提出变量向导和查询数据仓的方法,提高了查询处理效率.  相似文献   

5.
查询推荐是一种提高用户搜索效率的重要工具,但是传统的推荐方法对于探索式搜索的推荐效果不好.针对此问题提出了一种新的面向探索式搜索过程的查询推荐方法,即根据用户搜索的行为模式,通过试探性查询重构和确认性查询重构两个过程,对探索式搜索过程进行建模,并根据影响探索式搜索过程的三种因素提出了一种排序算法,将确认性子查询中的查询推荐给用户.通过与传统推荐方法的对比实验验证了本模型及其推荐方法的有效性.  相似文献   

6.
随着移动社交网络的迅速发展,如何从海量带有时间属性和地理位置属性的短文本信息中快速查询到有效信息具有重要意义.社交网络环境下传统短文本查询算法忽略时间维度,并且在海量数据下无法满足用户快速响应的需求.针对以上问题,提出一种社交网络环境下并行短文本查询算法.提出的算法设计了基于MapReduce模型下的查询框架,该框架使用了基于滑动窗口下的多版本时空索引(MVSTR-tree),保证了查询过程中融合了时间和空间属性,实现了对海量数据高效查询的目标.最后,通过真实数据集的实验证明该算法能有效缩短查询时间.  相似文献   

7.
查询处理是现代关系型数据库管理系统(DBMS)中最重要的功能之一,主要包括查询优化和查询执行.然而查询处理的复杂性导致了测试的高成本,阻碍了开发过程中的快速迭代,并可能在生产环境中导致严重错误.为了更好地服务于DBMS查询处理功能的评测,采用模糊测试的方法生成基于主键约束的随机数据和完全有效的复杂分析型查询;构建约束优化,对查询中算子的精确基数进行高效计算,从而获得查询的正确结果;最后实现了完整的工具.通过对TiDB的不同版本进行了小规模的测试,结果表明可以有效地检测出TiDB不同版本的一些Bug.  相似文献   

8.
当搜索日志存在查询词稀疏性和时效性问题时,基于搜索日志的查询扩展方法无法保证查询扩展的质量,无法满足具有时效性查询请求的需求.提出了基于搜索日志与局部上下文的查询扩展方法,通过发掘搜索日志中用户查询词和相关文档的关联关系,抽取查询扩展词,并用局部上下文从相关文档集中提取出频率较大,同时具有时效性的查询扩展词.通过对查询扩展词的查询性能和时效性的计算,该方法为原始查询补充更高质量的查询扩展词.实验结果表明,该方法能够有效地提升准确率和召回率,使原始查询获得更好的查询性能.  相似文献   

9.
基于XML内容和结构的模糊查询   总被引:1,自引:0,他引:1  
用户在查询XML文档的时候经常有模糊的或者不精确的查询要求.为了解决用户的模糊查询意图,提出了一种基于XML内容和结构的模糊查询方法.以模糊集理论为基础,提出了利用模糊谓词实现XPath查询表达式的模糊扩展,采用模糊查询松弛方法,它可以产生更多满足用户查询要求的结果.在排序这些查询结果的时候,提出的打分方法使用一个扩展的向量空间模型,考虑了内容和结构的相关性,按照内容和结构的匹配情况打分,得分大于阈值的节点就是答案节点.最后,通过实验验证了所提方法的有效性.  相似文献   

10.
基于非一致性关系数据库的非聚集查询技术,发展普通的一致性查询应答的语义,提出非一致性数据库的范围语义,给出基于一致性查询范围的实际聚集查询重写方法,返回基于这种语义的聚集查询范围值.通过对初始分组属性和键属性聚集得到候选结果集,再过滤与初始分组属性值相冲突和不满足初始查询的元组.对于最小值,过滤掉可能不一致的元组,去掉可能值,得到一致性值;对于最大值,得到可能的最大候选值.实验基于TPC-H基准采用不同的参数进行研究.研究结果表明,聚集属性和投影属性数量、数据库以及初始查询的结果集对重写查询的负载有显著的影响,但非一致性数据比例和共享共同键值元组数的影响很小.尽管重写查询比初始查询的执行时间长,但是可以接受.  相似文献   

11.
0 IntroductionWitmhentth ef oerxp slhosairvineg gr ionwfotrhm oaft itohne iWsW aW k,eythe p rroeqblueirme-.When we deal withthe unprecedented amount of data,we areeasylost in browsing them. Thus , handling these data effi-ciently becomes more difficult than before.Consider the application domain publication retrieval ,which are abundant onthe Web and usually demandlongti meto generate the end-results through the query interfaces pro-vided by search engines .It oftenrequires three steps to de…  相似文献   

12.
一种基于事先测试的分布式数据库优化联接查询技术   总被引:3,自引:0,他引:3  
在分布式数据库系统中,查询优化是一极其重要的问题,其中联接查询的优化因其应用的广泛性而显得尤为关键.本文介绍了在分布式数据库系统中对联接查询的一般处理方法,详细论述了笔者提出的一种在分布式数据库中基于事先测试的优化联接查询技术,并进行了分析与总结.  相似文献   

13.
提出了一种多数据库系统的模式映射方法,并对水平映射、垂直映射、混合映射、相关映射和局部映射给出了一种统一的形式化描述.使用模式映射树存储和表达用于查询分解的全局模式以及全局模式到输出模式及局部模式的映射信息,使用查询树来表示多数据库查询的内部结构.通过合并全局查询树与模式映射树,给出了将全局查询转化为中间查询的全局查询分解方法.利用模式映射信息中的相关映射性质,给出了多数据库查询中全局连接的优化处理策略.  相似文献   

14.
提出一种定性地理信息检索方法, 用于地理信息的定性表达、语义匹配、推理和结果排序, 可以避免目前定量地理信息检索中语义信息丢失问题。采用命题逻辑方法综合表达查询和文档中的主题信息和地理语义信息, 将文档与查询的相关性度量分为主题相似度和地理相似度。前者通过命题关键词间加权本体距离获得。后者可进一步分为概念相似度和位置相似度, 分别基于地理本体和空间语义度量。由于信息的表达形式为命题和信息单元, 采用证据理论和模糊逻辑对上述子相关性度量进行统一建模。所提方法可以基于语义检索网页中的定性地理信息, 并对相关文档进行排序。这种检索和排序方法符合人类空间认知, 因此可以有效提高地理信息检索的效率。  相似文献   

15.
Area query processing is significant for various applications of wireless sensor networks since it can request information of particular areas in the monitored environment. Existing query processing techniques cannot solve area queries. Intuitively, centralized processing on Base Station can accomplish area queries via collecting information from all sensor nodes. However, this method is not suitable for wireless sensor networks with limited energy since a large amount of energy is wasted for reporting useless data. This motivates us to propose an energy-efficient in-network area query processing scheme. In our scheme, the monitored area is partitioned into grids, and a unique gray code number is used to represent a Grid ID (GID), which is also an effective way to describe an area. Furthermore, a reporting tree is constructed to process area merging and data aggregations. Based on the properties of GIDs, subareas can be merged easily and useless data can be discarded as early as possible to reduce energy consumption. For energy-efficiently answering continuous queries, we also design an incremental update method to continuously generate query results. In essence, all of these strategies are pivots to conserve energy consumption. With a thorough simulation study, it is shown that our scheme is effective and energy-efficient.  相似文献   

16.
隐私的泄露问题不仅包含用户提交的位置和查询数据,更是包含了其中隐藏的用户身份、兴趣爱好、社会习惯、行为模式等。对位置服务隐私保护的技术进行综述,介绍了位置服务的应用场景、位置隐私的攻击方法。对现有的隐私保护体系结构和保护技术进行整理归纳。对未来的研究进行了展望,并提出一种基于缓存的时空扰动方法和LBS隐私保护度量假设方案。  相似文献   

17.
随着全球移动定位设备的普及和网络通信技术的发展,催生出基于位置服务的应用(LBS)。享受LBS带来的便利服务的同时,用户的位置轨迹隐私保护受到严峻考验。现有的位置隐私保护方法大多针对用户单次查询设计,不能适用于连续查询;且匿名效果不佳。提出了一种采用中心服务器结构的假轨迹匿名方案,通过持续选择匿名区域内长时间所在的移动用户生成假位置点,构成虚拟轨迹的方式来混淆攻击者的判断,从而达到保护用户轨迹隐私的目的。仿真实验结果表明方法有效可行。  相似文献   

18.
应用聚簇索引的多连接查询优化方法   总被引:1,自引:0,他引:1  
多连接查询优化是提高数据库性能的关键问题之一.查询优化主要针对连接等一些具有较高执行代价的操作进行研究.在分布式查询优化中,应同时考虑本地处理代价和传输代价.提出了一种应用聚簇索引来优化多连接查询的方法,旨在减小查询的代价.分析对比证明该方法具有较好的效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号